일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- ai관련 직업
- 데이터 엔지니어
- 파이썬오류
- 학생 성적 예측
- 데이터엔지니어링배우기
- 데이터 분석가
- 머신러닝 회귀 모델
- kaggle 프로젝트
- 데이터리안월간웨비나
- 파이썬기초
- 데이터분석기법
- 데이터분석
- 데이터직무
- 판다스
- 회귀분석 프로젝트
- 데이터엔지니어
- ridge 회귀
- 데이터분석가
- vader감정분석
- 데이터엔지니어링
- 데이터엔지니어링시작하기
- ml 실전 프로젝트
- 파이썬
- 데이터사이언티스트
- 데이터리안웨비나
- Growth_Hacking
- Python
- 데이터리안
- 서비스분석기법
- python 데이터 분석
- Today
- Total
데이터 분석가 Damla's blog
[파이썬]내가 가진 파일의 정보 확인용 코드 .info, .dtypes 본문
기본적으로 내가 가진 파일의 정보를 알고 싶을 때, 아래 2개의 코드를 사용한다.
df.info()
df.dtypes
1. df.info
info를 사용해서 값을 불러오면 각 컬럼의 이름과 행의 수 그리고 null값 여부를 확인할 수 있다.
사용용도 : 보유한 데이터셋에 null이 있는지 (결측치가 있는지) 확인할때 주로 사용
혹은 각 컬럼명 혹은 컬럼의 순서 등을 한눈에 확인할때 사용하곤 한다.
가장 기본적인 코드 임으로 반드시 알고 있을 것!
2. df.dtypes
각 컬럼 값이 숫자인지 object(숫자가 아닌 객체)인지 float인지 등과 같은 형식을 알려준다
사용용도 : 각 컬럼의 형식 string, integer, float, datetime 등을 알 수 있다.
각 컬럼의 형식이 무엇인지에 따라서 더하기 빼기와 같은 사칙연산을 통해 기대하는 값을 얻을 수 있기 때문에
보유한 데이터의 정체 처리 전 확임 목적에서 해당 코드를 사용할 수 있다
+ 특정 컬럼의 형식만 알고 싶은 경우!
df['알고 싶은 컬럼명'].dtypes
++가지고 있는 컬럼의 형식을 바꾸고 싶을 때
# 특정 컬럼의 형식이 숫자가 아닐때, 숫자로 바꾸고 싶다면
df['columns_name'] = pd.to_numeric(df['columns_name'], errors='coerce')
# 특정 컬럼의 형식이 날짜 형식이 아닐때, 바꾸고 싶다면
df['columns_name_datetime'] = pd.to_datetime(df['columns_name_datetime'], errors='coerce')
* 끝의 errors = 'coerce'는 형식을 바꾸고자 하는 컬럼의 값일 변환할수 없거나 값이 없을 때 해당 칸을 null로 치환하는 코드 이다.
'파이썬(Python) > Basic & Data analyze' 카테고리의 다른 글
[파이썬] 리스트, 튜플, 딕셔너리 특징 정리 (0) | 2025.01.19 |
---|---|
[파이썬] sort_value (0) | 2023.01.01 |
[Pandas] 판다스 데이터프레임 (0) | 2023.01.01 |
[파이썬] 판다스 apply, groupby 코드 설명 (0) | 2022.12.28 |
[파이썬] 인덱싱과 슬라이싱 (0) | 2022.12.11 |