일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- python 데이터 분석
- Python
- 블로그성장일기
- 데이터엔지니어
- 회귀분석 프로젝트
- ml 실전 프로젝트
- 데이터엔지니어링배우기
- 데이터엔지니어링
- 데이터사이언티스트
- 학생 성적 예측
- 데이터분석가
- kaggle 프로젝트
- 데이터리안웨비나
- ridge 회귀
- 데이터엔지니어링시작하기
- 데이터직무
- 판다스
- 데이터리안
- 데이터분석
- vader감정분석
- 파이썬오류
- 누적조회수1만명
- 데이터 분석가
- 데이터 엔지니어
- 파이썬
- ai관련 직업
- 블로그성장글
- 파이썬기초
- 데이터리안월간웨비나
- 머신러닝 회귀 모델
- Today
- Total
목록판다스 (2)
데이터 분석가 Damla's blog

판다스 데이터프레임은 Dataframe = 2차원표와 Series = 1차원표를 다루는 라이브러리이다!열이 2개 이상일경우 데이터프레임이라고 칭한다파이썬에서만 2차원,1차원 표를 다룰 수 있는 것은 아니고 Numpy에서도 다룰 수 있다. 행 = index열 = colums하나의 데이터가 있고 그 데이터가 무엇이 있는지 알려주는 것이 Label이다.넘파이는 1차원 왜 고차원도 다룰 수 있음.그런데 판다스가 필요한 이유? 라벨을 가지고 있기 때문 -> 라벨이 있어서 더 빠르게 정보를 찾고 계산을 할 수 있다. 딕셔너리 구조가 더 편할때가 있고 키값을 이용할 수 있어서 데이터프레임형식의 라이브러리를 사용하는 것!데이터 살펴보는 명령어 또는 함수df1 = 데이터프레임 출력S1 = 첫번째 열을 시리즈 형식으로 출..

Step1 : df["column name"] 지정하기 Step2 : df["column name"] = 값으로 열을 수정하거나 생성한다Step3 : drop으로 열을 삭제한다.*drop으로 행과 열 모두 삭제가능하다데이터 프레임은 2차원의 표이고 시리즈는 1차원의 표이다- 데이터 프레임 형식- 시리즈 형식시리즈에는 컬럼이 없음 인덱스(값)만 있음df1["new column"] = 1df1컬럼을 새로 추가 하고 그 값을 1로 지정하면 새로 생성된다.기존에 동일한 이름의 컬럼이 있었다면 그 컬럼의 값이 1로 바뀐다axis = 1 축이 1 = 열axis = 0 축이 0 = 행 - 여러개의 행을 삭제하고 싶다면 리스트 형으로 넣으면 된다.df1.drop(["c1", "c2"], axis = 1)중요! df1의..