일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 |
- vader감정분석
- ridge 회귀
- kaggle 프로젝트
- 학생 성적 예측
- 데이터엔지니어링
- 파이썬
- 머신러닝 회귀 모델
- ai관련 직업
- 판다스
- 블로그성장일기
- Python
- 데이터분석가
- 데이터분석
- 데이터직무
- 블로그성장글
- 데이터 엔지니어
- 누적조회수1만명
- python 데이터 분석
- 데이터엔지니어링시작하기
- 데이터 분석가
- ml 실전 프로젝트
- 데이터리안웨비나
- 파이썬기초
- 데이터리안
- 데이터엔지니어
- 데이터엔지니어링배우기
- 회귀분석 프로젝트
- 데이터사이언티스트
- 데이터리안월간웨비나
- 파이썬오류
- Today
- Total
목록Python (4)
데이터 분석가 Damla's blog

파이썬을 하다보면 가장 기초로 만나게되는 친구들이 리스트, 튜플, 딕셔너리이다. 각각의 정의와 특징, 생성법을 아주 간단하게 작성해 보려고 한다. 작성하는 목적은 나중에 내가 잊었을 때 복기 하기위함이다. 1. List (리스트)생성법 : list_name = [1,2,4,"a","b"]생성할 리스트명 = 대괄호 (Square Brackets)으로 그 안의 데이터를 포함한다.2. tuple (튜플)생성법 : tuple_name = (1,2,6,7,8,"a","E")생성할 튜플명 = 소괄호(Round Brackets)으로 그안의 데이터를 포함한다.[잠깐!] 그렇다면 튜플과 리스트는 무엇이 다른 것일까?리스트는 다양한 파이썬 내장함수들(.isupper, .replace., .capitalize .etc)을 ..
기본적으로 내가 가진 파일의 정보를 알고 싶을 때, 아래 2개의 코드를 사용한다.df.info()df.dtypes 1. df.info info를 사용해서 값을 불러오면 각 컬럼의 이름과 행의 수 그리고 null값 여부를 확인할 수 있다. 사용용도 : 보유한 데이터셋에 null이 있는지 (결측치가 있는지) 확인할때 주로 사용 혹은 각 컬럼명 혹은 컬럼의 순서 등을 한눈에 확인할때 사용하곤 한다. 가장 기본적인 코드 임으로 반드시 알고 있을 것! 2. df.dtypes 각 컬럼 값이 숫자인지 object(숫자가 아닌 객체)인지 float인지 등과 같은 형식을 알려준다 사용용도 : 각 컬럼의 형식 string, int..

- apply 이란?함수를 적용하기 위해서 쓰는 함수로, 데이터프레임이나 시리즈에 바로 적용시킬수 있는 pandas에 없는 다른 함수를 적용할 때 (ex. 파이썬함수) apply가 필요하다 예를 들어 아래와 같은 문제를 해결할 떄 사용할 수 있다.Q) 역순으로 배역해도 똑같은 단어가 되는 5글자 이상의 단어를 맞추어라python함수 len : 문자열이 글자수를 리턴해주는 함수df["글자수'] = df["답안'].apply(len)코딩을 하면 함수를 만들수 있다.내가 만든 함수를 적용할때도 apply를 사용한다1. apply를 왜쓰는지 이해한다2. 데이터프레임과 시리즈에서 apply의 용업의 차이를 이해한다3. 사용자정의 함수를 쓸수 있게된다 df3.info() : 데이터프레임의 속성을 확인하기 - 참..

데이터프레임은 아래와 같은 형태로 구성된 표를 말한다.index는 열에 있는 데이터를 말한다. 라벨 각 컬럼과 인덱스명을 말한다. !pip install pandasimport pandas as pd*함수가 아니면 괄호를 넣지 않아도 된다.df1.indexdf1.columndf1.values 가 numpy array 이다.---df1.sum() 합계df1.mean() 평균 ---출처엑셀투 파이선_파이썬 데이터프레임이란?https://www.youtube.com/watch?v=SVjKsvvhWlQ&t=25s