일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 파이썬기초
- python 데이터 분석
- 데이터 엔지니어
- 데이터엔지니어
- kaggle 프로젝트
- 블로그성장일기
- 블로그성장글
- 머신러닝 회귀 모델
- 데이터분석가
- 데이터엔지니어링
- 파이썬
- 데이터리안웨비나
- ai관련 직업
- 데이터엔지니어링시작하기
- 데이터분석
- 데이터리안
- ridge 회귀
- 누적조회수1만명
- 데이터사이언티스트
- 데이터리안월간웨비나
- ml 실전 프로젝트
- 판다스
- 데이터엔지니어링배우기
- 데이터직무
- 데이터 분석가
- vader감정분석
- 파이썬오류
- 회귀분석 프로젝트
- Python
- 학생 성적 예측
- Today
- Total
목록파이썬 (10)
데이터 분석가 Damla's blog

파이썬을 하다보면 가장 기초로 만나게되는 친구들이 리스트, 튜플, 딕셔너리이다. 각각의 정의와 특징, 생성법을 아주 간단하게 작성해 보려고 한다. 작성하는 목적은 나중에 내가 잊었을 때 복기 하기위함이다. 1. List (리스트)생성법 : list_name = [1,2,4,"a","b"]생성할 리스트명 = 대괄호 (Square Brackets)으로 그 안의 데이터를 포함한다.2. tuple (튜플)생성법 : tuple_name = (1,2,6,7,8,"a","E")생성할 튜플명 = 소괄호(Round Brackets)으로 그안의 데이터를 포함한다.[잠깐!] 그렇다면 튜플과 리스트는 무엇이 다른 것일까?리스트는 다양한 파이썬 내장함수들(.isupper, .replace., .capitalize .etc)을 ..
기본적으로 내가 가진 파일의 정보를 알고 싶을 때, 아래 2개의 코드를 사용한다.df.info()df.dtypes 1. df.info info를 사용해서 값을 불러오면 각 컬럼의 이름과 행의 수 그리고 null값 여부를 확인할 수 있다. 사용용도 : 보유한 데이터셋에 null이 있는지 (결측치가 있는지) 확인할때 주로 사용 혹은 각 컬럼명 혹은 컬럼의 순서 등을 한눈에 확인할때 사용하곤 한다. 가장 기본적인 코드 임으로 반드시 알고 있을 것! 2. df.dtypes 각 컬럼 값이 숫자인지 object(숫자가 아닌 객체)인지 float인지 등과 같은 형식을 알려준다 사용용도 : 각 컬럼의 형식 string, int..

판다스 데이터프레임은 Dataframe = 2차원표와 Series = 1차원표를 다루는 라이브러리이다!열이 2개 이상일경우 데이터프레임이라고 칭한다파이썬에서만 2차원,1차원 표를 다룰 수 있는 것은 아니고 Numpy에서도 다룰 수 있다. 행 = index열 = colums하나의 데이터가 있고 그 데이터가 무엇이 있는지 알려주는 것이 Label이다.넘파이는 1차원 왜 고차원도 다룰 수 있음.그런데 판다스가 필요한 이유? 라벨을 가지고 있기 때문 -> 라벨이 있어서 더 빠르게 정보를 찾고 계산을 할 수 있다. 딕셔너리 구조가 더 편할때가 있고 키값을 이용할 수 있어서 데이터프레임형식의 라이브러리를 사용하는 것!데이터 살펴보는 명령어 또는 함수df1 = 데이터프레임 출력S1 = 첫번째 열을 시리즈 형식으로 출..

- apply 이란?함수를 적용하기 위해서 쓰는 함수로, 데이터프레임이나 시리즈에 바로 적용시킬수 있는 pandas에 없는 다른 함수를 적용할 때 (ex. 파이썬함수) apply가 필요하다 예를 들어 아래와 같은 문제를 해결할 떄 사용할 수 있다.Q) 역순으로 배역해도 똑같은 단어가 되는 5글자 이상의 단어를 맞추어라python함수 len : 문자열이 글자수를 리턴해주는 함수df["글자수'] = df["답안'].apply(len)코딩을 하면 함수를 만들수 있다.내가 만든 함수를 적용할때도 apply를 사용한다1. apply를 왜쓰는지 이해한다2. 데이터프레임과 시리즈에서 apply의 용업의 차이를 이해한다3. 사용자정의 함수를 쓸수 있게된다 df3.info() : 데이터프레임의 속성을 확인하기 - 참..

엑셀에서는 드레그와 ctrl +c 와 v로 가능한데 파이썬에서는 함수를 사용해야함인덱싱과 슬라이싱인덱스(index)자리마다 번호가 정해져있다.1. df["열이름"] : 대괄호 인덱싱은 열밖에 안된다.2. df.loc["행이름", "열이름"]예시, df.iloc[0:3, [1,3,3]] : 좌표로 불러내고 싶을 때 이처럼 숫자를 사용하여 불러낼 수 있다. -> 불러 내고 싶은 컬럼이 있으면 한번더 쓴다4. df.drop("column name", axis = 1) 참고) 첫번째 그림의 경우 [0:2]라면 2의 앞에 있는 것까지 불러온다는 의미이다-> 즉, 0과1의 자리에 있는 것을 불러오는 것이다그런데 세번쨰의 경우 1부터 3까지 끝까지 다 불러올 경우라면 숫자를 안써도 되고 첫번째를 불러올때도 숫..

데이터프레임은 아래와 같은 형태로 구성된 표를 말한다.index는 열에 있는 데이터를 말한다. 라벨 각 컬럼과 인덱스명을 말한다. !pip install pandasimport pandas as pd*함수가 아니면 괄호를 넣지 않아도 된다.df1.indexdf1.columndf1.values 가 numpy array 이다.---df1.sum() 합계df1.mean() 평균 ---출처엑셀투 파이선_파이썬 데이터프레임이란?https://www.youtube.com/watch?v=SVjKsvvhWlQ&t=25s

Step1 : df["column name"] 지정하기 Step2 : df["column name"] = 값으로 열을 수정하거나 생성한다Step3 : drop으로 열을 삭제한다.*drop으로 행과 열 모두 삭제가능하다데이터 프레임은 2차원의 표이고 시리즈는 1차원의 표이다- 데이터 프레임 형식- 시리즈 형식시리즈에는 컬럼이 없음 인덱스(값)만 있음df1["new column"] = 1df1컬럼을 새로 추가 하고 그 값을 1로 지정하면 새로 생성된다.기존에 동일한 이름의 컬럼이 있었다면 그 컬럼의 값이 1로 바뀐다axis = 1 축이 1 = 열axis = 0 축이 0 = 행 - 여러개의 행을 삭제하고 싶다면 리스트 형으로 넣으면 된다.df1.drop(["c1", "c2"], axis = 1)중요! df1의..
str object is not callable문자열을 부를 수 없다.이 오류도 정말 흔하게 볼 수 있는 오류다 오늘 이 오류때문에 오늘의 공부는 여기까지 인가 하고 생각할 정도 였지 ㅠㅠ하 ㅠ내 탓인가 해서 강의에 나온 열들이랑 비교해봤는데 똑같아도 이 오류가 계속나왔다.내가 입력했던 코드는import time print('오늘은 날씨가 좋았다') time.sleep(3) print('친구들한테 만나자고 연락했다.') time.sleep(5) print('...그런데...') print('아무도... 답이 없었다.') print('슬프다. 나는 혼자 나가기로 했다')이런 형식의 텍스트형 코드였고 코드를 전혀 불러오지 못하는 오류라서 계속 오류와 맞장을 뜨고 있었다.해결책은?앞에 입력한 내용을 모두 ..

파이썬 실슴을 하다가 갑자기 이 오류가 나타났다.이것저것 만져봐도 같은 오류가 나왔다. indent는 들여쓰기 이다. 즉 들여쓰기된 블럭에 문제가 있다는 의미였다. indent동사1(글의 행을) 들여 쓰다The first line of each paragraph should be indented.각 단락의 첫 행은 들여 써야 한다.출처 네이버 영어사전구글링을 해보면The IndentationError: expected an indented block error indicates that you have an indentation error in the code block, which is most likely caused by a mix of tabs and spaces.이에러 표시는 너의 코드 블럭..
클래스 101에서 리송쌤의 파이썬 기초를 수강하기 시작했다.필요한 것1. Google 아이디2. Colab에 접속한다. https://colab.research.google.com/?utm_source=scs-index Google Colaboratory colab.research.google.com- process(CPU)연산 (산술/ 비교/ 논리)함수 (Built_in/ Import/ D.I.Y) 흐름제어순차구조: 위에서 아래로 내려오는 흐름 선택구조, 조건문: 내려가면서 갈라지는 구조반복- Storage(저장소)1개 짜리 혹은n개 짜리 내용을 저장 - Output(출력)모니터, 프린트 등TextImage파이썬 기초 문법 3대장1. 반복문2. 조건문3. 리스트이렇게 세가지는 꼭 알고 가야한..