python DataFrame 4

파이썬(python) : pandas DataFrame 병합과 연결 merge, concat

공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!!포스팅 내용이 찾아주신 분들께 도움이 되길 바라며더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^ 데이터의 특성 상 하나의 파일로 표현하기에 양이 많기에 분석 과정에서는필요에 따라 파일들을 DataFrame으로 읽어들인 뒤에 하나의 DataFrame으로종합하여 분석해야 하는 경우가 종종 발생하는데요. 서로 다른 2개의 DataFrame을 하나로 합치는 작업을 두 가지로 구분할 수 있는데요.연결 :하나의 DataFrame에 다른 DataFrame을 연속적으로 붙이는 방법두 DataFrame에 서로 동일한 인덱스나 컬럼을 가지는 경우가 많음. 병합 : 두 DataFrame에 공통적으로 포함되어 있는 하나의 열을 기준으로 삼아해당 열의 값이 동일한 두 ..

파이썬(Python) 2018.01.23

파이썬(python) 데이터분석 라이브러리[2] : pandas - date_range(), dropna(), fillna(), isnull(), drop()

공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!!포스팅 내용이 찾아주신 분들께 도움이 되길 바라며더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^ 이번 포스팅에서는 DataFrame을 여러가지 방법으로 조작해보도록 하겠습니다. pandas 를 이용해 읽어들인 DataSet 파일에 NaN 형태의 빠진 값(missing value)이나, 정상 범주에서 벗어난 값(이상치)이 얼마든지 존재할 수 있습니다. 이런 값들을 제거하거나 다른 값으로 수정하는 방법에 대해 공부하겠습니다. 패키지 임포트 + 크기가 (5,3)인 DataFrame 생성 및 인덱스와 컬럼 값 설정In[7] : date_range()는 pandas 에서 제공하는 dateTime 과 관련된 기능입니다.첫 번째 인자에는 문자열 타입의 시작할..

파이썬(Python) 2018.01.20

파이썬(python) 데이터분석 라이브러리[2] : pandas - DataFrame 인덱싱

공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!!포스팅 내용이 찾아주신 분들께 도움이 되길 바라며더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^ 지난 포스팅에서 pandas 의 Series와 DataFrame에 대해서 공부했습니다.2018/01/19 - [파이썬(Python)] - 파이썬(python) 데이터분석 라이브러리[2] : pandas - Series 와 DataFrame 알아보기 이번 포스팅에서는 DataFrame 인덱싱에 대해 공부합니다. DataFrame 인덱싱먼저 numpy 와 pandas 를 import 해주고, dataFrame을 만들었습니다.dataFrame의 형태는 위와 같이 되었습니다. dataFrame의 특정 컬럼에 대해서 확인하고 싶을 경우에는 두 가지 방법으로확인..

파이썬(Python) 2018.01.19

파이썬(python) 데이터분석 라이브러리[2] : pandas - Series 와 DataFrame 알아보기

공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!!포스팅 내용이 찾아주신 분들께 도움이 되길 바라며더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^ 지난 포스팅까지 numpy에 대해서 알아보았는데요. 이번 포스팅부터는 pandas에 대해서 공부합니다.pandas 는 파이썬 데이터 분석의 핵심 라이브러리입니다.pandas 에는 고유한 자료구조가 있습니다.Series와 DataFrame인데요. Series : 동일한 데이터 형에 복수 개의 성분으로 구성된 자료구조입니다. DataFrame : 서로 같거나, 다른 데이터 형, 여러가지 열에 대해 복수 개의성분으로 구성된 표와 같은 자료입니다. Series 와 DataFrame을 사용하기 위해서는 numpy 와 pandas를 import 해주어야 합니다...

파이썬(Python) 2018.01.19