파이썬 데이터분석 3

파이썬(python) 데이터분석 라이브러리[2] : pandas - 데이터 분석용 함수들

공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!!포스팅 내용이 찾아주신 분들께 도움이 되길 바라며더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^ 이번 포스팅에서는 pandas 의 데이터 분석용 함수들에 대해서 공부합니다. 항상 그렇듯 먼저 필요한 라이브러리를 임포트합니다.numpy 와 pandas 임포트하고, data 라는 2차원 리스트를 말들고data 리스트를 기반으로 컬럼과 인덱스 명을 가지는 2차원 배열을 만들었습니다.sum() : 행 또는 열 방향의 합을 구하는 함수입니다.컬럼 이름을 가지고 특정 컬럼의 합만을 구할 수도 있습니다. mean() : 평균을 구하는 함수,var() 분산을 구하는 함수 / 분산이란? : https://ko.wikipedia.org/wiki/%EB%B6%84%..

파이썬(Python) 2018.01.22

파이썬(python) 데이터분석 라이브러리[1] : numpy 로 간단한 데이터 분석 해보기 (feat. MovieLens)

공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!!포스팅 내용이 찾아주신 분들께 도움이 되길 바라며더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^ 지난 포스팅까지해서 numpy에 대해 알아보았습니다.numpy 알아보기numpy array 인덱싱 알아보기numpy array 관련 함수 알아보기 이번 포스팅에서는 MovieLens 라는 곳에서 100만 DataSet을 받아서 분석해보겠습니다. 1. DataSet 다운로드먼저 구글에 MovieLens 라고 검색을 하면 아래처럼 나오는데요.저는 1M Dataset을 받았습니다. 다운로드 받은 압축파일의 압축을 풀면 저 같은 경우는 ml-1m 이라는 폴더가 나오는데,그 안에 3개의 .dat 파일과 readme.txt 파일이 존재합니다.그리고 jupyter..

파이썬(Python) 2018.01.19

파이썬(python) 데이터분석 라이브러리[1] : numpy 알아보기

공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!!포스팅 내용이 찾아주신 분들께 도움이 되길 바라며더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^ 이번 포스팅에서는 numpy 라이브러리에 대해 공부합니다. 이번 포스팅부터는 지난 포스팅에서 설치한 jupyter 를 사용합니다.그 전에 numpy 가 무엇인지 알아야겠죠? NumPy : Numerical Python 의 약자로Python 을 사용한 과학 컴퓨팅의 기본 패키지입니다.NumPy는 다음을 포함하는데요.- 파워풀한 N 차원의 배열 객체- 정교한(broadcasting) 기능- C 와 C++ 그리고 포트란 코드 통합 도구- 유요한 선형 대수학, 푸리에 변환, 난수 기능 주피터 실행하기jupyter notebook 명령어를 실행하면 아래처럼 페..

파이썬(Python) 2018.01.18