공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!! 포스팅 내용이 찾아주신 분들께 도움이 되길 바라며 더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^
|
이번 포스팅에서는 드디어 데이터를 시각화해보는 실습을 합니다!
matplotlib 라이브러리를 사용하는데요.
이번 공부에서는
bar, line, 산점도 형태로 시각화해보는 실습을 해보겠습니다.
matplotlib 를 ipython notebook 에서 사용하려면 먼저
%matplotlib nbagg
매직 명령어를 실행해야 합니다.
그리고 matplotlib, matplotlib.pyplot as plt ... 라이브러리를 임포트합니다.
Series 값을 가지고 line plot을 그려봅시다.
먼저 임의의 값을 가지는 Series를 하나 만들었습니다.
In[44] : Series 값을 가지고 그래프를 그립니다.
index 값이 x 축 값, 요소 값이 y축 값에 들어갑니다.
이번에는 임의의 요소 값을 가지는 DataFrame을 만들었습니다.
Series와 마찬가지로
In[9] : df.plot() 명령어를 실행하면 line plot이 그려집니다.
아래처럼 특정 컬럼의 값들만 가져와서 line plot 를 그릴 수도 있습니다.
아래처럼 Series를 만들면 list("") 안의 값들이 index가 됩니다.
bar 그래프를 그리고 싶을 때는 plot(kind="bar") 를 사용하면 됩니다.
가로 바를 그리고 싶다면 bar 대신에 barh 를 사용합니다.
이번에는 DataFrame을 가지고 바 그래프를 그려봅시다.
사용방법은 Series에서와 같습니다.
stacked=True 속성을 사용한다면, 아래처럼 각 그래프에서 컬럼들이 얼마나 차지하는지를
보여줄 수도 있습니다. 지역 별 지지도나, 서버 별 게임 케릭터 수 같은 정보들을
표현할 때 좋겠네요.
size가 200인 시리즈를 만들어서 histogram을 그려봅시다.
s3.hist(bins=갯수) 처럼 사용합니다.
bins설정을 안해줄 경우 기본 값은 10으로 설정됩니다.
normed설정을 True로 하게 되면 각 bin에 속하는 갯수를 전체 갯수로 나눈 비율, 정규화한 값을 바의
높이로 사용하게 됩니다.
서로 다른 두 개의 독립 변수 간에 어떠한 관계가 있는지 알아볼 때
산점도 그래프를 사용합니다. 2차원 그래프에 점 형태로 사용합니다.
size가 100인 (100, 2) 짜리 배열을 만들고,
그걸 기반으로 DataFrame을 만들었습니다.
이 x1 과 x2 두 컬럼 간의 관계를 알아보는 그래프를 그려봅시다.
x1 의 값은 x축, x2의 값은 y축으로 들어갑니다.
만약 두 컬럼이 양의 상관 관계가 있다면, x값이 증가할수록
y값도 증가하는 모양이 될 것이고 음의 상관 관계를 가지고 있다면,
x값이 증가할수록 y 값은 감소하는 모양이 될 것입니다.
아래의 x1, x2는 그다지 상관 관계가 없는 그래프로 나왔네요.
이상입니다.
다음 포스팅에서도 matplotlib에 대해 공부합니다.
감사합니다.
'파이썬(Python)' 카테고리의 다른 글
파이썬(python) 데이터 시각화 라이브러리 : Seaborn, Bokeh, Folium (1) | 2018.01.23 |
---|---|
파이썬(python) 데이터 시각화 라이브러리 : matplotlib 여러 그래프 그려보기 (0) | 2018.01.23 |
파이썬(python) 데이터분석 라이브러리[2] : pandas - 간단한 데이터 분석 해보기 (0) | 2018.01.22 |
파이썬(python) 데이터분석 라이브러리[2] : pandas - 데이터 분석용 함수들 (1) | 2018.01.22 |
파이썬(python) 데이터분석 라이브러리[2] : pandas - date_range(), dropna(), fillna(), isnull(), drop() (0) | 2018.01.20 |