파이썬(Python)

파이썬(python) 데이터 시각화 라이브러리 : matplotlib, matplotlib.pyplot

알통몬_ 2018. 1. 22. 15:55
반응형


공감 및 댓글은 포스팅 하는데

 아주아주 큰 힘이 됩니다!!

포스팅 내용이 찾아주신 분들께 

도움이 되길 바라며

더 깔끔하고 좋은 포스팅을 

만들어 나가겠습니다^^

 


이번 포스팅에서는 드디어 데이터를 시각화해보는 실습을 합니다!

matplotlib 라이브러리를 사용하는데요.

이번 공부에서는 

bar, line, 산점도 형태로 시각화해보는 실습을 해보겠습니다.

matplotlib 를 ipython notebook 에서 사용하려면 먼저

%matplotlib nbagg 

매직 명령어를 실행해야 합니다.

그리고 matplotlib, matplotlib.pyplot as plt ... 라이브러리를 임포트합니다.


Series 값을 가지고 line plot을 그려봅시다.

먼저 임의의 값을 가지는 Series를 하나 만들었습니다.

In[44] : Series 값을 가지고 그래프를 그립니다.

index 값이 x 축 값, 요소 값이 y축 값에 들어갑니다.

이번에는 임의의 요소 값을 가지는 DataFrame을 만들었습니다.

Series와 마찬가지로

In[9] : df.plot() 명령어를 실행하면 line plot이 그려집니다.


아래처럼 특정 컬럼의 값들만 가져와서 line plot 를 그릴 수도 있습니다.


아래처럼 Series를 만들면 list("") 안의 값들이 index가 됩니다.

bar 그래프를 그리고 싶을 때는 plot(kind="bar") 를 사용하면 됩니다.

가로 바를 그리고 싶다면 bar 대신에 barh 를 사용합니다.


이번에는 DataFrame을 가지고 바 그래프를 그려봅시다.

사용방법은 Series에서와 같습니다.

stacked=True 속성을 사용한다면, 아래처럼 각 그래프에서 컬럼들이 얼마나 차지하는지를

보여줄 수도 있습니다. 지역 별 지지도나, 서버 별 게임 케릭터 수 같은 정보들을

표현할 때 좋겠네요.


size가 200인 시리즈를 만들어서 histogram을 그려봅시다.

s3.hist(bins=갯수) 처럼 사용합니다.

bins설정을 안해줄 경우 기본 값은 10으로 설정됩니다.

normed설정을 True로 하게 되면 각 bin에 속하는 갯수를 전체 갯수로 나눈 비율, 정규화한 값을 바의

높이로 사용하게 됩니다.

서로 다른 두 개의 독립 변수 간에 어떠한 관계가 있는지 알아볼 때 

산점도 그래프를 사용합니다. 2차원 그래프에 점 형태로 사용합니다.

size가 100인 (100, 2) 짜리 배열을 만들고,

그걸 기반으로 DataFrame을 만들었습니다.

이 x1 과 x2 두 컬럼 간의 관계를 알아보는 그래프를 그려봅시다.

x1 의 값은 x축, x2의 값은 y축으로 들어갑니다.

만약 두 컬럼이 양의 상관 관계가 있다면, x값이 증가할수록

 y값도 증가하는 모양이 될 것이고 음의 상관 관계를 가지고 있다면, 

x값이 증수록 y 값은 감소하는 모양이 될 것입니다.

아래의 x1, x2는 그다지 상관 관계가 없는 그래프로 나왔네요.


이상입니다.

다음 포스팅에서도 matplotlib에 대해 공부합니다.

감사합니다.

반응형