아무거나

빅데이터란? 빅데이터(Big Data) 의 정의와 분석 기법, 활용 사례

알통몬_ 2017. 10. 24. 14:41
반응형


공감 및 댓글은 포스팅 하는데

 아주아주 큰 힘이 됩니다!!

포스팅 내용이 찾아주신 분들께 

도움이 되길 바라며

더 깔끔하고 좋은 포스팅을 

만들어 나가겠습니다^^

 


이번 포스팅에서는

1. Big Data 의 정의

2. Big Data 분석 기법

3. Big Data 활용 사례에 대해 알아보겠습니다.


Big Data 의 정의 

 : 일반적으로 사용되는 데이터 수집이나 관리 및 처리 소프트웨어의 수용 한계치를 넘어서는 크기의 데이터 를 말합니다. Big Data 의 크기는 단일 데이터 집합의 크기가 수십 테라바이트(1TB = 1024GB )에서 수 페타바이트에 이르고, 그 크기가 끊임없이 변화하는 특징을 가집니다. 가트너의 분석가 더그 레이니가 2001년 본인의 연구보고서와 관련 강의에서 데이터의 급성장에 따른 이슈와 기회를 데이터의 양, 데이터의 입출력 속도, 데이터 종류의 다양성 이라는 세 개의 차원으로 정의하였는데, 이 양(Volume), 입출력 속도(velocity), 종류의 다양성(variety) ' 3V ' 모델은 이후에 가장 많이 사용되는 Big Data 의 정의가 되었습니다.

그리고 2012년 가트너는 Big Data 의 정의를 "큰 용량, 빠른 속도, 높은 다양성을 갖는 자산으로서 이를 통해 의사 결정 및 통찰 발견 그리고 프로세스 최적화를 향상시키기 위해서는 새로운 처리의 형태가 필요하다" 라고 개정하였고, 이에 더하여서 IBM 에서는 정확성 - Veracity 요소를 추가해 4V를,  브라이언 홉킨스 등은 가변성 -  variability 를 추가해 4V를 정의하였습니다.


Big Data 분석 기법

 : 위의 특징을 가지는 Big Data의 분석과 활용을 위한 Big Data 처리 기법은 크게 분석 기술과 표현 기술로 나뉩니다.


 - 분석 기술 : 

 ㄱ. 텍스트 마이닝 :비/반정형 텍스트 데이터에서 자연 언어 처리 기술에 기반하여 유용한 정보를 추출, 가공

 ㄴ. 오피니언 마이닝 : 소셜미디어 등의 정형/비정형 텍스트의 긍정, 부정, 중립의 선호도를 판별

 ㄷ. 소셜 네트워크 분석 : 소셜 네트워크의 연결 구조 및 강도 등을 바탕으로 사용자의 명성 및 영향력을 측정

 ㄹ. 군집 분석 : 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사 특성의 군집을 발굴


 - 표현 기술 : Big Data 분석 기술을 통해서 분석된 데이터의 의미와 가치를 시각적으로 표현하기 위한 기술.  대표적으로 ' R ' 이 있습니다.


활용 사례

정치 및 사회

   2008년 미국 대통령 선거

   대한민국 제19대 총선


경제 및 경영

   아마존닷컴의 추천 상품 표시 / 구글 및 페이스북의 맞춤형 광고


문화

   MLB (메이저 리그 베이스볼)의 머니볼 이론 및 데이터 야구

   2014년 FIFA 월드컵 독일 우승과 '빅데이터'


이 포스팅은 공부를 위한 포스팅입니다.

위 정보는 위키백과를 참조했습니다.


이상입니다.

반응형