공감 및 댓글은 포스팅 하는데 아주아주 큰 힘이 됩니다!! 포스팅 내용이 찾아주신 분들께 도움이 되길 바라며 더 깔끔하고 좋은 포스팅을 만들어 나가겠습니다^^
|
이번 포스팅에서는
1. Big Data 의 정의
2. Big Data 분석 기법
3. Big Data 활용 사례에 대해 알아보겠습니다.
Big Data 의 정의
: 일반적으로 사용되는 데이터 수집이나 관리 및 처리 소프트웨어의 수용 한계치를 넘어서는 크기의 데이터 를 말합니다. Big Data 의 크기는 단일 데이터 집합의 크기가 수십 테라바이트(1TB = 1024GB )에서 수 페타바이트에 이르고, 그 크기가 끊임없이 변화하는 특징을 가집니다. 가트너의 분석가 더그 레이니가 2001년 본인의 연구보고서와 관련 강의에서 데이터의 급성장에 따른 이슈와 기회를 데이터의 양, 데이터의 입출력 속도, 데이터 종류의 다양성 이라는 세 개의 차원으로 정의하였는데, 이 양(Volume), 입출력 속도(velocity), 종류의 다양성(variety) ' 3V ' 모델은 이후에 가장 많이 사용되는 Big Data 의 정의가 되었습니다.
그리고 2012년 가트너는 Big Data 의 정의를 "큰 용량, 빠른 속도, 높은 다양성을 갖는 자산으로서 이를 통해 의사 결정 및 통찰 발견 그리고 프로세스 최적화를 향상시키기 위해서는 새로운 처리의 형태가 필요하다" 라고 개정하였고, 이에 더하여서 IBM 에서는 정확성 - Veracity 요소를 추가해 4V를, 브라이언 홉킨스 등은 가변성 - variability 를 추가해 4V를 정의하였습니다.
Big Data 분석 기법
: 위의 특징을 가지는 Big Data의 분석과 활용을 위한 Big Data 처리 기법은 크게 분석 기술과 표현 기술로 나뉩니다.
- 분석 기술 :
ㄱ. 텍스트 마이닝 :비/반정형 텍스트 데이터에서 자연 언어 처리 기술에 기반하여 유용한 정보를 추출, 가공
ㄴ. 오피니언 마이닝 : 소셜미디어 등의 정형/비정형 텍스트의 긍정, 부정, 중립의 선호도를 판별
ㄷ. 소셜 네트워크 분석 : 소셜 네트워크의 연결 구조 및 강도 등을 바탕으로 사용자의 명성 및 영향력을 측정
ㄹ. 군집 분석 : 비슷한 특성을 가진 개체를 합쳐가면서 최종적으로 유사 특성의 군집을 발굴
- 표현 기술 : Big Data 분석 기술을 통해서 분석된 데이터의 의미와 가치를 시각적으로 표현하기 위한 기술. 대표적으로 ' R ' 이 있습니다.
활용 사례
정치 및 사회
2008년 미국 대통령 선거
대한민국 제19대 총선
경제 및 경영
아마존닷컴의 추천 상품 표시 / 구글 및 페이스북의 맞춤형 광고
문화
MLB (메이저 리그 베이스볼)의 머니볼 이론 및 데이터 야구
2014년 FIFA 월드컵 독일 우승과 '빅데이터'
이 포스팅은 공부를 위한 포스팅입니다.
위 정보는 위키백과를 참조했습니다.
이상입니다.
'아무거나' 카테고리의 다른 글
이클립스 세미콜론 자동 입력 eclipse setting => auto insert semicolons (0) | 2017.11.09 |
---|---|
티스토리 초대장 6장 나눔합니다 (2차) (10) | 2017.10.30 |
유튜브 재생목록 만드는 방법입니다. (0) | 2017.10.23 |
다음팟인코더 지원 중단. 필요하신 분들 다운받아가세요~ (0) | 2017.10.16 |
8월 티스토리 초대장 3장 나눔합니다.(마감) (15) | 2017.08.29 |