본문 바로가기

ITNEWS

하둡이란? 하둡을 알고 빅데이터를 공부해보자

다들

주말

잘 보내셨나요? ㅎㅎㅎㅎ

Consultant_황 입니다!


이번에는 "하둡" 을 알아보는 시간을 가지도록 합시다!



일단 하둡이 어떻게 생겼는지 알아봅시다!


자 시작합시다!



일단 하둡이라는 것은 이름입니다!

하둡(hadoop)은 대용량의 데이터 처리를 위해 개발된 오픈소스 소프트웨어이구요

(open-source software).

하둡은 야후(Yahoo)의 재정지원으로 2006년부터 개발되었으며 

현재는 아파치(Apache) 재단이 개발을 주도하고 있습니다. 

하둡은 노란색 아기코끼리로 표현하는데 

이는 하둡을 처음 개발한 더그 커팅(Doug Cutting)이 자신의

아이가 가지고 놀던 장난감 코끼리의 이름을 붙였다고 하네요!

하둡은 구글의 분산 파일 시스템(GFS) 논문 공개 후 본격적으로 개발되었는데 구글의

시스템과 대응되는 체계로 구성되어 있는 것이 특징입니다.



쉽게 말하면

하둡이라는 시스템은

저렴하면서 방대한 데이터를 분석할수 있게 도와주는 것입니다!



이건 SK가 멜론 시스템에 도입한 하둡 방식을 나타내는 사진입니다!

우리가 보고 있는 영상이라던지

사진, 다른사람이 쓴 글!

그리고 음악이 재생하는 모든 데이터를

하둡에 저장했다가

순식간에 정보를 불러와 우리가 보고,읽고,쓸수 있는 겁니다!

즉 로딩이라고 하죠?



하둡에는 이런 소스가 전부 오픈되어 있습니다!

아마 처음 보시는 분들은 뭔 말인지 모를테지만!

아하 이런게 있구나!

라고 생각하시면 되요!


더 방대한

하둡같은 자료를 원하고 상담도 받고

해커가 되고 싶고 저런 하둡 데이터를 다루고 싶다면

주저하지 마시고

↓↓↓↓↓↓↓↓↓