728x90
반응형

하둡(Hadoop) 이란?

하둡 에코 시스템에 대해서 이해하기 전에 하둡이 뭔지부터 알아야 한다.

 

하둡은 "대량의 데이터를 분산 처리하고 저장하기 위한 플랫폼" 이라고 말한다.

 

하둡 아래와 같이
분산 파일 시스템이라고 하는 HDFS(Hadoop Distributed File System) 과 
분산 데이터 처리를 해주는 MapReduce(MR) 으로 구성되어있다.
추가로 하둡 2.0 버전부터는 YARN(Yet Another Resource Negotiator) 이라는 것을 통해 자원을 관리한다고 한다.

 

여기서 나오는 3 가지 요소를 시작으로 하둡에 대해서 이해하면 좋을 것 같다.

  • HDFS(Hadoop Distributed File System)
  • MapReduce(MR)
  • YARN(Yet Another Resource Negotiator) 

 

다음 포스팅에서 HDFS, MapReduce, YARN 에 대해서 무엇인지 공부해보고 정리해보려고 한다.

728x90
반응형
복사했습니다!