목록Data Engineer/Hadoop Ecosystem (1)
취미가 좋다
하둡 에코시스템 기초
하둡 에코시스템은 빅데이터를 효율적으로 다루기 위한 프로젝트들의 집합니다. 빅데이터 저장을 위한 HDFS 빅데이터 처리를 위한 MapReduce 두 가지를 코어 프로젝트 외에도 많은 프로젝트들이 존재한다. 자바 기반의 프레임워크이다. HDFS MapReduce YARN Sqoop Hive IMPALA KUDU Ranger HUE Zookeeper nifi Oozie Ozone Spark Kafka Cassandra Pig STORM FLUME Tajo MAHOUT Ambari HDFS - 하둡 네트워크에 연결된 기기에 데이터를 분산해서 저장한다. - 분산된 데이터는 복사본(보통 3개)을 만들어 나누어 저장하기 때문에 높은 가용성을 가진다. - 고가용성(high ability) : 하나가 문제가 생겨도 안..
Data Engineer/Hadoop Ecosystem
2021. 11. 4. 11:16