Hadoop之kafka

Hadoop之kafka

  Kafka是一个分布式的、高吞吐的、基于发布/订阅的消息系统。利用kafka技术可以在廉价PC Server上搭建起大规模的消息系统。Kafka具有消息持久...
Hadoop之MapReduce

Hadoop之MapReduce

  2003年Google发表《Google File System》,即GFS集群,主要包括Master node和Chunkservers。在2004年Go...
Hadoop之HBase&Hive

Hadoop之HBase&Hive

  HBase(Hadoop Database),是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。其底层的文件系统是HDFS,使用阿里的开源框架——动物...