大数据处理-Bloom Filter

大数据处理——Bloom Filter   布隆过滤器(Bloom Filter)是由巴顿.布隆于一九七零年提出的。它实际上是一个很长的二进制向量和一系列随机映射函数。   如果想判断一个元素是不是在...

大数据处理-Bitmap

  MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。概念"Map(映射)"和"Reduce(归约)" Bit-map空间压缩和快速排序去重 1. Bit-map的基本思想 ...