post_img

Hive的MapJoin

摘要

Hive 中的MapJoin是一种优化技术,用于在数据集大小不匹配的情况下提高查询性能。MapJoin 将较小的表(或称为维度表) …

post_img

Spark为什么比MapReduce快

摘要

误区 两者都是基于内存计算的,任何计算框架都是基于内存计算的,不会把数据在磁盘中运算。 DAG计算模型减少的是不必要的中间结果的计 …