post_img

Hive的MapJoin

摘要

Hive 中的MapJoin是一种优化技术,用于在数据集大小不匹配的情况下提高查询性能。MapJoin 将较小的表(或称为维度表) …

post_img

Hive数据类型

摘要

Hive 是一个建立在Hadoop上的数据仓库工具,可以用来进行数据提取、转换和加载(ETL),以及数据分析。Hive支持多种数据 …

post_img

HiveUDF函数实现模糊匹配

摘要

应用背景:业务逻辑需要写一些模糊匹配项,比如column1字段包含”abc”的数据,我们经常会这样: column like ‘% …