post_img

Hive的MapJoin

摘要

Hive 中的MapJoin是一种优化技术,用于在数据集大小不匹配的情况下提高查询性能。MapJoin 将较小的表(或称为维度表) …

post_img

【SQL】会话分割计算次数

摘要

问题 有如下访问网站的数据,包括用户id和访问时间两个字段。如果某个用户的连续的访问记录时间间隔小于60秒,则属于同一个会话,现在 …

post_img

【SQL】部门收益占比

摘要

问题 现在有一张每个年份的每个部门的收入表。现在需要算每个部门的收入占同类型部门的收入的占比和当年整个公司的收入占比。要求一条SQ …