Hive 是一个建立在Hadoop上的数据仓库工具,可以用来进行数据提取、转换和加载(ETL),以及数据分析。Hive支持多种数据类型,包括基本数据类型和复杂数据类型。
基本数据类型:
- 整数类型:
- TINYINT:一个字节整数,范围为-128到127。
- SMALLINT:两个字节整数,范围为-32768到32767。
- INT:四个字节整数,范围为-2147483648到2147483647。
- BIGINT:八个字节整数,范围为-9223372036854775808到9223372036854775807。
- 布尔类型:
- BOOLEAN:真或假。
- 浮点类型:
- FLOAT:单精度浮点数。
- DOUBLE:双精度浮点数。
- 字符串类型:
- STRING:没有长度限制的字符串。
- 日期/时间类型:
- TIMESTAMP:时间戳。
- DATE:日期。
- 二进制类型:
- BINARY:字节数组。
复杂数据类型:
- 数组类型:
- ARRAY<data_type>:有序的可以包含重复元素的集合。
- 映射类型:
- MAP<primitive_type, data_type>:键值对集合,键是原始类型,值可以是任意类型。
- 结构化类型:
- STRUCT<col_name:data_type, …>:不同数据类型的字段集合。
- 联合类型:
- UNIONTYPE<data_type, …>:在0或多个数据类型中选择一个。
Comments NOTHING