Hive数据类型

zjk 发布于 2024-07-01 56 次阅读


Hive 是一个建立在Hadoop上的数据仓库工具,可以用来进行数据提取、转换和加载(ETL),以及数据分析。Hive支持多种数据类型,包括基本数据类型和复杂数据类型。

基本数据类型:

  1. 整数类型
    • TINYINT:一个字节整数,范围为-128到127。
    • SMALLINT:两个字节整数,范围为-32768到32767。
    • INT:四个字节整数,范围为-2147483648到2147483647。
    • BIGINT:八个字节整数,范围为-9223372036854775808到9223372036854775807。
  2. 布尔类型
    • BOOLEAN:真或假。
  3. 浮点类型
    • FLOAT:单精度浮点数。
    • DOUBLE:双精度浮点数。
  4. 字符串类型
    • STRING:没有长度限制的字符串。
  5. 日期/时间类型
    • TIMESTAMP:时间戳。
    • DATE:日期。
  6. 二进制类型
    • BINARY:字节数组。

复杂数据类型:

  1. 数组类型
    • ARRAY<data_type>:有序的可以包含重复元素的集合。
  2. 映射类型
    • MAP<primitive_type, data_type>:键值对集合,键是原始类型,值可以是任意类型。
  3. 结构化类型
    • STRUCT<col_name:data_type, …>:不同数据类型的字段集合。
  4. 联合类型
    • UNIONTYPE<data_type, …>:在0或多个数据类型中选择一个。