Hive – 王子健-Blog

hive生产环境下时常是采用orc或者parquet这2种存储格式，但最好是做好统一，别一个数仓里的表存储格式 […]

exlplain 分区表优化分桶表优化 join时的字段如果是桶字段，会减少join的数据量，减少笛卡尔积量 […]

SerDe作用 SerDe是Serializer、Deserializer的简称，目的是用于序列化和反序列化。 […]

查看函数 — 查看函数 show functions like '*parse*'; – […]

执行顺序 from > where > group(含聚合sum、min、max、avg、coun […]

Load加载数据官方推荐使用Load命令加载数据加载到表中！在将数据加载到表中时，Hive 不会进行任何转 […]

数据定义语言（data definition Language，DDL），对数据内部的对象结构进行创建，删除， […]

查看所有运算符 — 显示所有运算符 show functions ; — 查看函数说明 describe […]

大小写不敏感。支持String。复杂的数据类型通常需要和指定分隔符配合使用。数据类型 hive中的数据类 […]

Hive元数据-Metadata 元数据（Metadata）描述数据的数据，比如电脑上的数据盘属性： hive […]

什么是Hive? Apache Hive是一种分布式容错数据仓库系统，可进行大规模分析。 Hive Metas […]

数据操作层-ODS 操作数据存储（Operation Data Store）数据源层、数据暂存层、临时缓存层。 […]

什么是数据仓库数据仓库（英语：Data Warehouse，简称数仓、DW）,是一个用于存储、分析、报告的数 […]

参考： guava源码： https://github.com/google/guava guava包冲突： […]

#!/bin/sh db=$1 if [ -z "$db" ];then echo &qu […]

分类目录归档：Hive