hive存储优化与压缩

hive生产环境下时常是采用orc或者parquet这2种存储格式,但最好是做好统一,别一个数仓里的表存储格式 […]

Hive读写文件机制

SerDe作用 SerDe是Serializer、Deserializer的简称,目的是用于序列化和反序列化。 […]

Hive-函数

查看函数 — 查看函数 show functions like '*parse*'; – […]

Hive-DQL

执行顺序 from > where > group(含聚合sum、min、max、avg、coun […]

Hive-DML

Load加载数据 官方推荐使用Load命令加载数据加载到表中! 在将数据加载到表中时,Hive 不会进行任何转 […]

Hive-DDL

数据定义语言(data definition Language,DDL),对数据内部的对象结构进行创建,删除, […]

Hive-运算符

查看所有运算符 — 显示所有运算符 show functions ; — 查看函数说明 describe […]

Hive-数据类型

大小写不敏感。 支持String。 复杂的数据类型通常需要和指定分隔符配合使用。 数据类型 hive中的数据类 […]

Hive概述

什么是Hive? Apache Hive是一种分布式容错数据仓库系统,可进行大规模分析。 Hive Metas […]

数据仓库的分层架构

数据操作层-ODS 操作数据存储(Operation Data Store)数据源层、数据暂存层、临时缓存层。 […]

数据仓库

什么是数据仓库 数据仓库(英语:Data Warehouse,简称数仓、DW),是一个用于存储、分析、报告的数 […]