Hive - 介绍

“大数据”一词用于包含巨大数据量,高速度以及日益增多的各种数据的大型数据集。使用传统的数据管理系统,处理大数据很困难。因此,Apache Software Foundation引入了一个名为Hadoop的框架来解决大数据管理和处理难题。 Hadoop的 Hadoop是一个开源框架,用于在分布式环...
大数据 2月前 阅读 21

Hive - 教程

Hive教程 Hive是一个数据仓库基础设施工具,用于处理Hadoop中的结构化数据。它位于Hadoop的顶部,用于汇总大数据,并使查询和分析变得轻松。这是一个简短的教程,介绍如何将Apache Hive HiveQL与Hadoop分布式文件系统结合使用。本教程可以成为您成为Hive成功Had...
大数据 2月前 阅读 17

HiveQL Select Joins

JOIN是一个子句,用于通过使用每个表的常见值来组合两个表中的特定字段。它用于组合来自数据库中两个或多个表的记录。它或多或少类似于SQL JOIN。 句法 join_table: table_reference JOIN table_factor [join_condition] ...
大数据 2月前 阅读 7

HiveQL Select-Group By

本章解释SELECT语句中GROUP BY子句的细节。GROUP BY子句用于使用特定的集合列对结果集中的所有记录进行分组。它用于查询一组记录。 句法 GROUP BY子句的语法如下所示: SELECT [ALL | DISTINCT] select_expr, select_expr,...
大数据 2月前 阅读 7

HiveQL Select Order By

本章介绍如何在SELECT语句中使用ORDER BY子句。ORDER BY子句用于基于一列检索详细信息,并按升序或降序对结果集进行排序。 句法 下面给出的是ORDER BY子句的语法: SELECT [ALL | DISTINCT] select_expr, select_expr, ....
大数据 2月前 阅读 4

HiveQL Select Where

Hive查询语言(HiveQL)是Hive在Metastore中处理和分析结构化数据的查询语言。本章介绍如何在WHERE子句中使用SELECT语句。 SELECT语句用于从表中检索数据。WHERE子句与条件类似。它使用条件过滤数据并给出有限的结果。内置的运算符和函数生成满足条件的表达式。 句法 ...
大数据 2月前 阅读 4

Hive - 视图和索引

本章介绍如何创建和管理视图。视图根据用户需求生成。您可以将任何结果集数据保存为视图。Hive中视图的用法与SQL中视图的用法相同。这是一个标准的RDBMS概念。我们可以在视图上执行所有的DML操作。 创建一个视图 您可以在执行SELECT语句时创建一个视图。语法如下: CREATE VI...
大数据 2月前 阅读 5

Hive - 内置函数

本章介绍Hive中可用的内置功能。这些函数看起来与SQL函数非常相似,除了它们的用法。 内置函数 Hive支持以下内置函数: 返回类型 签名 描述 BIGINT round(double a) 它返回double的...
大数据 2月前 阅读 2

Hive - 内置运算符

本章介绍Hive的内置运算符。Hive中有四种类型的操作符: 关系运算符 算术运算符 逻辑运算符 复杂算子 关系运算符 这些运算符用于比较两个操作数。下表介绍了Hive中可用的关系运算符: 操作者 操作数 描述 ...
大数据 2月前 阅读 5

Hive - 分区

Hive将表组织成分区。这是根据日期,城市和部门等分区列的值将表分成相关部分的一种方法。使用分区,很容易查询一部分数据。 表或分区被细分为 桶, 以向数据提供额外的结构,以用于更高效的查询。Bucketing基于某个表的某列的哈希函数的值进行工作。 例如,名为 Tab1 的表包含员工数据,例如i...
大数据 2月前 阅读 5

Hive - 删除表

本章介绍如何在Hive中删除表。从Hive Metastore中删除表格时,它将删除表格/列数据及其元数据。它可以是普通表(存储在Metastore中)或外部表(存储在本地文件系统中); Hive以同样的方式对待它们,不管它们的类型如何。 删除表格语句 语法如下: DROP TABLE ...
大数据 2月前 阅读 7

Hive - 修改表

本章介绍如何更改表的属性,例如更改表名称,更改列名称,添加列以及删除或替换列。 改变表格语句 它用于修改Hive中的表格。 句法 该语句根据我们希望在表中修改的属性采用以下任何语法。 ALTER TABLE name RENAME TO new_name ALTER TABLE na...
大数据 2月前 阅读 3

Hive - 创建表

本章介绍如何创建表格以及如何向其中插入数据。在HIVE中创建表格的惯例与使用SQL创建表格非常相似。 创建表格声明 创建表是用于在Hive中创建表的语句。语法和示例如下所示: 句法 CREATE [TEMPORARY] [EXTERNAL] TABLE [IF NOT EXISTS] ...
大数据 2月前 阅读 4

Hive - 删除数据库

本章介绍如何在Hive中放置数据库。SCHEMA和DATABASE的用法是一样的。 删除数据库语句 删除数据库是删除所有表并删除数据库的语句。其语法如下: DROP DATABASE StatementDROP (DATABASE|SCHEMA) [IF EXISTS] database...
大数据 2月前 阅读 2

Hive - 创建数据库

Hive是一种数据库技术,可以定义数据库和表来分析结构化数据。结构化数据分析的主题是以表格形式存储数据,并传递查询来分析数据。本章介绍如何创建Hive数据库。Hive包含一个名为 default 的默认数据库。 创建数据库语句 创建数据库是用于在Hive中创建数据库的语句。Hive中的数据库是一...
大数据 2月前 阅读 5

Hive - 数据类型

本章将带您了解Hive中涉及表创建的不同数据类型。Hive中的所有数据类型分为四种类型,具体如下: 列类型 字面 空值 复杂类型 列类型 列类型用作Hive的列数据类型。他们如下: 积分类型 整型数据可以使用整型数据类型INT来指定。当数据范围超出INT范围时,需要使...
大数据 2月前 阅读 6

Hive - 安装

所有Hadoop子项目,如Hive,Pig和HBase都支持Linux操作系统。因此,您需要安装任何Linux风格的操作系统。为Hive安装执行以下简单步骤: 第1步:验证JAVA安装 在安装Hive之前,必须在您的系统上安装Java。让我们使用以下命令验证java安装: $ java ...
大数据 2月前 阅读 8

Scala 安装

Scala 安装 Scala 语言可以运行在Window、Linux、Unix、 Mac OS X等系统上。 Scala是基于java之上,大量使用java的类库和变量,使用 Scala 之前必须先安装 Java(>1.5版本)。 Mac OS X 和 Linux 上安装 Scala 第一...
大数据 2月前 阅读 4

Scala 简介

Scala 简介 Scala 是 Scalable Language 的简写,是一门多范式的编程语言 联邦理工学院洛桑(EPFL)的Martin Odersky于2001年基于Funnel的工作开始设计Scala。 Funnel是把函数式编程思想和Petri网相结合的一种编程语言。 Odersky...
大数据 2月前 阅读 4

Scala教程

Scala教程 Scala是一种现代多范式编程语言,旨在以简洁,优雅和类型安全的方式表达常见的编程模式。Scala由Martin Odersky创建,他在2003年发布了第一个版本.Scala平滑地集成了面向对象和功能语言的特性。本教程以简单易读的方式介绍了Scala的基础知识。 适合人群 ...
大数据 2月前 阅读 8