Spark SQL

Spark SQL

Spark SQL允许Spark执行用SQL, HiveQL或者Scala表示的关系查询。这个模块的核心是一个新类型的RDD-SchemaRDD。SchemaRDDs由对象组成,行对象拥有一个模式(scheme)来描述行中每一列的数据类型。SchemaRDD与关系型数据库中的表很相似。可以通过存在的RDD、一个Parquet文件、一个JSON数据库或者对存储在Apache Hive中的数据执行HiveSQL查询中创建。

本章的所有例子都利用了Spark分布式系统中的样本数据,可以在spark-shell中运行它们。

作者:admin,如若转载,请注明出处:https://www.web176.com/spark/11923.html

(0)
打赏 支付宝 支付宝 微信 微信
adminadmin
上一篇 2023年3月6日
下一篇 2023年3月6日

相关推荐

发表回复

登录后才能评论