交互式查询
交互式查询目前支持spark(scala)、pyspark(python)脚本和SQL查询。每个查询必须关联到一个会话才能运行。
入口:https://hbase.console.aliyun.com/hbase/cn-shanghai/workspace/statement
创建查询
根据spark sql demo,创建一个简单的查询。
然后去资源管理器,上传people.json
数据文件。可以这里下载people.json
编写scala脚本,读取people.json
。注意:在代码里面读取资源管理器的文件,需要带上为每个用户指定的oss bucket前缀,比如这个people.json
对应的是:
val df = spark.read.json("oss://multimodel-xxxx69740496xxxx-cn-shanghai/people.json")
df.show()
然后点击运行,会话刚启动的话可能需要等待一小会,然后就可以看到结果了。
另外一个例子
创建临时表
先创建一个临时表,数据稍微丰富些。对应的scala代码可以这里下载:bank.scala
show tables
然后show tables
一下,可以看到创建的临时表bank
。
select *
直接select all就可以看到数据了。
group by
来个统计SQL:select age, count(*) as num from bank group by age order by age
。
当结果是一个二维表时,不仅有普通的表格展示,也可以查看各种统计图。
另外,也可以点击下载csv或者图片保存到本地。
版权声明
本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。
评论