Presto不存储数据,是基于内存的分布式可跨数据源连表查询的计算引擎,查询速度是Hive的5-10倍。Presto是一个OLAP(online Analytic Processing)工具,擅长对海量(GB,TB,PB)数据进行复杂的分析;但是对于OLTP(On-Line Transaction Processing)场景,并不是Presto所擅长,所以不要把Presto当做数据库来使用。 presto:介绍 (二)presto实现多数据源混合查询 Cube的高级设置
正常解压安装包
分发配置好的解压包
配置node属性
hadoop102配置为coordinator,hadoop103、hadoop104配置为worker
启动Hive metastore
启动Presto Server
Presto命令行Client安装
Presto可视化Client安装
上面没有直接配置hive的连接信息,是间接配置了hive
启动web页面:http://hadoop102:7080
PS:报错:presto Unable to create input format org.apache.hadoop.mapred.TextInputFormat 报错解决方案:在hadoop102、hadoop103、hadoop104执行如下操作
Apache Kylin是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据,最初由eBay Inc开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。Kylin可以与现有的BI工具集成,提供ODBC、JDBC、RestAPI等交互接口。 什么是MPP数据库? presto、druid、sparkSQL、kylin的对比分析,如性能、架构等,有什么异同? Kylin高级主题-Cube构建算法介绍(逐层算法和快速算法) 使用衍生维度 kyin-Cube中对Rowkey的编码方式介绍 Kylin构建Cube过程详解 Kylin 配置
安装Kylin前需先部署好Hadoop、Hive、Zookeeper、Hbase,并且需要在/etc/profile中配置以下环境变量HADOOP_HOME,HIVE_HOME,Hbase_HOME。
启动Kylin依赖的框架
启动Kylin
访问Web页面:http://hadoop102:7070/kylin 用户名为:ADMIN,密码为:KYLIN
Kylin不能处理Hive表中的复杂数据类型(Array,Map,Struct),即便复杂类型的字段并未参与到计算之中。故在加载Hive数据源时,不能直接加载带有复杂数据类型字段的表。而在dim_sku_info表中存在两个复杂数据类型的字段(平台属性和销售属性),故dim_sku_info不能直接加载,需对其进行以下处理。在kylin中重新导入dim_sku_info_view视图。
事实表与维度表(维度表是拉链)关联后发散,需要建立视图取出有效数据
以上就是本篇文章【029 大数据之即席查询Presto&Kylin】的全部内容了,欢迎阅览 ! 文章地址:http://houdi.cs-ej.cn/news/695.html 资讯 企业新闻 行情 企业黄页 同类资讯 首页 网站地图 返回首页 成事e家移动站 http://houdi.cs-ej.cn/mobile/ , 查看更多