029 大数据之即席查询Presto&Kylin

029 大数据之即席查询Presto&Kylin

2024-11-11 09:03

Presto不存储数据，是基于内存的分布式可跨数据源连表查询的计算引擎，查询速度是Hive的5-10倍。Presto是一个OLAP（online Analytic Processing）工具，擅长对海量（GB，TB，PB）数据进行复杂的分析；但是对于OLTP（On-Line Transaction Processing）场景，并不是Presto所擅长，所以不要把Presto当做数据库来使用。 presto：介绍 (二）presto实现多数据源混合查询 Cube的高级设置

正常解压安装包

分发配置好的解压包

配置node属性

hadoop102配置为coordinator，hadoop103、hadoop104配置为worker

启动Hive metastore

启动Presto Server

Presto命令行Client安装

Presto可视化Client安装

上面没有直接配置hive的连接信息，是间接配置了hive

在这里插入图片描述

启动web页面：http://hadoop102:7080

PS：报错：presto Unable to create input format org.apache.hadoop.mapred.TextInputFormat 报错解决方案：在hadoop102、hadoop103、hadoop104执行如下操作

Apache Kylin是一个开源的分布式分析引擎，提供Hadoop/Spark之上的SQL查询接口及多维分析（OLAP）能力以支持超大规模数据，最初由eBay Inc开发并贡献至开源社区。它能在亚秒内查询巨大的Hive表。Kylin可以与现有的BI工具集成，提供ODBC、JDBC、RestAPI等交互接口。什么是MPP数据库？ presto、druid、sparkSQL、kylin的对比分析，如性能、架构等，有什么异同？ Kylin高级主题-Cube构建算法介绍（逐层算法和快速算法）使用衍生维度 kyin-Cube中对Rowkey的编码方式介绍 Kylin构建Cube过程详解 Kylin 配置在这里插入图片描述

安装Kylin前需先部署好Hadoop、Hive、Zookeeper、Hbase，并且需要在/etc/profile中配置以下环境变量HADOOP_HOME，HIVE_HOME，Hbase_HOME。

启动Kylin依赖的框架

启动Kylin

访问Web页面：http://hadoop102:7070/kylin 用户名为：ADMIN，密码为：KYLIN

Kylin不能处理Hive表中的复杂数据类型（Array,Map,Struct）,即便复杂类型的字段并未参与到计算之中。故在加载Hive数据源时，不能直接加载带有复杂数据类型字段的表。而在dim_sku_info表中存在两个复杂数据类型的字段（平台属性和销售属性），故dim_sku_info不能直接加载，需对其进行以下处理。在kylin中重新导入dim_sku_info_view视图。

事实表与维度表（维度表是拉链）关联后发散，需要建立视图取出有效数据

以上就是本篇文章【029 大数据之即席查询Presto&Kylin】的全部内容了，欢迎阅览！文章地址：http://houdi.cs-ej.cn/news/695.html
资讯企业新闻行情企业黄页同类资讯首页网站地图返回首页成事e家移动站 http://houdi.cs-ej.cn/mobile/ , 查看更多