博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
021-cdh6.2+kylin2.6.2
阅读量:6260 次
发布时间:2019-06-22

本文共 5103 字,大约阅读时间需要 17 分钟。

这是坚持技术写作计划(含翻译)的第21篇,定个小目标999,每周最少2篇。

本文主要介绍,如何使用大数据神兽Kylin(2.6.2)连接cdh6.2。

提示

  • 因为cdh6.2使用的是hadoop3,而目前的kylin3.0beta版本只是hadoop2,所以只能安装kylin2.5+,此处选择kylin2.6.2-cdh60(cdh6.0版)

安装kylin

下载kylin2.6.2二进制包

wget http://mirrors.tuna.tsinghua.edu.cn/apache/kylin/apache-kylin-2.6.2/apache-kylin-2.6.2-bin-cdh60.tar.gztar zxf apache-kylin-2.6.2-bin-cdh60.tar.gz -C /usr/local/ln -s /usr/local/apache-kylin-2.6.2-bin-cdh60 /usr/local/kylin复制代码

配置kylin环境变量

cat << EOF | sudo tee -a /etc/profile#设置java环境export JAVA_HOME=/usr/java/jdk1.8.0_181-cloudera/export CLASSPATH=.:\$JAVA_HOME/lib:\$JAVA_HOME/jre/lib:\$CLASSPATHexport KYLIN_HOME=/usr/local/kylinexport PATH=\$JAVA_HOME/bin:\$JAVA_HOME/jre/bin:\$PATHexport CDH_HOME=/opt/cloudera/parcels/CDHexport HBASE_HOME=\${CDH_HOME}/lib/hbaseexport HBASE_CLASSPATH=\${HBASE_HOME}/lib/hbase-common-2.1.0-cdh6.2.0.jarEOFsource /etc/profile复制代码

如果不加 $HBASE_HOME 会报 hbase-common lib not found

Retrieving hadoop conf dir...KYLIN_HOME is set to /usr/local/kylinRetrieving hive dependency...Retrieving hbase dependency...Error: Could not find or load main class org.apache.hadoop.hbase.util.GetJavaPropertyhbase-common lib not found复制代码

在hdfs创建kylin和spark目录

export HADOOP_USER_NAME=hdfs复制代码

否则会报

$KYLIN_HOME/bin/check-env.shRetrieving hadoop conf dir...Error: Could not find or load main class org.apache.hadoop.hbase.util.GetJavaPropertyKYLIN_HOME is set to /usr/local/kylinmkdir: Permission denied: user=root, access=WRITE, inode="/kylin":hdfs:supergroup:drwxr-xr-xFailed to create hdfs:///kylin/spark-history. Please make sure the user has right to access hdfs:///kylin/spark-history复制代码
yum install -y net-tools复制代码

否则会报

$KYLIN_HOME/bin/check-env.shRetrieving hadoop conf dir...Error: Could not find or load main class org.apache.hadoop.hbase.util.GetJavaPropertyKYLIN_HOME is set to /usr/local/kylin/usr/local/kylin/bin/check-port-availability.sh: line 27: netstat: command not found复制代码

下载spark

$KYLIN_HOME/bin/download-spark.sh复制代码

否则会报

$KYLIN_HOME/bin/kylin.sh startRetrieving hadoop conf dir...错误: 找不到或无法加载主类 org.apache.hadoop.hbase.util.GetJavaPropertyKYLIN_HOME is set to /usr/local/kylinRetrieving hive dependency...Retrieving hbase dependency...错误: 找不到或无法加载主类 org.apache.hadoop.hbase.util.GetJavaPropertyRetrieving hadoop conf dir...错误: 找不到或无法加载主类 org.apache.hadoop.hbase.util.GetJavaPropertyRetrieving kafka dependency...Retrieving Spark dependency...spark not found, set SPARK_HOME, or run bin/download-spark.sh复制代码

如果知己指定了不兼容的spark版本,可能会导致404,参考 

启动kylin

$KYLIN_HOME/bin/kylin.sh start复制代码

如果成功会输出

A new Kylin instance is started by root. To stop it, run 'kylin.sh stop'Check the log at /usr/local/kylin/logs/kylin.logWeb UI is at http://
:7070/kylin复制代码

浏览器打开  ,用户名密码是 ADMIN/KYLIN 

使用kylin(以官方demo演示)

导入数据

$KYLIN_HOME/bin/sample.shRetrieving hadoop conf dir...Error: Could not find or load main class org.apache.hadoop.hbase.util.GetJavaPropertyLoading sample data into HDFS tmp path: /tmp/kylin/sample_cube/dataGoing to create sample tables in hive to database DEFAULT by cliWARNING: Use "yarn jar" to launch YARN applications.SLF4J: Class path contains multiple SLF4J bindings.SLF4J: Found binding in [jar:file:/opt/cloudera/parcels/CDH-6.2.0-1.cdh6.2.0.p0.967373/jars/log4j-slf4j-impl-2.8.2.jar!/org/slf4j/impl/StaticLoggerBinder.class]SLF4J: Found binding in [jar:file:/opt/cloudera/parcels/CDH-6.2.0-1.cdh6.2.0.p0.967373/jars/slf4j-log4j12-1.7.25.jar!/org/slf4j/impl/StaticLoggerBinder.class]SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.SLF4J: Actual binding is of type [org.apache.logging.slf4j.Log4jLoggerFactory]Logging initialized using configuration in jar:file:/opt/cloudera/parcels/CDH-6.2.0-1.cdh6.2.0.p0.967373/jars/hive-common-2.1.1-cdh6.2.0.jar!/hive-log4j2.properties Async: falseOK//....Sample cube is created successfully in project 'learn_kylin'.** Restart Kylin Server or click Web UI => System Tab => Reload Metadata to take effect **复制代码

重新加载元数据

选择 learn_kylin

构建Cube

选择 Model,选择kylin_sales_model,选择build

此处选择起止日期。
如果没关闭hdfs权限校验,此处肯定会build失败。可以通过右侧
> 图标点击查看进度。
build成功后,回到Insight界面,此时已经成功构建出5张表了。

讲解demo表

Kylin的示例是销售业务分析

  • KYLIN_SALES 事实表,存有销售订单的详细信息(卖家,商品分类,订单金额,商品数量等)
  • KYLIN_COUNTRY 维度表,存有国家信息(简写,名称等)
  • KYLIN_CATEGORY_GROUPINGS 维度表,存有商品分类的详细介绍(分类名称等)
  • KYLIN_CAL_DT 维度表,存有时间扩展信息(日期所在年始,月始,周始,年份,月份等)
  • KYLIN_ACCOUNT 维度表,存有账户信息(账户id,卖家等级,买家等级,国家等)

运行查询语句

执行 select count(1) from kylin_sales 点击submit,下方会显示执行结果,以及执行耗时(此处是1.8秒)。kylin会缓存执行结果,再次执行发现变成了0.18秒

执行稍微复杂的SQL语句

select sum(KYLIN_SALES.PRICE) as price_sum,KYLIN_CATEGORY_GROUPINGS.META_CATEG_NAME,KYLIN_CATEGORY_GROUPINGS.CATEG_LVL2_NAME from KYLIN_SALES inner join KYLIN_CATEGORY_GROUPINGSon KYLIN_SALES.LEAF_CATEG_ID = KYLIN_CATEGORY_GROUPINGS.LEAF_CATEG_ID and KYLIN_SALES.LSTG_SITE_ID = KYLIN_CATEGORY_GROUPINGS.SITE_IDgroup by KYLIN_CATEGORY_GROUPINGS.META_CATEG_NAME,KYLIN_CATEGORY_GROUPINGS.CATEG_LVL2_NAMEorder by KYLIN_CATEGORY_GROUPINGS.META_CATEG_NAME asc,KYLIN_CATEGORY_GROUPINGS.CATEG_LVL2_NAME desc复制代码

自带简单的可视化。

参考资料

招聘小广告

山东济南的小伙伴欢迎投简历啊 , 一起搞事情。

长期招聘,Java程序员,大数据工程师,运维工程师,前端工程师。

转载于:https://juejin.im/post/5cdfd597e51d4510b35001c1

你可能感兴趣的文章
Lesson 5-Exchange server 2010 Transfer mails in public network
查看>>
Chrome源码剖析【三】
查看>>
windows系统自带命令查看硬件信息,怎样dos命令查看硬盘和内存/CPU信息
查看>>
Nginx基础应用--------基于CentOS6源码安装
查看>>
流媒体服务器之nginx的rtmp模块
查看>>
AChartEngine中属性XYMultipleSeriesRenderer和XYSeriesRender属性详解
查看>>
免费的上网行为管理系统和软路由系统推荐。
查看>>
dovecot+mysql
查看>>
c#短信接口代码实现(发短信)
查看>>
nginx hello world模块编译运行的问题
查看>>
磁盘空间满引起的mysql启动失败:ERROR! MySQL server PID file could not be found!
查看>>
对症下药 避免显示器偏离色彩“正轨”
查看>>
MySQL权限经验原则
查看>>
apache下实现301永久性重定向的方法
查看>>
fir.im 持续集成技术实践
查看>>
windows快捷键使用
查看>>
Java 字符串处理
查看>>
安装nginx服务实战
查看>>
Python基础语法
查看>>
Net Standard扩展支持实例分享
查看>>