当前位置: 首页 > news >正文

docker部署WeDataSphere开源大数据平台

在这里插入图片描述
GitHub:https://github.com/WeBankFinTech/WeDataSphere

**WDS容器化版本是由Docker构建的一个能够让用户在半小时内完成所有组件安装部署并使用的镜像包。**无需再去部署Hadoop等基础组件,也不需要部署WDS的各功能组件,即可让您快速体验 WDS 所有开源组件的能力,包括 DataSphere Studio 的数据应用开发能力,Apache Linkis的计算能力,Schedulis的任务调度能力,Qualitis的数据质量检测能力,Visualis的可视化能力和Exchangis的数据转换能力。

**只需一台内存大小为32G、磁盘大小为100G的服务器,并且操作系统为CentOS或Red Hat,您就能够根据我们提供的部署文档快速完成部署。**通过使用预先构建的Docker镜像包,您无需繁琐地安装和配置各个组件,节省了宝贵的时间和精力。

WDS容器化版本的优势不仅在于快速部署,还在于其灵活性和扩展性。您可以根据实际需求,灵活选择和配置所需的组件,试用属于自己的大数据平台。同时,我们提供了各组件升级文档,能够轻松完成升级和维护。通过使用WDS容器化版本,您可以快速部署和试用一个强大和高效的大数据平台。

不过由于该容器化版本Hadoop等基础组件均是单节点形式部署在容器中,因此稳定性较差,不推荐用于生产。
四、下载使用
1、镜像包
https://osp-1257653870.cos.ap-guangzhou.myqcloud.com/WeDatasphere/DataSphereStudio/wedatasphere.tar.gz

2、WeDataSphere组件容器化部
部署步骤
查看是否存在名称为wedatasphere的镜像,存在的话建议修改已有镜像的名称

docker images

在服务器上加载镜像包(预计需要五分钟左右)和查看是否加载成功
#加载镜像包

docker load -i wedatasphere.tar 

#查看是否存在REPOSITORY名称为wedatasphere的镜像

docker images

将镜像运行在容器中 (请确保没有相同名称的container在运行)

docker run -itd --name='wedatasphere' --privileged -p 8085:8085 -p 8087:8087 -p 8083:8083 -p 9500:9500 -p 9400:9400 -p 8090:8090 -p 8080:8080 -p 50070:50070 -p 8088:8088 -p 9001:9001 wedatasphere init

进入容器

docker exec -it wedatasphere /bin/bash

在容器中切换到hadoop用户和切换目录到/data/docker下

su hadoop
cd /data/docker

执行脚本docker_start_all.sh,无报错的情况下就可以去登录DSS并使用

sh docker_start_all.sh

在页面登录的ip为所在服务器的ip,端口为8085,用户名和密码均为hadoop/hadoop
停止服务可执行docker_stop_all.sh脚本

sh docker_stop_all.sh

3、Docker版本使用指南
本文档主要介绍在使用Docker镜像包启动WeDataSphere所有组件后该如何使用

需要注意,由于镜像中部署的Hadoop, Spark等基础组件均是单节点的,稳定性必然不高,因此Docker版本无法用于生产

容器中各组件安装包均在/data/docker/Install目录下,除Streamis的配置文件在/data/docker/Install/streamis/streamis-server/conf目录,其他组件配置文件均在/data/docker/config目录下,日志均在/data/docker/logs目录,
Linkis和Visualis的前端包分别在目录/data/docker/Install/web/dss/linkis和/data/docker/Install/web/dss/visualis;DSS前端包在/data/docker/Install/web/dist;Schedulis前端包在/data/docker/Install/schedulis/schedulis-web/;Qualitis前端包在目录/data/docker/config/qualitis/dev/static;Exchangis前端包在目录/data/docker/Install/exchangis/frontend;Streamis前端包在/data/docker/Install/streamis/streamis-server/frontend
镜像中提供了两个简单Demo项目TestDemoDocker和TestStreamis,用户登录后选择首页在默认工作空间bdapWorkspace下能够看到
项目TestDemoDocker中有工作流TestDemo,该工作流主要包含DataSphereStudio中常用的节点,您可以选择执行并查看执行结果,并且可以将该工作流发布到调度中心,再从左侧菜单栏进入Schedulis调度中心,查看发布过去的工作流,对其进行调度
项目TestStreamis是流式生产中心的Demo,您打开项目后需要在从开发中心切换到流式生产中心,启动作业名称为flink-cdc的作业。该作业的功能是读取数据库streamis_test中表streamis_source_table的binlog信息,写到表streamis_sink_table中
除已有的两个项目外,您也可以选择自己创建项目和工作流,进行简单测试和演示,但是需要主要的是由于基础引擎对资源要求较高,若部署镜像的机器可用内存只有32G,执行复杂的任务会出现OOM异常
4、Docker中组件升级指南:(镜像中使用的是Open JDK)
本文档主要用于如何对镜像中的WDS组件进行升级,升级前请确保组件版本适配

DataSphereStudio
由于DataSphereStudio使用的已是最新版本v1.1.1,后续新版本发布后会提供相应升级文档

Apache Linkis
在升级前请确保新的版本已适配DataSphereStudio v1.1.1,后可按照如下步骤进行升级

停止服务

sh ${LINKIS_HOME}/sbin/linkis-stop-all.sh

替换后端lib包。用户首先需要将L I N K I S H O M E / l i b / l i n k i s − e n g i n e c o n n − p l u g i n s 中定制化的插件包备份,再用新版本的 l i b 替换 {LINKIS_HOME}/lib/linkis-engineconn-plugins中定制化的插件包备份,再用新版本的lib替换LINKIS
OME/lib/linkis−engineconn−plugins中定制化的插件包备份,再用新版本的lib替换{LINKIS_HOME}/lib,最后将备份的插件包拷贝到${LINKIS_HOME}/lib/linkis-engineconn-plugins中
替换前端包。在目录/data/docker/Install/web/dss/linkis
根据Apache Linkis的升级文档修改配置文件,配置文件目录在/data/docker/config/linkis-config
启动服务

sh ${LINKIS_HOME}/sbin/linkis-start-all.sh

Schedulis
在升级前请确保已适配DataSphereStudio v1.1.1,后可按照如下步骤进行升级

停止服务

cd /data/docker/Install/schedulis/schedulis-exec/
bin/shutdown-exec.sh
cd /data/docker/Install/schedulis/schedulis-web/
bin/shutdown-web.sh
isSuccess "stop Schedulis"

替换lib包。 首先需要备份jar包/data/docker/Install/schedulis/schedulis-exec/lib/derby.jar,再替换新版本的lib包在目录/data/docker/Install/schedulis/schedulis-exec/,后将备份的derby.jar拷贝到该目录lib下
替换前端包。替换目录/data/docker/Install/schedulis/schedulis-web/,后将上一步备份的derby.jar拷贝到lib下
修改配置文件。 根据Schedulis升级文档按需进行修改,配置文件目录在/data/docker/config/schedulis-config
启动服务

cd /data/docker/Install/schedulis/schedulis-exec/
bin/start-exec.sh
cd /data/docker/Install/schedulis/schedulis-web/
bin/start-web.sh

Visualis
在升级前请确保已适配DataSphereStudio v1.1.1,后可按照如下步骤进行升级

停止服务

sh /data/docker/Install/visualis/visualis-server/bin/stop-visualis-server.sh

替换lib包。直接用新的lib包替换/data/docker/Install/visualis/visualis-server/lib
替换前端包。直接用新的前端包替换/data/docker/Install/web/dss/visualis
修改配置文件。根据Visualis升级文档按需进行修改,配置文件目录在/data/docker/config/visualis
启动服务

sh /data/docker/Install/visualis/visualis-server/bin/start-visualis-server.sh

Qualitis
在升级前请确保已适配DataSphereStudio v1.1.1,后可按照如下步骤进行升级

停止服务

sh /data/docker/Install/qualitis/qualitis_dev/bin/stop.sh

替换lib包。直接用新的lib包替换/data/docker/Install/qualitis/qualitis-dev/lib
替换前端包。直接用新的前端包替换/data/docker/config/qualitis/dev/static
修改配置文件。根据Qualitis升级文档按需进行修改,配置文件目录在/data/docker/config/qualitis
启动服务

sh /data/docker/Install/qualitis/qualitis_dev/bin/start.sh

Exchangis
在升级前请确保已适配DataSphereStudio v1.1.1,后可按照如下步骤进行升级

停止服务

cd /data/docker/Install/exchangis/background/sbin
./daemon.sh stop server

替换lib包。直接用新的lib包替换/data/docker/Install/exchangis/background/lib
替换前端包。直接用新的前端包替换/data/docker/Install/exchangis/frontend/dist
修改配置文件。根据Exchangis升级文档按需进行修改,配置文件目录在/data/docker/config/exchangis-config
启动服务

sh /data/docker/Install/exchangis/background/sbin/daemon.sh start server

Streamis
在升级前请确保已适配DataSphereStudio v1.1.1,后可按照如下步骤进行升级

停止服务

sh /data/docker/Install/streamis/streamis-server/bin/stop-streamis-server.sh

替换lib包。直接用新的lib包替换/data/docker/Install/streamis/streamis-server/lib
替换前端包。直接用新的前端包替换/data/docker/Install/streamis/frontend/dist
修改配置文件。根据Streamis升级文档按需进行修改,配置文件目录在/data/docker/Install/streamis/streamis-server/conf
启动服务

sh /data/docker/Install/streamis/streamis-server/bin/start-streamis-server.sh
stop-streamis-server.sh

替换lib包。直接用新的lib包替换/data/docker/Install/streamis/streamis-server/lib
替换前端包。直接用新的前端包替换/data/docker/Install/streamis/frontend/dist
修改配置文件。根据Streamis升级文档按需进行修改,配置文件目录在/data/docker/Install/streamis/streamis-server/conf
启动服务

sh /data/docker/Install/streamis/streamis-server/bin/start-streamis-server.sh
http://www.xdnf.cn/news/418897.html

相关文章:

  • 【人工智能】自然语言编程革命:腾讯云CodeBuddy实战5步搭建客户管理系统,效率飙升90%
  • 论软件设计模式及其应用
  • EXCEL Python 实现绘制柱状线型组合图和树状图(包含数据透视表)
  • 工程类论文查重困局破解:基于知识图谱的跨学科语义重构技术实证研究
  • java复习笔记-面向对象
  • 速卖通如何低成本测评,让店铺流量与销量双提升
  • MapReduce基本介绍
  • 原生小程序+springboot+vue医院医患纠纷管理系统的设计与开发(程序+论文+讲解+安装+售后)
  • 内存中的“BANK”
  • 125.在 Vue3 中使用 OpenLayers 实现通过 WebGLVector 的方式添加海量点
  • MapReduce打包运行
  • 基于大模型预测胸椎管狭窄诊疗全流程的研究报告
  • 基于开源AI大模型AI智能名片S2B2C商城小程序的零售结算技术创新研究——以京东AI与香港冯氏零售集团智能结算台为例
  • 深入理解 JVM:StackOverFlow、OOM 与 GC overhead limit exceeded 的本质剖析及 Stack 与 Heap 的差异
  • 逆强化学习IRL在医疗行为模式研究中的应用
  • Three.js模型材质调整与性能优化实战
  • JPG与PDF格式转换器
  • 【论文阅读】Dip-based Deep Embedded Clustering with k-Estimation
  • 如何优化MCU中断响应时间
  • 【Ubuntu】neovim Lazyvim安装与卸载
  • coze平台实现文生视频和图生视频(阿里云版)工作流
  • OpenCV进阶操作:风格迁移以及DNN模块解析
  • 【计算机视觉】OpenCV实战项目:基于OpenCV的车牌识别系统深度解析
  • Kafka、RabbitMQ、RocketMQ的区别
  • 加速AI在k8s上使用GPU卡
  • WPS一旦打开,就会修改默认打开方式,怎么解?
  • 【OpenCV】网络模型推理的简单流程分析(readNetFromONNX、setInput和forward等)
  • React+Webpack 脚手架、前端组件库搭建
  • Ansys 计算刚柔耦合矩阵系数
  • Linux之初见进程