当前位置: 首页 > web >正文

7.atlas安装

1.服务器规划

软件版本参考:
https://cloud.google.com/dataproc/docs/concepts/versioning/dataproc-release-2.2?hl=zh-cn
由于hive3.1.3不完全支持jdk8,所以将hive的版本调整成4.0.1。这个版本没有验证过,需要读者自己抉择。

所有的软件都安装再/opt/apps下。

2.预先准备

hadoop集群
hive集群
kafka集群
zookeeper集群
hbase集群

3.相关组件安装

3.1 solr集群安装

修改配置

修改/opt/apps/solr/bin/solr.in.sh,打开注释或者新增配置。

ZK_HOST="instance-kafka01:2181,instance-kafka02:2181,instance-kafka03:2181"
SOLR_HOST="instance-hbase01"
SOLR_JETTY_HOST="0.0.0.0"

solr的zookeeper地址,本地ip或者hostname, 允许其他节点访问。

分发
将solr安装包分发到需要安装的机器上,并将solr.in.sh配置里面的SOLR_HOST改成本机。

SOLR_HOST="instance-hbase01"

启动

配置环境变量后,在每一台机器上执行下面命令。

solr start

访问任意一台机器,8983端口,出现以下界面为安装成功。
在这里插入图片描述

补充
要集成atlas, solr9.2.1需要在对应的zk上增加一个额外的目录。

create /clusterstate.json {}

3.atlas安装

3.1 解压

把前文中编译好的压缩包,上传到服务器,然后解压。找到apache-atlas-2.2.0-server.tar.gz解压到/opt/apps

tar -zxvf apache-atlas-2.2.0-server.tar.gz -C /opt/apps/

改名为atlas.
找到apache-atlas-2.2.0-hive-hook.tar.gz解压到/opt/apps,并且改名为atlas-hive-hook

tar -zxvf apache-atlas-2.2.0-hive-hook.tar.gz -C /opt/apps/

3.2 配置

配置路径在/apache-atlas-2.2.0/conf。

3.2.1 集成HBase

atlas-application.properties,新增或者打开注释。配置Hbase配置的zk地址。

atlas.graph.storage.hostname=mecury-schedule-v1-m-0:2181,mecury-schedule-v1-m-1:2181,mecury-schedule-v1-m-2:2181

atlas-env.sh 配置hbase配置目录。

export HBASE_CONF_DIR=/opt/apps/hbase/conf

3.2.2 集成Solr

atlas-application.properties。配置solr配置的zk地址。

atlas.graph.index.search.solr.zookeeper-url=instance-kafka01:2181,instance-kafka02:2181,instance-kafka03:2181

创建相应的collection.

/opt/apps/solr/bin/solr create -c vertex_index -d /opt/apps/atlas/conf/solr -shards 3 -replicationFactor 2
/opt/apps/solr/bin/solr create -c edge_index -d /opt/apps/atlas/conf/solr -shards 3 -replicationFactor 2
/opt/apps/solr/bin/solr create -c fulltext_index -d /opt/apps/atlas/conf/solr -shards 3 -replicationFactor 2

对于atlas-2.2.0的配置文件有点问题,包含弃用的对象。执行上面命令前,需要调整。
/opt/apps/atlas/conf/solr/schema.xml

<fieldType name="location" class="solr.LatLonType" subFieldSuffix="_coordinate"/>```
修改为```bash
<fieldType name="location" class="solr.LatLonPointSpatialField"/>

3.2.3 集成kafka

atlas-application.properties。配置kafka集群地址和数据目录。

atlas.kafka.data=/opt/data/atlas/kafka
atlas.kafka.zookeeper.connect=instance-kafka01:2181,instance-kafka02:2181,instance-kafka03:2181/kafka
atlas.kafka.bootstrap.servers=instance-kafka01:9092,instance-kafka02:9092,instance-kafka03:9092

3.2.4 atlas 配置

配置atlas地址和hbase zookeeper地址。

atlas.rest.address=http://instance-hbase11:21000
# If enabled and set to true, this will run setup steps when the server starts
atlas.server.run.setup.on.start=false
atlas.audit.hbase.zookeeper.quorum=mecury-schedule-v1-m-0:2181,mecury-schedule-v1-m-1:2181,mecury-schedule-v1-m-2:2181

打开这段注释

 <!-- Uncomment the following for perf logs --><!--<appender name="perf_appender" class="org.apache.log4j.DailyRollingFileAppender"><param name="file" value="${atlas.log.dir}/atlas_perf.log" /><param name="datePattern" value="'.'yyyy-MM-dd" /><param name="append" value="true" /><layout class="org.apache.log4j.PatternLayout"><param name="ConversionPattern" value="%d|%t|%m%n" /></layout></appender><logger name="org.apache.atlas.perf" additivity="false"><level value="debug" /><appender-ref ref="perf_appender" /></logger>-->

3.2.5 集成hive

atlas-application.properties,增加。

######### Hive Hook Configs #######
atlas.hook.hive.synchronous=false
atlas.hook.hive.numRetries=3
atlas.hook.hive.queueSize=10000
atlas.cluster.name=primary

拷贝atlas-hive-hook到atlas.

cp -r atlas-hive-hook/* atlas/

修改hive-site.xml,增加

  <property><name>hive.exec.post.hooks</name><value>org.apache.atlas.hive.hook.HiveHook</value></property>

修改hive-env.sh,增加

export HIVE_AUX_JARS_PATH=/opt/apps/atlas-hive-hook/hook/hive

将atlas-application.properties复制到hive/conf目录下。

4.启动

进入atlas目录。

bin/atlas_start.py

启动成功后,访问21000可以登录。就表示成功。
初始账号和密码都是admin。

http://www.xdnf.cn/news/10179.html

相关文章:

  • 5.30 打卡
  • 【计算机网络】fork()+exec()创建新进程(僵尸进程及孤儿进程)
  • Day40
  • RFID赋能零件智能夹取新生态
  • 深度学习全面掌握指南
  • CMP401GSZ-REEL混合电压接口中的23ns延迟与±6V输入范围设计实现
  • 【Zephyr 系列 2】用 Zephyr 玩转 Arduino UNO / MEGA,实现串口通信与 CLI 命令交互
  • Vue 项目命名规范指南
  • 操作系统原理第9章 磁盘存储器管理 重点内容
  • JAVA:抽象类和接口
  • AI书签管理工具开发全记录(五):后端服务搭建与API实现
  • OSG编译wasm尝试
  • PostgreSQL部署
  • PyCharm接入DeepSeek,实现高效AI编程
  • Python中函数知识详解和示例
  • 正则化-深度学习
  • 2011肠衣问题
  • 视频压制(Video Encoding/Compression)
  • 20250530-C#知识:String与StringBuilder
  • dify账号与基础模型配置
  • RK3568项目(四)--uboot启动流程之启动模式选择
  • PPIO × AstrBot:多平台接入聊天机器人,开启高效协同 | 教程
  • 封装一个Qt调用动态库的类
  • LLM enhanced VRP
  • 根据面包屑的展开与隐藏控制样式
  • 告别充电焦虑:移动充电桩如何优化传统充电模式?
  • 湖北理元理律师事务所:债务优化服务的流程透明度建设
  • 【NLP入门系列一】NLP概述和独热编码
  • 手撕Java+硅基流动实现MCP服务器教程
  • 【Oracle】DML语言