当前位置: 首页 > web >正文

linux安装阿里DataX实现数据迁移

目录

下载datax工具包(如果下载慢,请尝试其他国内镜像站或其他网站下载相应资源)

解压工具包到当前目录里

接着进入conf配置目录并创建一个myjob.json(临时测试json),myjob.json内容如下,用于模拟test库tab1表数据同步到test_copy库tab1表:

写好上述模拟配置文件后,从当前目录进入conf目录​编辑然后执行数据同步,执行前两个库表数据如下​编辑

注意事项:如果执行上述同步命令的时候,无法识别pathon命令,则需要在linux服务器安装并配置python,具体如何安装及配置,请自行百度


下载datax工具包(如果下载慢,请尝试其他国内镜像站或其他网站下载相应资源)

 wget  https://datax-opensource.oss-cn-hangzhou.aliyuncs.com/202308/datax.tar.gz

解压工具包到当前目录里

tar -zxvf ../datax.tar.gz -C .

解压后工具包名为datax,进入datax目录,文件结构如下

接着进入conf配置目录并创建一个myjob.json(临时测试json),myjob.json
内容如下,用于模拟test库tab1表数据同步到test_copy库tab1表

{

  "job": {

    "setting": {

      "speed": {

        "channel": 3

      },

      "errorLimit": {

        "record": 0,

        "percentage": 0.02

      }

    },

    "content": [

      {

        "reader": {

          "name": "mysqlreader",

          "parameter": {

            "username": "root",

            "password": "root",

            "column": [

              "`id`",

              "`name`",

              "`create_time`"

            ],

            "splitPk": "",

            "connection": [

              {

                "table": [

                  "tab1"

                ],

                "jdbcUrl": [

                  "jdbc:mysql://192.168.7.231:3306/test?useSSL=false&serverTimezone=Asia/Shanghai"

                ]

              }

            ]

          }

        },

        "writer": {

          "name": "mysqlwriter",

          "parameter": {

            "username": "root",

            "password": "root",

            "column": [

              "`id`",

              "`name`",

              "`create_time`"

            ],

            "writeMode": "replace",

            "preSql": ["TRUNCATE TABLE tab1"],

            "connection": [

              {

                "table": [

                  "tab1"

                ],

                "jdbcUrl": "jdbc:mysql://192.168.7.231:3306/test_copy?useSSL=false&serverTimezone=Asia/Shanghai"

              }

            ]

          }

        }

      }

    ]

  }

}

特别参数说明

channel

控制同步速度,channel 表示并发通道数(即并行读写线程数量,根据系统资源来设定)

errorLimit>>record

最大允许错误记录数(0表示不允许任何错误)

errorLimit>>percentage

允许的错误比例上限(即总记录数的2%)

reader

读(源库)插件配置

column

源库表的列字段数组

splitPk

分片键字段名,为空表示不分片

writer

写(目标库)插件配置

writeMode

写入模式:replace 表示使用 REPLACE INTO

preSql

写入前执行的SQL语句

写好上述模拟配置文件后,从当前目录进入conf目录

然后执行数据同步,执行前两个库表数据如下

现在开始执行数据同步python datax.py ../conf/myjob.json

上图结果表示同步成功,然后查看同步后的两个库表的数据,发现已经一致了

注意事项:如果执行上述同步命令的时候,无法识别pathon命令,则需要在linux服务器安装并配置python,具体如何安装及配置,请自行百度

http://www.xdnf.cn/news/13790.html

相关文章:

  • 组合边缘提取和亚像素边缘提取
  • word表格批量转excel,提取表格数据到excel
  • 企业签名分发跟应用商城分发有什么区别
  • mysql 的卸载- Windows 版
  • 人工智能100问☞第46问:AI是如何“学习”的?
  • VR百科:实景三维重建
  • Java实现国密算法
  • windows下tokenizers-cpp编译
  • FPGA基础 -- 什么是 Verilog 的模块(`module`)
  • 再现重大BUG,微软紧急撤回Win 11六月更新
  • Karate整合PlayWright方式之playWright Driver
  • Vulkan学习笔记4—图形管线基础
  • Visual Studio 里面的 Help Viewer 提示Error: “.cab未经Microsoft签名” 问题解决
  • 【Net】OPC UA(OPC Unified Architecture)协议
  • Fastadmin报错Unknown column ‘xxx.deletetime‘ in ‘where clause
  • [算法][好题分享][第三大的数][最短无序子数组]
  • 小飞电视:智能电视与移动设备的娱乐新选择
  • Meta发布V-JEPA 2世界模型及物理推理新基准,推动AI在物理世界中的认知与规划能力
  • Python 标准库之 os 模块
  • Vue + element实现电子围栏功能, 根据省市区选择围栏, 自定义围栏 ,手动输入地名围栏, 保存围栏,清除围栏,加载围栏,批量检测标点是否在围栏内。
  • Chapter05-SSRF
  • Nodejs特训专栏-基础篇:1. Node.js环境搭建与项目初始化详细指南
  • Conda 安装 nbextensions详细教程
  • C++编程语言:标准库:STL容器(Bjarne Stroustrup)
  • 2025【证券从业】时间事件
  • CHI 总线协议及一致性总线相关的 NOC
  • c/c++ 汇编码中的.cfi 指令有什么用途?
  • (LeetCode 每日一题) 3423. 循环数组中相邻元素的最大差值 (数组)
  • Java面试避坑指南:牛客网最新高频考点+答案详解
  • Mac电脑-Office 2024 长期支持版 PPT、Excel、Word(Mac中文)