当前位置: 首页 > ds >正文

Spark jdbc写入崖山等国产数据库失败问题

随着互联网、信息产业的大发展、以及地缘政治的变化,网络安全风险日益增长,网络安全关乎国家安全。因此很多的企业,开始了国产替代的脚步,从服务器芯片,操作系统,到数据库,中间件,逐步实现信息技术自主可控,规避外部技术制裁和风险。

就数据库而言,目前很多的国产数据库,比如瀚高、人大金仓、崖山、南大通用、虚谷等,都可以逐步的取代Oracle、MySQL、PostgreSQL等。在大数据时代,我们通常通过Spark对数据进行计算,并直接输出到数据库中。但是不同的数据库中,数据类型的定义存在着一定的差异,如果直接使用Spark jdbc导入,可能会发生异常。

1.1 Spark导入数据库常见的导入方式如下:

# Saving data to a JDBC source
jdbcDF.write \.format("jdbc") \.option("url", "jdbc:postgresql:dbserver") \.option("dbtable", "schema.tablename") \.option("user", "username") \.option("password", "password") \.save()

1.2 部分数据类型不匹配或数据库不支持

  • 数据库特性:

······崖山数据库中,对于变长字符串,没有TEXT这个字段类型,与之相同含义的字段类型为CLOB。

  • sqlType和Saprk dataType不匹配:

······Spark导入geometry类型的数据,会将其识别为StringType,但是在导入虚谷数据库中,会导入失败,因为Spark未能正确的将sqlType和DataType匹配

  • 其他情况…

1.3 JdbcDialects
在spark3.5的源码中可以看到,有这么一段代码。</

http://www.xdnf.cn/news/4641.html

相关文章:

  • Linux/AndroidOS中进程间的通信线程间的同步 - 共享内存
  • AI 实践探索:辅助生成测试用例
  • 高性能轻量级Rust HTTP服务器框架Hyperlane:开启网络服务开发新体验
  • NLP核心技术解析:大模型与分词工具的协同工作原理
  • 排序算法——桶排序
  • 注意力机制(Attention)
  • 【关于ESP8266下载固件库的问题】
  • C++ 析构函数
  • 【Ollama】docker离线部署Ollama+deepseek
  • 从机器人到调度平台:超低延迟RTMP|RTSP播放器系统级部署之道
  • DeepSeek 入门:从注册到首轮对话全流程
  • Mysql如何完成数据的增删改查(详解从0到1)
  • 打造个人知识库,wsl+ollama部署deepseek与vscode集成
  • NetBox Docker 全功能部署方案(Ubuntu 22.04 + Docker)
  • k8s 中 deployment 管理的多个 pod 构成集群吗
  • PostgreSQL 查询历史最大进程数方法
  • 商汤科技前端面试题及参考答案
  • 服务器上机用到的设备
  • .net在DB First模式使用pgsql
  • K8s节点宕机自愈全流程解析
  • 【数据结构入门训练DAY-28】蓝桥杯算法提高VIP-产生数
  • 【前端基础】7、CSS的字体属性(font相关)
  • React Router Vs Vue Router
  • AGV智能搬运机器人:富唯智能引领工业物流高效变革
  • DeepSeek架构解析:从神经动力学视角解构万亿参数模型的认知涌现机制
  • 企业该如何选择合适的DDOS防护?
  • C++代码随想录刷题知识分享-----判断两个字符串是否为字母异位词(Anagram)【LeetCode 242】
  • 【论文阅读】Reconstructive Neuron Pruning for Backdoor Defense
  • C++类对象的隐式类型转换和编译器返回值优化
  • idea左侧项目资源管理器不见了处理