当前位置：首页 > ds >正文

Spark jdbc写入崖山等国产数据库失败问题

ds 2025/7/2 2:54:02

随着互联网、信息产业的大发展、以及地缘政治的变化，网络安全风险日益增长，网络安全关乎国家安全。因此很多的企业，开始了国产替代的脚步，从服务器芯片，操作系统，到数据库，中间件，逐步实现信息技术自主可控，规避外部技术制裁和风险。

就数据库而言，目前很多的国产数据库，比如瀚高、人大金仓、崖山、南大通用、虚谷等，都可以逐步的取代Oracle、MySQL、PostgreSQL等。在大数据时代，我们通常通过Spark对数据进行计算，并直接输出到数据库中。但是不同的数据库中，数据类型的定义存在着一定的差异，如果直接使用Spark jdbc导入，可能会发生异常。

1.1 Spark导入数据库常见的导入方式如下：

# Saving data to a JDBC source
jdbcDF.write \.format("jdbc") \.option("url", "jdbc:postgresql:dbserver") \.option("dbtable", "schema.tablename") \.option("user", "username") \.option("password", "password") \.save()

1.2 部分数据类型不匹配或数据库不支持

数据库特性：

······崖山数据库中，对于变长字符串，没有TEXT这个字段类型，与之相同含义的字段类型为CLOB。

sqlType和Saprk dataType不匹配：

······Spark导入geometry类型的数据，会将其识别为StringType，但是在导入虚谷数据库中，会导入失败，因为Spark未能正确的将sqlType和DataType匹配

其他情况…

1.3 JdbcDialects
在spark3.5的源码中可以看到，有这么一段代码。</

http://www.xdnf.cn/news/4641.html

相关文章：

Linux/AndroidOS中进程间的通信线程间的同步 - 共享内存

AI 实践探索：辅助生成测试用例

高性能轻量级Rust HTTP服务器框架Hyperlane：开启网络服务开发新体验

NLP核心技术解析：大模型与分词工具的协同工作原理

排序算法——桶排序

注意力机制（Attention）

【关于ESP8266下载固件库的问题】

C++ 析构函数

【Ollama】docker离线部署Ollama+deepseek

从机器人到调度平台：超低延迟RTMP|RTSP播放器系统级部署之道

DeepSeek 入门：从注册到首轮对话全流程

Mysql如何完成数据的增删改查(详解从0到1)

打造个人知识库，wsl+ollama部署deepseek与vscode集成

NetBox Docker 全功能部署方案（Ubuntu 22.04 + Docker）

k8s 中 deployment 管理的多个 pod 构成集群吗

PostgreSQL 查询历史最大进程数方法

商汤科技前端面试题及参考答案

服务器上机用到的设备

.net在DB First模式使用pgsql

K8s节点宕机自愈全流程解析

【数据结构入门训练DAY-28】蓝桥杯算法提高VIP-产生数

【前端基础】7、CSS的字体属性（font相关）

React Router Vs Vue Router

AGV智能搬运机器人：富唯智能引领工业物流高效变革

DeepSeek架构解析：从神经动力学视角解构万亿参数模型的认知涌现机制

企业该如何选择合适的DDOS防护？

C++代码随想录刷题知识分享-----判断两个字符串是否为字母异位词（Anagram）【LeetCode 242】

【论文阅读】Reconstructive Neuron Pruning for Backdoor Defense

C++类对象的隐式类型转换和编译器返回值优化

idea左侧项目资源管理器不见了处理