【dtcc】数据库 随笔
数据库百花齐放,竞争逐渐白热化。各家数据库战场逐渐清晰。小公司的市场份额逐渐被挤压。
技术路线上:
基于开源数据库二开:由于数据库原厂的更新迭代速度快。或者不断提pr,原厂新版merge。或者稳定在固定版本独立做分支。或者把原厂数据库作为数据层,自己开发分布式能力。甚至有些帮助原厂重写代码。
基于代码自研:大型公司的必由之路,研发团队庞大、资金实力要求高。出产品慢、稳定性需要大量客户打磨。
部署模式上:
云原生:懂得利用云的硬件优势,serverless、内存共享、多客户资源共享、存储共享,内存非易失、gpu、高性能高压缩磁盘等。花钱少,性能高。阿里云polardb、腾讯云tdsql、Amazon Aurora、snowflake等。
云中立:主打对各家云的信任度、捆绑度问题。
线下私有化部署(包括私有云):数据安全要求高、大公司有自建机房、数据库团队技术能力强,主打易用性、稳定性、工具齐全。
需求上:
tp:
测重于降本、信创、高并发、高扩展,当然稳定性优先。oracle、sql server、db2,基本快没了,除了换不动的erp,线下传统制造业,医疗等场景,基本都在国产化的洪流中逐渐消失。典型代表:mysql(包括各家rds)、postregres、oceanbase、tdsql、高斯、人大金仓、达梦、崖山等。
htap:
测重于数据tp、ap,数据一致,中间减少同步链路,自动路由,降低业务负担。典型代表:tidb、oceanbase、polardb等
big data:
测重于湖仓一体,serverless,海量数据,组件兼容性好,存算分离,高性能省心不宕机。典型代表:holo、starrocks、doris、databricks,以及湖Delta、Hudi、Iceberg等
ai:
云上,大模型自运维占据主流市场,业务无需关注大模型细节,作为使用方,数据库自然也不必关心。
云下,自建向量库基本以组件自带为主,业务倾向于成熟完整解决方案。
在海量、高并发、核心、开发能力强的公司及业务场景,向量库竞争激烈,基本买定离手,现阶段几乎没有替换需求。