当前位置: 首页 > ds >正文

【创新实训个人博客】数据库搭建

 1.原因

为了降低模型使用以前训练的数据或者幻觉知识,我们在对话时需要提供相关内容的数据,同时由于需要最新的广告实时数据,实时爬取和版权问题。数据由团队在网上爬取,为了广告内容的有效性,如果长期使用,数据库需要定期几个月更新一次。

2.数据库选择

我决定搭建本地轻量级数据库sqlite提供查询,数据采用最简单的方式,

3.数据表设计

一条数据包含的内容每个都不同

例如一条数据是

{"序号": 1, "公司名称": "四川腾晟乾建筑工程有限公司", "投放平台": " 巨量广告/千川 13859 (100.00%)", "投放广告创意数": "13,859", "投放天数": 14, "最后投放时间": "2025-04-14"}

而另一类数据则不同

{"序号": 89, "开发商名称": "海南捞月狗网络科技有限公司", "旗下主推产品": " 捞月狗 747 (99.20%), 偷星猫 6 (0.80%)", "投放广告创意数": "753", "投放天数": 14, "最后投放时间": "2025-04-14"}

我们不要求更加精细的查询,这对业务毫无意义。

因此按照默认生成的row_id作为主键,file_id是每个不同的类别,可以做查询和区分,第三列data是agent需要的数据

4.最终数据库截图

http://www.xdnf.cn/news/2607.html

相关文章:

  • 03 APQC PROCESS CLASSIFICATION FRAMEWORK (PCF)
  • 《Crawl4AI 爬虫工具部署配置全攻略》
  • uniapp跨平台开发---动态控制底部切换显示
  • Spring XML 外部实体(XXE)指南:示例和预防
  • 图解模型并行框架
  • Day14(链表)——LeetCode234.回文链表141.环形链表
  • 探针台在光电行业的应用
  • 徽客松S1 | 合肥首场 AI 黑客松招募
  • 今日头条安卓版新闻推荐精准度与广告影响测评
  • Python3:Jupyter Notebook 安装和配置
  • 详实的ADC检测电路计算
  • Zabbix 7.0下postgresql 16.6数据库监控配置
  • UI 设计之色彩三色搭配原则:打造和谐视觉体验
  • ubuntu安装git及使用(本地git)
  • 高校毕业论文管理系统小程序实现
  • ASCII字符编码标准及字符表
  • ipa包安装到apple手机上
  • DuckDB:现代数据分析的“SQLite“内核革命
  • 树莓派学习专题<11>:使用V4L2驱动获取摄像头数据--启动/停止数据流,数据捕获,缓存释放
  • Kaamel白皮书:2025版COPPA落地实操指南
  • ASP.NET8.0入门与实战
  • OpenStack私有云详细介绍
  • Go语言手搓协程池
  • 11前端项目总结----详情页放大镜和轮播图
  • 基于STM32、HAL库的HX711模数转换器ADC驱动程序设计
  • TV Launcher汉化版下载-TV Launcher启动器极简pro下载
  • 【Misc】PNG宽高修改 - PNG图片宽高CRC爆破
  • 消息中间件
  • 传统行业的数字化转型:如何通过RTMP推流技术提升实时直播体验
  • Spring MVC 请求映射处理:@RequestMapping 与 @Pathvariable