当前位置: 首页 > news >正文

AI写代码之GO+Python写个爬虫系统

下面我们我们来利用AI,来用GO+Python写个爬虫系统。

帮我写一个Python语言爬取数据写入Mysql的案例,信息如下:
1、Mysql数据库地址是:192.168.1.20 ,mysql用户名是:root, Mysql密码是:123456,要操作
的数据库是:ginxiaomi
2、要爬取的网址是http://bbs.itying.com/
3、需要把爬取的每一条新闻信息写入到artice表,article表有id,title,status字段
pip install requests beautifulsoup4 pymysql
import requests
from bs4 import BeautifulSoup
import pymysql
# 数据库连接配置
db_config = {
'host': '192.168.1.20',
'user': 'root',
'password': '123456',
'database': 'ginxiaomi',
'charset': 'utf8mb4',
'cursorclass': pymysql.cursors.DictCursor
}
# 连接到MySQL数据库
connection = pymysql.connect(**db_config)
try:
with connection.cursor() as cursor:
# 假设URL
url = 'http://bbs.itying.com/'
# 发送HTTP请求
response = requests.get(url)
response.raise_for_status() # 如果请求失败,抛出HTTPError异常
# 解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 假设每个新闻项都在一个class为'news-item'的div中
news_items = soup.find_all('div', class_='topic_title_wrapper')
for item in news_items:
# 假设每个新闻项有title和status(这里status可能需要根据实际页面结构进行调整)
title = item.find('a').get_text(strip=True) if item.find('a') else ''
status = '1' # 假设每个新闻都是激活状态,具体需要根据实际页面调整
# 插入数据到MySQL
sql = "INSERT INTO article (title, status) VALUES (%s, %s)"
cursor.execute(sql, (title, status))
# 提交事务
connection.commit()
print(cursor.rowcount, "record inserted.")
finally:
connection.close()
print("Done.")

不了解AI基础知识的同学可能看不懂,可以看看下面的视频了全面来了解,通过对AI的学习,我们会发现AI的能力远超我们的想象。(说明:前1-9讲是DeepSeek学习内容,需要全面学习AI编程的话可以从第10讲开始学)

【2025年新版】DeepSeek教程

前面我们也有详细分析Prompt提示词在多个领域的应用,从热点追踪、活动策划、文章撰写及实体抽取,到内容解释与优化、评论与说说创作,再到结合AI助手生成短视频;同时,Prompt提示词还可以快速辅助完成周报、简历、邮件及情书等文档撰写,并有效整理文档资料。针对运营编辑岗位,课程提供了文案支持、内容审核与舆情分析、数据分析及商业计划书撰写的Prompt技巧。此外,还深入讲解了利用Prompt生成PPT、思维导图,以及借助Mermaid.js生成图表、流程图、序列图、时间线图的方法。在编程领域,课程涵盖了AI编写前端、Flutter、嵌入式及Python、Go、Node.js等多种语言代码的Prompt应用,并扩展到Nodejs、Golang、Python结合MYSQL的Prompt爬虫系统开发。最后,课程还传授了AI编程Prompt技巧,包括接口文档生成、代码解释、代码与注释生成、语法检查、服务器命令解析、错误排查咨询,以及简历、报告、周报等文档撰写的Prompt高效方法,助力学员在任何场景中能游刃有余的使用Prompt Engineering。

http://www.xdnf.cn/news/83143.html

相关文章:

  • 基于 PaddleOCR对pdf文件中的文字提取
  • 深度学习4月22笔记
  • [翻译]从 unique 到 cleanups 和 weak:高效的新底层工具
  • 生产环境大数据平台权限管理
  • Neo4j 可观测性最佳实践
  • Vue指令详解:从入门到精通
  • BBR 的 minRTT 采集问题
  • 二叉树层序遍历技术解析与面试指南
  • 根据极点-零点分布进行状态空间模型降阶
  • 火山RTC 5 转推CDN 布局合成规则
  • 2024年ESWA SCI1区TOP:量子计算蜣螂算法QHDBO,深度解析+性能实测
  • 【简单学习】llamaindex环境搭建以及构建RAG
  • 真实趋势策略思路
  • 高并发秒杀使用RabbitMQ的优化思路
  • Vue2-重要知识点
  • Reflex 完全指南:用 Python 构建现代 Web 应用的终极体验
  • SpringCloud组件—Eureka
  • 面向组织的网络安全措施
  • 详解Node.js中的setImmediate()函数
  • 智慧城市新标配:苏州金龙无人清扫车开启城市清洁“智”时代
  • C++(初阶)(十二)——stack和queue
  • Web网页核心技术解析:从结构到节点操作
  • 大模型学习笔记------Llama 3模型架构之分组查询注意力(GQA)
  • [Git] Git Stash 命令详解
  • 【MATLAB第115期】基于MATLAB的多元时间序列的ARIMAX的预测模型
  • 线缆屏蔽与浪涌测试
  • Linux中查询进程服务,通过端口方式关闭
  • C++模板学习(进阶)
  • PH热榜 | 2025-04-22
  • 客户端本地搭建