当前位置：首页 > news >正文

第一个简单的爬虫

news 2025/6/14 13:33:37

Python爬虫的流程：获取网页，解析网页，存储数据

from bs4 import BeautifulSoup
import requests

#获取百度网页
link = "https://www.baidu.com"
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.5845.97 Safari/537.36 SE 2.X MetaSr 1.0'}
response = requests.get(link,headers=headers)

#解析网页，提取需要的数据
soup = BeautifulSoup(response.text,"html.parser")
title = soup.find("title")
print(title.text)

#存储数据到TXT文件

with open('test.txt',"a+") as f:
f.write(title.text)

http://www.xdnf.cn/news/1002259.html

相关文章：

一起了解--CAST函数

C++上学抄近路动态规划算法实现 CCF信息学奥赛C++ 中小学普及组 CSP-J C++算法案例学习

Spring Boot 项目中如何划分事务边界，避免长事务？

yolo11学习笔记

ajax访问阿里云天气接口，获取7天天气

get_attribute的使用方法

【小根堆】P9557 [SDCPC 2023] Building Company|普及+

Spring Cloud Gateway + OAuth2 + JWT 单点登录(SSO)实现方案

Java八股文——MySQL「SQL 基础篇」

随记：sw2urdf插件导出urdf模型在ROS2-rviz2显示

在Vue2项目中引入ElementUI详细步骤

Linux系统下安装elasticsearch6.8并配置ik分词

【Java】浅谈ScheduledThreadPoolExecutor

Python实战应用-Python实现Web请求与响应

智能合约的浪潮：从区块链到业务自动化的 IT 新引擎

服务器-客户端下kafka的消息处理流程

Vue3+PDF.js 实现高性能 PDF 阅读器开发实战

C# 动态管理控件和事件，批量查询管理同类控件

JavaWeb期末速成 JSP

浅谈DaemonSet

PRIMES“中国校准实验室”正式运营，携手东隆科技共筑精准测量新标准

通过同步压缩小波变换实现信号的分解和重构

概率论几大分布的由来

基于STM32汽车温度空调控制系统

Unity-通过Transform类学习迭代器模式

数据集-目标检测系列- 孔雀数据集 peacock ＞＞ DataBall

FFmpeg 压缩视频文件

力扣HOT100之技巧：136. 只出现一次的数字

C#调用C++ 结构体方法