当前位置：首页 > news >正文

【Python - 类库 - BeautifulSoup】（01）“BeautifulSoup“使用示例

news 2025/9/6 17:23:56

BeautifulSoup 是一个用于解析 HTML 和 XML 文档的 Python 库，常用于网页抓取和数据提取。以下是使用 BeautifulSoup 解析网页内容的基本示例。

from bs4 import BeautifulSoup
import requests# 获取网页内容
url = 'https://example.com'
response = requests.get(url)# 使用 BeautifulSoup 解析 HTML
soup = BeautifulSoup(response.text, 'html.parser')# 提取网页标题
title = soup.find('title').get_text()
print("网页标题:", title)# 查找所有链接
links = soup.find_all('a')
for link in links:print("链接:", link.get('href'))

解析器选择

html.parser 是 Python 内置的解析器，适合简单任务。如果需要更高性能，可以安装并使用 lxml。

常用方法

find(): 查找第一个匹配的标签。
find_all(): 查找所有匹配的标签。
get_text(): 提取标签内的文本内容。
get(): 获取标签属性值。

注意事项

确保安装了 beautifulsoup4 和 requests 库：

pip install beautifulsoup4 requests

对于复杂 HTML 结构，建议结合浏览器开发者工具定位目标元素。

通过以上方法，您可以轻松提取网页中的所需数据。

http://www.xdnf.cn/news/1472293.html

相关文章：

ESP-idf注册双服务器配置

SemiSAM+：在基础模型时代重新思考半监督医学图像分割|文献速递-深度学习人工智能医疗图像

笔记：现代操作系统：原理与实现（2）

【C++】Vector完全指南：动态数组高效使用

Transformer核心—自注意力机制

大批项目经理被迫上前线，酸爽

图片在vue2中引用的方式和优缺点

【数字孪生核心技术】什么是倾斜摄影？

遇到 Git 提示大文件无法上传确实让人头疼

SVT-AV1编码器中实现WPP依赖管理核心调度

门控MLP(Qwen3MLP)与稀疏混合专家(Qwen3MoeSparseMoeBlock)模块解析

【开题答辩全过程】以基于JSP的宠物医院管理系统设计为例，包含答辩的问题和答案

LTV-1008-TP1-G 电子元器件 LiteOn光宝发光二极管核心解析

字符串（2）

一文读懂 RAG 与 KAG：原理、工程落地与开源实战

scrypt 密钥派生算法（RFC7914）技术解析及源码示例

流固耦合|08-1外部数据导入

基于Django+Vue3+YOLO的智能气象检测系统

【Python - 类库 - requests】（02）使用“requests“发起GET请求的详细教程

Markdown Editor开发文档（附下载地址）

深度学习模型在边缘计算设备上的部署

python库 Py2exe 的详细使用（将 Python 脚本变为Windows独立软件包）

孙宇晨被质疑“砸盘”川普家族项目WLFI，惨遭拉黑锁仓？自称无辜展开“维权”！

Process Explorer 学习笔记（第三章3.3.1）：DLL和句柄

C++中的Reactor和Proactor模型进行系统性解析

2025经管领域十大高含金量证书推荐

Redis 集群：连锁银行的 “多网点智能协作系统”

2025 IT行业含金量超高的8大证书推荐