当前位置: 首页 > backend >正文

Python 常用库速查手册

一句话宗旨:Python 之所以被称为“胶水语言”,就是因为它能把各领域的库粘在一起干活。本手册分类介绍常用库、功能简述、核心 API 以及最小可用代码,让你在写代码时一查就能用。
适用人群:爬虫工程师、数据分析师、AI 工程师、自动化运维、科研人员、Python 开发者。

1. 网络请求与爬虫类

1.1 requests — 人类友好的 HTTP 客户端

import requests# GET 请求
r = requests.get("https://httpbin.org/get", params={"q": "python"})
print(r.status_code, r.json())# POST 请求
r = requests.post("https://httpbin.org/post", data={"name": "Tom"})
print(r.text)# 带会话(保持 Cookie)
s = requests.Session()
s.get("https://example.com/login")

简单直观、支持 SSL、代理、Cookie、文件上传、会话保持。

1.2 aiohttp — 异步 HTTP 请求

import aiohttp, asyncioasync def fetch(url):async with aiohttp.ClientSession() as s:async with s.get(url) as resp:return await resp.text()asyncio.run(fetch("https://httpbin.org/get"))

高并发请求,爬虫性能提升 10 倍。

1.3 httpx — 现代化异步 HTTP 客户端

import httpx
with httpx.Client() as client:r = client.get("https://httpbin.org/get")print(r.json())

支持 HTTP/1.1、HTTP/2,兼容同步 + 异步,requests 升级替代品。

1.4 beautifulsoup4 — HTML 解析神器

from bs4 import BeautifulSoup
html = "<div><p>Hello <b>Python</b></p></div>"
soup = BeautifulSoup(html, "html.parser")
print(soup.find("b").text)

API 直观,支持 HTML、XML,多解析器。

1.5 lxml — XPath 提取

from lxml import etree
html = "<div><p>Hello <b>Python</b></p></div>"
tree = etree.HTML(html)
print(tree.xpath("//b/text()"))

解析速度快,XPath 灵活,适合复杂页面。

1.6 selenium — 浏览器自动化

from selenium import webdriver
driver = webdriver.Chrome()
driver.get("https://www.python.org")
print(driver.title)
driver.quit()

支持 Chrome/Firefox 等真实浏览器,处理 JS 渲染页面。

1.7 playwright — 新一代浏览器自动化

from playwright.sync
http://www.xdnf.cn/news/17835.html

相关文章:

  • 如何使用亚马逊云科技EC2服务部署语音转写系统
  • 【算法专题训练】13、回文字符串
  • webrtc编译arm/arm64
  • STM32 - Embedded IDE - GCC - 显著减少固件的体积
  • 鸿蒙任务调度机制深度解析:优先级、时间片、多核与分布式的流畅秘密
  • 【开发语言】Groovy语言:Java生态中的动态力量
  • 【Cuda 编程思想】LinearQaunt-分块量化矩阵乘法计算过程
  • 从零到一:发布你的第一个 npm 开源库(2025 终极指南)
  • Shortest Routes II(Floyd最短路)
  • 数据结构初阶(15)排序算法—交换排序(快速排序)(动图演示)
  • Docker 缓存优化:通过 cpolar 内网穿透服务远程管理 Redis
  • C语言零基础第17讲:数据在内存中的存储
  • 新手向:Python函数定义与参数传递(位置参数、关键字参数、默认参数)
  • Redis 实用型限流与延时队列:从 Lua 固定/滑动窗口到 Streams 消费组(含脚本与压测)
  • 眺望电子RK3588_SDIO_WiFi_Support List更新
  • nodejs03-常用模块
  • LeetCode 53.最大子数组和:贪心算法下的连续子数组最优解
  • 【测试用例】
  • STM32 - Embedded IDE - GCC - 解决LWRB库在GCC编译器会编译失败,在ARMCC编译器时却正常编译
  • 肖臻《区块链技术与应用》第16讲 - 以太坊的“世界状态”:从哈希表到MPT架构演进
  • 安装openmmlab时出错
  • IStoreOS(OpenWrt)开启IPV6
  • LeetCode 刷题【42. 接雨水】
  • 大规模Go网络应用的部署与监控实战指南
  • python30-正则表达式
  • 应急救援智能接处警系统——科技赋能应急,筑牢安全防线
  • 线程P5 | 单例模式[线程安全版]~懒汉 + 饿汉
  • 从0开始学习Java+AI知识点总结-15.后端web基础(Maven基础)
  • UI-TARS-Desktop 产品发展史:从实验室原型到企业级解决方案
  • 流处理、实时分析与RAG驱动的Python ETL框架:构建智能数据管道(中)