当前位置: 首页 > java >正文

抖音 pc + 翻页

代码实现步骤:

request模块

1.发送请求模拟浏览器对于url地址发送请求

2.获取数据:获取服务器返回响应数据

3.解析数据:提取我们需要的数据内容

4.保存数据:把提取出来的数据保存到本地文件中

drissionpage模块

自动化模块:模拟人的行为对于浏览器进行操作

1.打开浏览器,访问网站

2.获取数据

3.解析数据

4.保存数据

drissionpage官方文档:DrissionPage官网https://www.drissionpage.cn/运行代码如下:

from DrissionPage import ChromiumPage
import requestsheaders = {'referer':'https://www.douyin.com/','user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/137.0.0.0 Safari/537.36'}
dp = ChromiumPage()dp.listen.start('web/aweme/post/')  # 监听
# 访问网站
dp.get('https://www.douyin.com/user/MS4wLjABAAAAx7--dRYA0mPwhwvxNJ-35i6sB8d1Kv4Sj1WmugquqiHK19QYlB18Ikx6cECT1RVO?from_tab_name=main')for page in range(1, 11):r = dp.listen.wait()  print(f'正在采集第{page}页')json_data = r.response.bodyinfo_list = json_data['aweme_list']for index in info_list:try:# 标题title = index['desc']# 视频链接video_url = index['video']['play_addr']['url_list'][0]# 视频idvideo_id = index['aweme_id']video_content = requests.get(url=video_url, headers=headers).contentwith open(f'video\\{title}---{video_id}.mp4', 'wb') as f:f.write(video_content)print(title, video_url, video_id)except:passdp.scroll.to_see('css:.ayFW3zux')

http://www.xdnf.cn/news/14226.html

相关文章:

  • C#最佳实践:推荐使用泛型而非装箱、拆箱
  • 60、数据访问-数据库场景的自动配置分析与整合测试
  • c++26新功能—契约编程
  • 单测时如何让 mock 的接口在长链路调用时一直生效
  • 从STM32到NXP:GPIO就像装修房子,多了个“智能开关”
  • 基于 SpringBoot+Servlet+JSP 的医院医保管理系统的设计与实现,论文7000字,可根据实际情况调整
  • ES+索引库文档操作
  • [CVPR 2025] DiCo:动态协作网络助力半监督3D血管分割新突破
  • AI Agent实战 - LangChain+Playwright构建火车票查询Agent
  • 人工智能学习28-BP过拟合
  • [k8s]--exec探针详细解析
  • java常见第三方依赖以及相关安全问题
  • http1.x VS http2.x 协议
  • Spring Cloud Alibaba 中间件
  • 硬编码(修改RIP相关指令)
  • HTML+CSS 半透明登录框
  • (LeetCode每日一题) 2566. 替换一个数字后的最大差值 ( 贪心 )
  • 安防市场的中小企业突围——从竞品分析到破局路径的思考
  • Spring Boot中Controller层规划与最佳实践详解
  • 【北京迅为】iTOP-4412精英版使用手册-第二十一章 延时函数专题
  • Python爬虫-批量爬取快手视频并将视频下载保存到本地
  • BeckHoff PLC --> 料筐(KLT Box)自动对中与抓取程序分析
  • Deep Research Agent的深度与广度如何保证
  • OSGI 是什么,有哪些具体应用、java8、9、10、11比较
  • C++操作系统与网络编程(针对特定岗位)
  • SpringBoot打包运行原理和加载机制原理
  • 从大数据到大模型:我们是否在重蹈覆覆辙
  • 一文详解前缀和:从一维到二维的高效算法应用
  • Java相关-链表-设计链表-力扣707
  • JS进阶 Day02