当前位置: 首页 > java >正文

2025年如何批量下载雪球帖子和文章导出pdf?

之前分享过雪球文章下载 2025 批量下载市场高标解读/配置喵/wangdizhe 雪球帖子/文章导出excel和pdf

这里以市场高标解读这个号为例 

图片

抓取下载的所有帖子excel数据包含文章日期,文章标题,文章链接,文章简介,点赞数,转发数,评论数等,第一个帖子发布于2021年  ,评论数最高(3444)的帖子是 ,转发数最高(427)的帖子是 

图片

雪球帖子目录包含发布时间和标题,点击跳转到对应帖子。

图片

下载的所有帖子内容html:

图片

下载的所有帖子内容pdf:

图片

最后合并成一个pdf文件,大小173MB,效果见网盘 https://pan.quark.cn/s/a95c2f5494ea 

图片

点击左侧书签可以跳转到对应帖子。

图片

还有狂龙十八段这个号 

图片

下载所有帖子html内容:

图片

用我开发的pdf工具批量转换为pdf   苏生不惑开发过的软件工具整理

图片

图片

最后将所有pdf 合并为一个带书签的pdf文件,大小148MB,效果见网盘 https://pan.quark.cn/s/a95c2f5494ea

图片

图片

点击左侧书签目录可跳转到对应帖子。

图片

顺便导出所有帖子excel,数据包含雪球链接,时间,评论数,点赞数,转发数等。

图片

评论数最高的帖子是2016年的这个  。

图片

第一个帖子发布于2016年。

图片

下载东方财富的帖子和文章也是一样的,最后合并所有pdf生成一个pdf合集,大小550MB,效果见网盘  https://pan.quark.cn/s/70683e6c627a

点击左侧书签可跳转对应帖子 。

图片

http://www.xdnf.cn/news/19244.html

相关文章:

  • 每日Java并发面试系列(5):基础篇(线程池的核心原理是什么、线程池大小设置为多少更合适、线程池哪几种类型?ThreadLocal为什么会导致内存泄漏?)
  • web渗透PHP反序列化漏洞
  • 设计模式 - 静态工厂模式 + 策略模式,
  • 【一】Django框架版本介绍
  • k8s 定时任务需求模板
  • 手动安装的node到nvm吧版本管理的过程。
  • GaussDB生产扩容引起的PANIC问题处理案例
  • HarmonyOS元服务开发
  • HarmonyOS三方库的使用
  • 计算机毕业设计 java 在线学习系统 基于 Java 的在线教育平台 Java 开发的学习管理系统
  • MongoDB 源码编译与调试:深入理解存储引擎设计 内容详细
  • 【办公类-39-06】20250830通义万相水果图(万相2.1专业Q版线描风格+万相专业2.2默认简笔画效果)
  • 淘宝利用商品关键词获取商品信息指南
  • GRPO(组相对策略优化):大模型强化学习的高效进化
  • 最强分布式锁工具:Redisson
  • Ztero文献管理工具插件设置——亲测有效
  • 【YOLO11小目标改进】多尺度前馈网络(MSFN)代码
  • Java全栈工程师的实战面试:从基础到微服务
  • 当“循环经济”遇上“小程序”,旧物回收正迎来“智慧”升级
  • 【C++】AVL树(详解)
  • 使用Python和GitHub构建京东数据自动化采集项目
  • 《动手学深度学习v2》学习笔记 | 2.3 线性代数
  • SQL语言增删改查之C与R
  • ​Windows8.1-KB2934018-x64.msu 怎么安装?Windows 8.1 64位补丁安装教程​(附安装包下载)
  • DP1.4 8K验证平台
  • 双指针:从「LC11 盛最多水的容器」到「LC42 接雨水」
  • 创维E910V10C_海思MV100芯片_优盘强刷卡刷固件包
  • 中级统计师-统计实务-第二章 统计调查设计
  • Mybatis 实现分页查询总结
  • shell命令扩展