当前位置: 首页 > news >正文

old kali网站下载链接爬取-Kali linux 全部版本镜像下载--Index of /kali-images

Kali linux 全部版本镜像下载

目的

出于该网站不稳定原因,故爬取下载链接,以便网友下载老版本kali

from bs4 import BeautifulSoup
import requests
from urllib.parse import urljoinbase_url = "http://old.kali.org/kali-images/"
visited = set()def crawl(url, f):if url in visited:returnvisited.add(url)headers = {"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/122.0.0.0 Safari/537.36"}try:res = requests.get(url, headers=headers, timeout=10)res.raise_for_status()except Exception as e:print(f"Failed to access {url}: {e}")returnsoup = BeautifulSoup(res.text, "html.parser")for link in soup.find_all("a"):href = link.get("href")if not href or href.startswith("?") or href.startswith("#"):continuefull_url = urljoin(url, href)if href.endswith("/"):crawl(full_url, f)  # 递归进入子目录elif href.endswith((".iso", ".torrent", ".txt", ".zsync", ".sha256sum")):print(f"Found: {full_url}")f.write(full_url + "\n")f.flush()  # 立即写入硬盘(防止崩溃丢失)if __name__ == "__main__":with open("kali_download_links.txt", "w") as f:crawl(base_url, f)print("\n已完成下载链接写入:kali_download_links.txt")

爬取页面

提取 下载链接  百度网盘

http://www.xdnf.cn/news/412939.html

相关文章:

  • 基于STM32、HAL库的DPS368XTSA1气压传感器 驱动程序设计
  • [Windows] Honeyview V5.53
  • 深度解析Crawl4AI:面向大模型的新一代智能爬虫
  • 2025系统架构师考试押题总结
  • 学习黑客Windows 任务管理器详解
  • 解决WSL、Ubuntu的.ico图标不正确显示缩略图
  • VBA会被Python代替吗
  • LeetCode:513、找树左下角的值
  • 滑动窗口/单调队列
  • [网络层]ICMP协议
  • Java——API基础(String类和StringBuilder类)
  • 手写 vue 源码 === computed 实现
  • JavaScript高级进阶(七)
  • shell命令大全
  • 基于STM32、HAL库的BMP581气压传感器 驱动程序设计
  • springBoot中的Starter-启动器
  • 重学安卓14/15自由窗口freeform企业实战bug-学员作业
  • 本地文件查重管理工具EasyFileCount v3.0.5.1绿色版,支持查找大重复文件+自动分类
  • 客户端限流主要采用手段:纯前端验证码、禁用按钮、调用限制和假排队
  • jwt学习
  • 如何通过DNS解析实现负载均衡?
  • Android Exoplayer 实现多个音视频文件混合播放以及音轨切换
  • 3d模型的添加与设置
  • VMware虚拟机实例-docker启动失败
  • Linux文件编程——read函数与lseek函数
  • 火狐浏览器安装自定义插件
  • 人工智能的哲学与社会影响
  • 【时时三省】(C语言基础)字符数组的输入输出
  • 做好的QT软件,换一个笔记本打开后发现字体很小,部分字体还被控件遮挡
  • 提示工程实战指南:Google白皮书关键内容一文讲清