当前位置: 首页 > ds >正文

爬虫学习笔记(三)--Http协议

思维导图

上面思维导图提取的原文是2026王道计网P286~290 

URL最前面(URL传输过程中遵循HTTP协议)

协议

计算机传输的数据实际上就是二进制0和1,协议就是规定这一串二进制数字的前几位代表什么、中间几位代表什么、后几位代表什么

HTTP(超文本传输协议)-无连接、可靠

传递网站相关内容的基本都用HTTP,因为对于超文本HT进行了规定,网页源代码采用的就是超文本标记语言HTML

 HTTP报文结构

请求头常见

User-Agent:请求载体的身份标识(用什么浏览器、什么操作系统、设备访问的)

Referer:防盗链--这次请求是从哪个页面来的(反爬会用到)

cookie:本地字符串数据信息(用户登录信息,反爬的token)

响应头常见

cookie:同请求头

token字样的字符串:防止各种攻击和反爬

请求方式

get:查询--显式提交

post:更改--隐式提交

http://www.xdnf.cn/news/2804.html

相关文章:

  • CSS元素动画篇:基于页面位置的变换动画
  • leetcode 19. 删除链表的倒数第 N 个结点
  • [多彩数据结构] 笛卡尔树
  • 智能Python开发工具PyCharm v2025.1——AI层级功能重磅升级
  • Ajax 提交表单与文件上传
  • Windows 图形显示驱动-待机休眠优化
  • 升级Xcode16,flutter项目报错
  • 浏览器插件,提示:此扩展程序未遵循 Chrome 扩展程序的最佳实践,因此已无法再使用
  • jeecgboot 3.8.0 集成knife4j问题一文解决
  • MCP:如何通过模型控制推理助力AI模型实现“深度思考”?
  • 机器视觉的坐标标定
  • Python分支结构全面解析与实战应用指南
  • opendds编译开发(c#封装)
  • Android WebRTC回声消除
  • 具身智能:从理论突破到场景落地的全解析
  • 小目标检测的集成融合论文阅读
  • 项目实战-贪吃蛇大作战【补档】
  • 快速搭建对象存储服务 - Minio,并解决临时地址暴露ip、短链接请求改变浏览器地址等问题
  • 对比N+1查询和关联聚合查询
  • Spring Cloud Config 自定义配置源与动态刷新:从原理到企业级实践
  • Kafka 配置参数性能调优建议
  • 31、简要描述Promise.all的用途
  • 在 Ubuntu 22.04 x64 系统安装/卸载 1Panel 面板
  • 电子电器架构 ---电气/电子架构将在塑造未来出行方面发挥啥作用?
  • [Linux运维] [Ubuntu/Debian]在Lightsail Ubuntu服务器上安装Python环境的完整指南
  • 在线图书管理系统的结构化设计过程讲解
  • [密码学实战]SDF之设备管理类函数(一)
  • uniapp常用
  • case和字符串操作
  • 网络原理 - 10(HTTP/HTTPS - 1)