爬取百度翻译页面信息
以POST方法发送JSON数据,爬取响应信息,并且需要对响应信息对象类型进行区分。

import requests
import json#1.指定url
post_url = 'https://fanyi.baidu.com/sug'#2.进行UA封装
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:103.0) Gecko/20100101 Firefox/103.0'
}#3.post请求参数处理(同get请求一致)
word = input('enter a word:')
data = {'kw':word
}#4.请求发送
response = requests.post(url=post_url,data=data,headers=headers)#5.获取响应数据:json()方法返回的是obj(如果确认响应数据是json类型的,才可以使用json()方法
dic_obj = response.json()#6.持久性存储,可自行设置存储路径及文件名
fileName = word+'.json'
fp = open(fileName,'w',encoding='utf-8')
json.dump(dic_obj,fp=fp,ensure_ascii=False)print('over!!!')

响应对象类型
服务器返回的响应数据,本质上是「一串字节流」,但按用途和格式可以分成几大类:
1. 文本类(人类可读)

类型MIME 类型(Content-Type例子用途
HTMLtext/html<html>...网页结构
纯文本text/plainHello World简单文本
JSONapplication/json{"name":"Tom"}API 数据交换
XMLapplication/xml<user><name>Tom</name></user>老派 API、配置文件
CSVtext/csvname,age\nTom,18表格数据
CSS/JStext/css, application/javascript.btn{color:red}样式和脚本

2. 二进制类(不可直接读,需解析)

类型MIME 类型例子用途
图片image/jpeg, image/png, image/webp二进制图片流展示图片
音频/视频audio/mp3, video/mp4二进制媒体流播放媒体
文件下载application/octet-streamfile.zip任意文件下载
字体文件font/woff2二进制字体网页字体
Protobufapplication/x-protobuf二进制序列化数据高效接口通信

3. 压缩或编码过的数据
Gzip/Deflate/Brotli:响应头 Content-Encoding: gzip,数据被压缩,需先解压。
分块传输:响应头 Transfer-Encoding: chunked,数据被分块发送,需拼接。

4. 空数据
状态码 204 (No Content):成功但无返回体,比如某些 DELETE 请求。

如何判断类型?
看响应头里的两个关键字段:

Content-Type: application/json; charset=utf-8
Content-Encoding: gzip

Content-Type 告诉你「数据格式」。
Content-Encoding 告诉你「是否压缩」。

响应数据可以是「任何你能用浏览器打开的东西」——从网页、JSON、图片、视频,到压缩包、字体、音频流,甚至空响应。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/91145.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/91145.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/91145.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++进阶】第8课—红黑树封装map和set

文章目录1. map和set的源码及框架分析2. 模拟实现map和set2.1 实现可以复用红黑树的框架&#xff0c;支持insert操作2.2 实现迭代器iterator2.2.1 实现迭代器2.2.2 实现迭代器 - -2.2.3 解决key不能修改的问题2.2.4 重载operator[ ]3. 完整代码3.1 红黑树头文件RBTree.h3.2 mym…

【机器学习深度学习】DeepSpeed框架:高效分布式训练的开源利器

目录 前言 一、DeepSpeed 简介 1.1 定位与目标 1.2 集成生态 二、核心技术解析 2.1 ZeRO&#xff08;Zero Redundancy Optimizer&#xff09; 2.2 显存优化技术 2.3 推理优化与通信机制 三、DeepSpeed 的优势与特性总结 四、 典型应用场景 &#x1f9e0; 大模型训练…

从视觉到现实:掌握计算机视觉技术学习路线的十大步骤

成长路上不孤单&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;&#x1f60a;【14后&#x1f60a;///计算机爱好者&#x1f60a;///持续分享所学&#x1f60a;///如有需要欢迎收藏转发///&#x1f60a;】今日分享关于计算机视觉技术学习路线方面的相关内容…

DeepSeek MoE 技术解析:模型架构、通信优化与负载均衡

1. MoE 简介 MoE&#xff08;Mixed Expert Models&#xff09;&#xff0c;混合专家模型。在 Transformer 的 FFN 中&#xff0c;有一个重要的观察是&#xff0c;其计算过程中的神经元激活是非常稀疏的&#xff0c;在一次计算中只有 90%的输入激活不到 5%的神经元&#xff0c;…

【Linux】pthread学习笔记

1. 线程基础(1) 线程创建与终止#include <pthread.h> // 创建线程 int pthread_create(pthread_t *thread, const pthread_attr_t *attr,void *(*start_routine)(void*), void *arg); // 终止当前线程 void pthread_exit(void *retval); // 等待线程结束 int pthread_joi…

p5.js 从零开始创建 3D 模型,createModel入门指南

点赞 关注 收藏 学会了 如果你已经开始探索 p5.js 的 3D 世界&#xff0c;那么createModel()这个 API 绝对是你需要掌握的强大工具。它允许你创建自定义的 3D 几何模型&#xff0c;为你的创意提供无限可能。 什么是 createModel ()&#xff1f; createModel() 用于从一个…

react 的 useTransition 、useDeferredValue

useTransition 用于 管理状态更新的过渡&#xff08;pending&#xff09;状态&#xff0c;避免因高优先级任务&#xff08;如用户输入&#xff09;被低优先级任务&#xff08;如数据获取或复杂计算&#xff09;阻塞而导致的界面卡顿。 它特别适用于&#xff0c;需要 区分紧急更…

Unity的GameObject.Instantiate的使用

在Unity游戏引擎中&#xff0c;GameObject.Instantiate 是一个核心方法&#xff0c;用于在运行时动态创建游戏对象的副本。它常用于实例化预制体&#xff08;Prefab&#xff09;&#xff0c;例如生成敌人、子弹或场景元素。以下是其使用方法的详细说明&#xff0c;包括语法、参…

【CSS】盒子类型

CSS盒子模型是网页布局的核心基础&#xff0c;每个HTML元素都被视为一个矩形盒子&#xff0c;由​​内容&#xff08;Content&#xff09;、内边距&#xff08;Padding&#xff09;、边框&#xff08;Border&#xff09;、外边距&#xff08;Margin&#xff09;​​四部分组成。…

《嵌入式C语言笔记(十五):字符串操作与多维指针深度解析》

1.字符串与指针安全操作核心函数与陷阱函数功能安全替代功能strcpy字符串拷贝strncpy复制前n个&#xff0c;最多strlen个&#xff0c;超出有效长度&#xff0c;按原样复制strcat字符串拼接strncatdest只连接src的前n个&#xff0c;如果n超过有效长度&#xff0c;按原样链接strc…

每日学习笔记记录(分享更新版-凌乱)

函数和变量都需要满足&#xff1a;先声明后使用&#xff08;重要&#xff09;在 函数的声明中&#xff0c;形参的名字可以省略函数的定义是一种特殊的是声明&#xff0c;比声明更加强大&#xff1b;函数使用前必须进行声明&#xff0c;但不必要声明具体定义.h——函数的声明.c—…

Windows提权(MS09-012 巴西烤肉)

演示环境&#xff1a;windows-2003前提&#xff1a;提权的前提条件是拿到服务器的webshell演示以iis的中间件解析漏洞为例&#xff08;test.asp;.jpg&#xff09; Windows提权拿到webshell之后&#xff0c;使用菜刀&#xff0c;蚁剑&#xff0c;冰蝎或者哥斯拉连接上服务器&…

常见依赖于TCP/IP的应用层协议

Protocol 协议 Acronym 缩写 Port 端口 Description 描述 Telnet Telnet 23 Remote login service 远程登录服务 Secure Shell SSH 22 Secure remote login service 安全远程登录服务 Simple Network Management Protocol 简单网络管理协议 SNMP 161-162 Manage network d…

XML Schema 指示器:全面解析与深度应用

XML Schema 指示器:全面解析与深度应用 引言 XML Schema 是一种用于定义 XML 文档结构的语言,它为 XML 文档提供了严格的框架,以确保数据的准确性和一致性。在本文中,我们将深入探讨 XML Schema 的基本概念、关键特性、指示器的作用以及其实际应用。 XML Schema 的基本概…

13、select_points_object_model_3d解析

名字 select_points_object_model_3d- 将阈值应用于 3D 对象模型的属性。 签名 select_points_object_model_3d( : : ObjectModel3D, Attrib,

ThinkPHP6.1+Ratchet库 搭建websocket服务

Ratchet 是一个基于 ReactPHP 的 PHP WebSocket 库&#xff0c;无需依赖 Swoole 扩展。以下是实现步骤&#xff1a;首先安装 Ratchet&#xff1a;composer require cboden/ratchet创建 WebSocket 处理类&#xff1a;<?php /*** websocket处理类* DateTime 2025/7/28 10:38…

智慧工地系统:科技如何重塑建筑现场?

前几天路过一个正在施工的楼盘&#xff0c;看到现场虽然机器轰鸣&#xff0c;但秩序井然&#xff0c;工人们佩戴着设备&#xff0c;指挥塔上闪烁着指示灯&#xff0c;和印象中那种尘土飞扬、杂乱无章的工地景象完全不同。当时就感慨&#xff0c;现在工地也“智慧”起来了。后来…

Day 25:异常处理

Day 25: Python异常处理机制 Review 上一节主要是熟悉os等python中的文件操作&#xff0c;包含&#xff1a; 基础操作&#xff1a;目录获取、文件列举、路径拼接系统交互&#xff1a;环境变量管理、跨平台兼容性高级功能&#xff1a;目录树遍历、文件系统分析 Today 今天专…

Apache Ignite 的分布式队列(IgniteQueue)和分布式集合(IgniteSet)的介绍

以下的内容是关于 Apache Ignite 的分布式队列&#xff08;IgniteQueue&#xff09;和分布式集合&#xff08;IgniteSet&#xff09; 的介绍。它们是 Ignite 提供的分布式数据结构&#xff0c;让你可以在整个集群中像使用本地 BlockingQueue 或 Set 一样操作共享的数据。 下面我…

HTML5 `<figure>` 标签:提升网页语义化与可访问性的利器

目录什么是 <figure> 标签&#xff1f;为什么我们要用 <figure>&#xff1f;<figure> 标签的语法<figure> 标签的适用场景1 图片及其说明 (最常用)2 代码片段及其注释3 图表、流程图或数据可视化4 引用或引文 (Quote) 及其出处总结在现代网页开发中&am…