首先1️⃣。。。全篇使用的技术栈当然是python了,毕竟作为一名点点点工程师,实际工作中做测试开发用的也是python,毕竟测试框架么,不需要什么"速度"。也会一点点cpp和js,但不多。什么?你说go和java?那只会用fmt和sout输出一下hello world,哈哈哈

PS:加了这么多批注,只是为了我自己看能方便些,还有我的个人想法和经验在里面,请叫我现代牛皮癣

1. 爬虫介绍

ChatGPTCV过来的。。。毕竟专业!!!我做不到这么好👌
爬虫(Web Crawler 或 Spider)是一个自动化程序,用于浏览互联网并提取信息。爬虫通过访问网页、解析内容和提取数据来实现数据收集,通常用于以下几个主要目的:

  1. 数据采集
    爬虫可以从各种网站中自动提取信息。这种信息可以是产品价格、文本内容、图片、用户评论等,广泛应用于市场分析、研究和监控等领域。

  2. 搜索引擎索引
    搜索引擎(如 Google、Bing)使用爬虫来抓取互联网上的网页,并将其内容索引,以便用户在搜索时能够快速找到相关信息。

  3. 竞争分析
    企业或市场研究者可以使用爬虫监控竞争对手的价格、产品和市场活动,以制定更好的业务策略。

  4. 数据清洗和整理
    爬虫可以提取原始数据并进行格式化,方便后续的数据分析和处理。

  5. 内容抓取
    爬虫可以用于抓取特定网站的内容,进而进行二次开发,比如生成数据报告、创建数据集等。

  6. 社交媒体分析
    爬虫可以从社交媒体平台提取数据,分析用户行为、趋势及舆情等。

  7. 监控网站变化
    爬虫可以定期访问特定网站,监控内容的任何变化,比如价格变化、新闻更新等。

2. 技术栈

2.1 Python相关

2.1.1 python基础

这部分写个大概就直接pass了,默认我自己会python,毕竟是爬虫类博客----在小破站找课发现每一个课都会讲一下基础,我也给带上!!😘

  1. 语法,常量,变量,数据类型,运算符等
  2. 分支,循环等
  3. 数组,列表,元组,集合,字典等
  4. 函数,类,模块,库,面向对象(封装继承多态)等
  5. 异常,文件,匿名函数等
  6. 闭包,递归,装饰器,正则等
  7. 数据结构,算法等

2.1.2 网络请求库

重点开始了❗️,基础但很重要的玩意儿

  1. requests ---- 支持发送各种类型的请求(GET、POST等),并能够处理响应 ---- 常用库,个人觉得特别好用,做接口自动化也喜欢用这个库
  2. urllib ----- python标准库
  3. aiohttp ---- 异步 HTTP 客户端和服务器框架,使用 asyncio 实现,可以处理高并发的请求

2.1.3 网页解析库

  1. BS4 ---- 解析 HTML 和 XML 文档的库
  2. lxml ---- 解析和处理 XML 和 HTML 的库 ---- xpath专用,单从写xpath表达式的感觉来说,要比BS4舒服,个人觉得😌
  3. re ---- 正则库,用于匹配复杂文本

2.1.4 爬虫框架

  1. Scrapy ---- 支持分布式和异步
  2. PySider ---- 轻量级爬虫框架
  3. Crawlab ---- 支持可视化监控和管理

2.2 反爬技术

ChatGPT搜的,作为小白,目前接触到的最多的就是UA、cookie和Referer检查(验证码除外),不过有一次批量爬取豆瓣数据,IP被封禁了几个月😭

2.2.1 IP 封禁

描述: 当同一 IP 地址在短时间内发送过多请求时,网站会将其列入黑名单,拒绝其后续请求。
作用: 有效防止短时间内发送大量请求的爬虫。

2.2.2. 速率限制

描述: 服务器限制来自特定 IP 地址的请求速率,如每秒最多允许的请求次数。
作用: 通过限制请求频率,降低爬虫成功抓取数据的效率。

2.2.3. User-Agent 验证

描述: 网站会检查请求中的 User-Agent 字段,识别是否为浏览器或爬虫。常见的爬虫工具有特定的 User-Agent。
作用: 拒绝或屏蔽常见的爬虫 User-Agent,以防止自动化访问。

2.2.4. Cookie 验证

描述: 一些网站通过设置 Cookie 来跟踪用户,并要求用户在访问时带上特定的 Cookie。
作用: 只有正确设置了 Cookie 的请求才能通过,爬虫如果无法管理 Cookie,会受到限制。

2.2.5. 验证码(CAPTCHA)

描述: 通过要求用户完成验证码(如输入扭曲文字、选择图片等)来验证是否为人类用户。
作用: 有效阻止自动化程序的访问,因为爬虫通常无法通过这些验证。

2.2.6. JavaScript 渲染

描述: 一些网站使用 JavaScript 动态生成内容,只在用户的浏览器中渲染数据,而爬虫无法解析 JavaScript。
作用: 防止爬虫直接抓取静态 HTML。

2.2.7. 动态内容加载(AJAX)

描述: 使用 AJAX 技术异步加载数据,因此一开始加载的页面上没有完整的数据,这需要发送额外请求。
作用: 爬虫需要模拟这些请求才能获得完整数据,增加了抓取的复杂性。

2.2.8. 反序列化检测

描述: 网站会检测请求的结构与正常用户行为的差异,监控是否有异常的请求模式。
作用: 识别通过特殊方式反序列化请求的爬虫。

2.2.9. HTML 结构改变

描述: 频繁改变网站的 HTML 结构或 URL 规则,使得爬虫在抓取过程中常常无法获取到数据。
作用: 迫使爬虫不断更新爬取逻辑,增加维护成本。

2.2.10. IP 地理位置分析

描述: 根据访问者的 IP 地址分析其地理位置,如果请求来自不同的地区,可能会被限制。
作用: 限制数据访问到某些特定地区的爬虫。

2.2.11. 内容加密或动态内容

描述: 网站可能会将某些页面内容加密,或依赖于用户操作才能呈现的内容(如按钮点击后展示的数据)。
作用: 使得爬虫无法直接获取内容。

2.2.12. 请求伪造检测

描述: 通过比对请求的来源、原始地址、请求引用(Referer)等,来检测是否为伪造请求。
作用: 识别出那些不是通过正常入站线路访问的请求。

2.2.13. 页面行为监测

描述: 监测用户在页面上的行为(如鼠标移动、点击频率等),非真实用户的行为模式会触发监测。
作用: 识别出机器人行为并拦截相关请求。

2.2.14. IP 轮换检测

描述: 若大量请求来自不同 IP 但行为模式相似,服务器可能会将其视为爬虫行为检测。
作用: 通过行为模式识别抓取工具。

2.2.15. DNS 误导

描述: 通过将请求重定向到虚假的 DNS 地址,进而拦截请求。
作用: 直接影响爬虫的请求路径。

2.2.16. HTTP Referer 检查

描述: 检测请求中 Referer 字段,确保请求来自合法的网页来源。
作用:阻止爬虫通过直接请求 URL 而绕过正常的页面导航。

2.2.17. 实时监控和分析

描述: 利用工具和技术实时监控流量,分析异常模式并采取措施。
作用: 及时识别并阻止爬虫的攻击。

2.3 数据存储

2.3.1 文本文件

  1. Json
  2. Html
  3. Csv
  4. openxl

2.3.2 数据库

  1. Mysql
  2. SQLite
  3. MongoDB
  4. PyMysq库

2.4 数据处理

嗯。。。😯最好掌握一下,毕竟数据清洗也是必不可少的一个环节,实际工作中不光需要拿到数据就可以了,基本都要进行数据分析

2.4.1 Numpy

简介: NumPy 是一个用于科学计算的基础库,支持高性能的多维数组和矩阵操作。
特点:

  1. 提供强大的数组对象 N-dimensional array (ndarray)
  2. 支持数学函数和线性代数运算

2.4.2 Pandas

简介: Pandas 是一个强大的数据处理和分析库,特别适用于条件数据操作、数据清洗、统计分析等任务。
特点:

  1. 提供 DataFrame 和 Series 数据结构
  2. 支持数据读取(如 CSV、Excel)、数据清洗和转换
  3. 提供丰富的数据操作功能,如分组、合并、连接等

2.4.3 Excel表

想了想还是加了Excel,毕竟实际工作中说不定可能会使用Excel表分析展示数据,毕竟老板👵喜欢💗(比如我公司需求就是,测试工具处理数据后生成的测试报告都是要展示成Excel表形式反馈的)

不要小看Excel,就那些宏和函数,也够头疼的,玩好了也是大佬级别的存在🧍‍♂️

2.5 数据可视化

数据处理完了,就要展示给boss👵看了,当然,我工作中用的最多的还是Matplotlib,把折线趋势图往Excel表里一丢,测试报告,成了✅

2.5.1 Matplotlib

简介: Matplotlib 是一个基础的数据可视化库,支持生成多种类型的静态、动态、交互式图表。
特点:

  1. 灵活性高,支持自定义图表的各个方面
  2. 提供多种绘图类型(如折线图、散点图、柱状图等)

2.5.2 Seaborn

简介: Seaborn 是基于 Matplotlib 的高级可视化库,提供了更为美观和易用的图表。
特点:

  1. 对统计数据的可视化特别友好
  2. 提供内置的主题和颜色调色板

2.5.3 Plotly

简介: Plotly 是一个用于创建交互式图表的库,支持多种图形类型。
特点:

  1. 支持丰富的交互功能
  2. 可以生成 Web 图表并嵌入到 Web 应用中

2.6 图像识别

这个我。。。反正多学点不吃亏,之前用OCR技术识别验证码,可是Fail❎率挺高的,而且遇到稍微复杂一点点的验证码,比如说中间加了一条,就疯狂Fail!!!有人教唆我用Tensorflow训练一个验证码识别模型。。。但。。。我不会,哈哈哈,不管了,先挂上再说

对于点点点,最简单解决验证码方式就是 ---- 喂!来给俺把测试环境验证码先给注掉!俺要跑一遍自动化!

2.6.1 openCV

简介: OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库,提供了多种图像处理和计算机视觉功能。
功能:

  1. 图像读取与写入
  2. 图像变换(平滑、滤波、边缘检测等)
  3. 特征检测(如 SIFT、SURF、ORB)
  4. 编写简单的图像处理脚本

2.6.2 Pillow

简介: Pillow 是 Python Imaging Library(PIL)的一个分支,提供图像处理工具,支持图像操作的简化。
功能:

  1. 图像打开、保存、裁剪、调整大小
  2. 图像滤镜和效果
  3. 处理图像的文本和矩形

2.6.3 TensorFlow 和 Keras

简介: TensorFlow 是一个开源的深度学习框架,而 Keras 是一个高层次的神经网络 API,能够与 TensorFlow 等后台框架一起使用。
功能:

  1. 训练和部署深度学习模型,尤其是卷积神经网络(CNN)
  2. 使用预训练模型进行迁移学习
  3. 支持图像分类、目标检测、图像生成等

2.6.4 PyTorch

简介: PyTorch 是一个流行的开源深度学习框架,较 TensorFlow 更加灵活,常用于研究和开发。
功能:

  1. 动态计算图,易于调试
  2. 支持 CNN 和其他深度学习结构
  3. 目标检测(如使用 torchvision)

2.6.5 Tesseract

简介: Tesseract 是一个开源的 OCR 引擎,能够从图像中提取文本。
功能:

  1. 处理各种语言的字符识别
  2. 支持图像预处理

2.7 网页自动化库

如果实在爬不到,只能上自动化工具来模拟了!!(这个我熟悉😌)

2.7.1 selenium

概述: Selenium 是一个广泛使用的自动化测试工具,最初是用于 Web 应用程序的测试。
优点:

  1. 支持多种浏览器(如 Chrome、Firefox、Safari 等)。
  2. 提供了丰富的 API 以控制浏览器,如鼠标点击、键盘输入等。

2.7.2 Playwright

概述: Playwright 是一个相对较新的工具,旨在提供更快、更强大的浏览器自动化功能。
优点:

  1. 支持最新的浏览器特性(如 WebKit、Chromium 和 Firefox)。
  2. 允许多浏览器上下文的支持,能模拟不同类型的用户会话。
  3. 更简洁和强大的 API,相较于 Selenium 使用上更为灵活。
    爬取移动应用程序(APP)涉及的技术和框架与传统网页爬虫稍有不同,主要因为移动应用通常依赖于 API 和网络服务,而不是直接对网页进行抓取。以下是一些常用于抓取APP的库或框架:

2.8 APP爬虫

随着APP的盛行,APP爬取技术也越来越重要,对于APP爬取技术,可以掌握一哈,嗯。。。新手小白我也不懂,先按ChatGPT给的大纲写着,以后有不对的地方再修改

2.8.1 API 抓取

许多应用程序与后端 RESTful 或 GraphQL API 进行交互。可以使用以下库来抓取它们

  1. Requests: Python 中非常常用的库,用于发送 HTTP 请求并处理响应。
  2. Axios: 一个基于 Promise 的 JavaScript 库,用于发送 HTTP 请求。

2.8.2 移动应用反向工程工具

  1. APKTool: 用于反编译 APK 文件(Android 应用的包文件),分析和修改资源、Manifest 文件。
  2. JD-GUI / JADX用于反编译 Java 字节码,帮助用户理解应用程序的逻辑和行为。
  3. Frida: 动态分析工具,可以在运行时拦截和修改函数调用。适用于 Android 和 iOS。
  4. Burp Suite用作 Web 应用程序安全测试工具,也可以用来拦截和分析移动应用的网络请求。

2.8.3 APP自动化测试框架

  1. Appium: 一个开源的移动应用自动化测试框架,支持 Android 和 iOS,可以编写测试脚本与应用交互。
  2. UIAutomator: Android 官方提供的 UI 测试框架,允许自动化操作。
  3. XCUITest: 苹果官方提供的 iOS 测试框架。

2.8.4 监控网络请求

  1. Charles Proxy: 一款强大的网络调试代理,可抓取和查看移动应用的网络请求。
  2. Fiddler: 另一款流行的网络监控工具,支持 HTTPS 解密和拦截。
  3. Wireshark: 虽然主要用作网络分析工具,但也可以用于捕获和分析数据包。

2.8.5 模拟器和真机测试

在抓取和自动化测试移动应用时,可能需要使用模拟器或真实设备:

  1. Android Studio Emulator: Android 官方的模拟器,可以用于测试和抓取 Android 应用。
  2. Xcode Simulator: 苹果官方的 iOS 模拟器,用于测试和抓取 iOS 应用。
    真实设备: 有时使用真实设备进行测试会更可靠,特别是当应用对设备特性有特别依赖时。

2.9 抓包工具

做爬虫时,需要监控、分析和调试网络请求和响应,一款优秀的抓包工具也是必不可少的,当然F12也行,但是使用专业抓包工具会更舒心!个人更喜欢Fiddler,可能是工作中使用的就是Fiddler,用顺手了

  1. Fiddler: Fiddler 是一个强大的 Web 调试代理,可记录 HTTP(S) 流量。它适用于多种平台,并且支持对请求和响应进行分析和修改。

  2. Charles: Charles 是一款跨平台的 Web 调试代理,功能类似于 Fiddler,它支持 HTTP 和 HTTPS 的请求捕获及修改。

  3. Wireshark: Wireshark 是一款强大的网络协议分析工具,能够捕获和分析网络数据包,适用于更底层的网络通信分析。

  4. Postman: Postman 是用于测试和调试 API 的工具,虽然它并不是传统意义上的抓包工具,但它可以帮助用户发送请求并查看响应。

2.10 高阶爬虫技术

实际上高不高阶不知道,反正我没怎么听过的,就给它扔进高阶中,毕竟是我写的文档,想怎么放就怎么放,哈哈哈。。。

2.10.1 JS 逆向

听着就很高级,反正抖子上一搜,全是教逆向的直播或视频,但我不会。。。
当网站使用 JavaScript 进行数据加载时,解析和逆向理解这些脚本是非常重要的。技术包括:

  1. 静态分析: 分析 JavaScript 代码以了解数据的请求格式、API endpoints、参数等。
  2. 动态分析: 在浏览器中执行 JavaScript,并监视网络请求,捕获 API 响应。

2.10.2 WebSockets 抓取

一些网站使用 WebSocket 进行实时数据传输。抓取此类数据需要:

  1. 使用 WebSocket 客户端库(如 websocket 模块)来连接和监听服务端发送的数据。
  2. 分析 WebSocket 消息格式以提取所需数据。

2.10.3 Captcha 绕过

What???
许多网站会使用 CAPTCHA 来防止自动化请求,处理此类问题可以使用:

  1. 第三方 CAPTCHA 解决服务: 如 2Captcha、Anti-Captcha。
  2. 机器学习算法: 自己构建模型来识别常见的 CAPTCHA 类型(如简单的文字干扰)。

2.10.4 反向代理和 IP 轮换

爬虫怕IP被封经常用到代理,但是为什么在高阶爬虫里?因为一个优秀的、稳定的代理IP,要花钱💰,要钱的东西就是高级的东西

  1. 代理池: 使用多个 IP 地址的代理服务,轮换请求来源 IP。
  2. 动态代理: 根据访问频率和封禁状态自动切换或更新代理 IP。

2.10.5 分布式爬虫架构

  1. 使用爬虫框架: 如 Scrapy、CrawlSpider,结合分布式任务队列(如 Celery、RabbitMQ)。
  2. 数据存储优化: 使用分布式数据库(如 MongoDB、Cassandra)。

2.10.6 智能爬虫(AI/ML 辅助)

万物皆AI是吧
结合机器学习和 AI 技术,提升数据抓取的效率与智能:

  1. 异常检测: 使用机器学习模型检测和识别网站的反爬措施。
  2. 智能内容抓取: 基于内容相似性或上下文自动选择抓取目标。

2.10.7 浏览器无头模式

测试自动化也用,可大大增加UI自动化测试效率

  1. 无头浏览器: 如 Puppeteer、Playwright,可以在服务器上运行,减少资源消耗而不影响抓取效果。
    2.selenium设置无头模式: 启用handless即可

2.11 杂七杂八

2.11.1 数据结构和算法

什么都数据结构!!!什么都算法!!!但是。。。会这俩玩意工资💰真的可以翻一翻,而且大型架构算法优化很重要,所以先挂上吃灰

2.11.2 互联网协议

搞爬虫对于协议当然必须掌握,不仅是爬虫哈,只要与web相关的都需要,建议有时间的时候把计算机四大件啃掉!!!

  1. HTTP/HTTPS
  2. UDP/TCP

爬虫总括先总结这么多,少了后续再补。当然,最重要的一点是:一定遵守robot君子协议!!(当然,我就说说,爬虫第一课肯定先把君子协议注释掉的,不然咋爬?爬不到啊!!)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85862.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85862.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/85862.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 中基于条件动态决定字段参与分组的实现方法

在 Java 的 Stream API 中,Collectors.groupingBy()方法为数据分组提供了强大的支持。通过它,我们可以轻松地将集合中的元素按照某个属性进行分组,比如按照商品类别、日期等。然而,在实际业务场景中,有时需要根据特定条…

AppBarLayout+ CoordinatorLayout,ViewPager2为什么不会覆盖AppBarLayout

<?xml version"1.0" encoding"utf-8"?> <layout xmlns:android"http://schemas.android.com/apk/res/android"xmlns:app"http://schemas.android.com/apk/res-auto"xmlns:tools"http://schemas.android.com/tools&quo…

【群体智能优化算法系列 】一 粒子群算法 (Particle Swarm Optimization, PSO)

【群体智能优化算法系列 】一 粒子算法 一&#xff1a;前言二&#xff1a;算法原理2.1 核心思想2.2 PSO核心公式​2.3 PSO算法流程图 三&#xff1a;python实现 二维Rastrigin函数 最低点检索例子参考 一&#xff1a;前言 粒子群算法是由Kennedy和Eberhart在1995年提出的一种基…

Jupyter notebook调试:设置断点运行

写了一段小代码&#xff0c;主要是用来测试一段序列的k均值聚类效果&#xff1b; 中间想到debug一下&#xff0c;但是想到自己似乎从来没有正式地接触过jupyter notebook中地debug&#xff0c;平时也只是多开几个cell&#xff0c;然后在其他cell中复制粘贴部分代码&#xff0c…

[12-2] BKP备份寄存器RTC实时时钟 江协科技学习笔记(14个知识点)

1 2 3 4 5 6 7 8 RTC是“Real-Time Clock”的缩写&#xff0c;中文意思是“实时时钟”。这是一种在电子设备中使用的时钟&#xff0c;它能够提供准确的时间信息&#xff0c;即使在设备断电的情况下也能继续运行&#xff0c;因为它通常由一个小型电池供电。RTC广泛应用于计算机…

优化给AI的“提问技巧”(提示工程),让大型语言模型(比如GPT)更好地扮演“心理治疗助手”的角色

优化给AI的“提问技巧”(提示工程),让大型语言模型(比如GPT)更好地扮演“心理治疗助手”的角色 尤其是在“问题解决疗法”(PST)中帮助 caregivers(家庭护理者)缓解焦虑、疲劳等心理症状。以下是核心内容的通俗解读: 一、研究背景:AI当心理医生靠谱吗? 现状:全球…

Java的lambda表达式应用

Lambda表达式是Java 8引入的一项强大特性&#xff0c;它允许以更加简洁的方式表示匿名函数。Lambda表达式不仅让代码更加简洁、清晰&#xff0c;而且为函数式编程提供了有力支持&#xff0c;从而提升了Java语言的表达能力。 本文主要讲解lambda应用stream处理集合的应用。 1、…

云原生/容器相关概念记录

文章目录 网络与虚拟化技术云平台与架构容器与编排容器网络方案性能优化与工具硬件与协议 网络与虚拟化技术 P4可编程网关 P4: Programming Protocol-independent Packet Processors一种基于P4语言的可编程网络设备&#xff0c;支持自定义数据包处理逻辑。P4可编程技术详解&am…

[C++] traits机制

文章目录 C之type_traitsis_floating_point<T> ..的使用std::enable_if<T>::type的使用std::remove_cv 如何自定义traits C之type_traits is_floating_point …的使用 一般在定义打印模板函数的时候&#xff0c;当我们用printf进行终端日志打印&#xff0c;需要根…

OpenCV 视频处理与保存

一、知识点 1、VideoCapture类 (1)、用于从视频文件、摄像机或图像序列中捕获视频帧。 (2)、构造函数 VideoCapture(const String & filename, int apiPreference CAP_ANY) a、filename可以是视频文件的名称(例如"video.avi")&#xff0c;可以是图…

【Leetcode】字符串之二进制求和、字符串相乘

文章目录 算法原理二进制求和题目链接题目描述解题思路代码 字符串相乘题目链接题目描述解题思路代码 算法原理 这两道题都是属于算法里一种经典题型&#xff1a;高精度加/减/乘/除法&#xff0c;需要我们模拟加/减/乘/除 列竖式运算。 二进制求和 题目链接 题目链接 题目描…

MongoDB:索引

目录 1、索引数据结构&#xff1a;B-树 2、索引类型 2.1 单字段索引 2.2 复合索引&#xff08;最重要&#xff01;&#xff09; 2.3 多键索引&#xff08;数组字段&#xff09; 2.4 地理空间索引 2.5 全文索引 2.6 哈希索引&#xff08;分片专用&#xff09; 2.7 TTL …

【大模型】Transformer架构完全解读:从“盲人摸象“到“通晓万物“的AI进化论

&#x1f916; Transformer架构完全解读&#xff1a;从"盲人摸象"到"通晓万物"的AI进化论 —— 一位大模型探索者的技术日记 ☕ 第一章&#xff1a;为什么说Transformer是AI界的"蒸汽机革命"&#xff1f; 1.1 从RNN到Transformer&#xff1a;…

JavaEE:使用JMeter进行接口并发测试

一、下载与安装&#xff1a; 1.下载apache-jmeter-5.6.3.zip&#xff1a; https://jmeter.apache.org/download_jmeter.cgi 2.解压到D:\Program Files\apache-jmeter-5.6.3目录 3.添加JDK环境配置到D:\Program Files\apache-jmeter-5.6.3\bin\jmeter.bat文件开头&#xff1…

【笔记】MSYS2 的 MinGW64 环境中正确安装 Python 相关环境管理工具 (Poetry、Virtualenv、Pipenv 和 UV)

MSYS2 环境配置与 Python 项目依赖管理笔记_msys更新python-CSDN博客 【技术笔记】MSYS2 指定 Python 版本安装方案_pacman -u 安装指定版本-CSDN博客 更多关于 MSYS2 开发环境的配置&#xff0c;请查看往期笔记。 简介 本笔记将记录我们在 MSYS2 的 MinGW64 环境中安装 Pytho…

ubuntu添加域名解析服务器地址

在 Ubuntu 中配置域名解析主要有两种方式&#xff1a;静态修改 /etc/hosts 文件 和 动态修改 DNS 解析服务器配置。以下是详细操作指南&#xff1a; 建议优选:二、永久方案&#xff1a;修改 DNS 解析服务&#xff08;推荐&#xff09;中的方法1 一、临时方案&#xff1a;修改…

通过 AIOps 、生成式 AI 和机器学习实现更智能的可观测性

支持 AIOps 的理由 人工智能运维&#xff08;AIOps&#xff09;是将人工智能&#xff08;AI&#xff09;、机器学习&#xff08;ML&#xff09;和分析技术应用于提升 IT 运维团队日常工作的过程。简单来说&#xff0c;AIOps 是软件系统通过 AI 和 ML 以及相关分析技术来简化和…

【DataWhale组队学习】AI办公实践与应用

AI办公-PPT制作 1. 使用大模型制作PPT的常见流程 使用大模型生成PPT的文稿将文稿的内容喂给可以直接生成PPT的大模型&#xff0c;生成PPT 2. 使用大模型生成PPT文稿 我们可以先使用上一章提过的那些大模型去生成一个PPT的文稿。那根据上一章的内容&#xff0c;我们想要去让…

人机融合智能 | 人智交互中的机器行为设计与管理

以人工智能为代表的科学技术正在深入地塑造和改变着人类的社会、文化和经济等,在“无所不在的算法与智能”的时代,了解智能机器的行为对于设计智能行为并使其造福于人类,对于智能机器的设计者、开发者和使用者,都具有重要意义。机器行为研究从学科交叉的视角,将智能机器行为置于…

langChainv0.3学习笔记(高级篇)

目录 工具创建工具从函数创建工具tool 装饰器结构化工具 从可运行对象创建工具子类化 BaseTool如何创建异步工具处理工具错误返回工具执行的artifact 使用内置工具和工具包自定义默认工具如何使用内置工具包 使用聊天模型调用工具定义工具模式Python 函数LangChain 工具Pydanti…