请添加图片描述
在以前使用过Cursor,但是后期由于试用资源很少,免费资源用完我就卸载掉啦,最近又需要开展相关工作,因此下载了最新版的Trae。Trae 2.0最近很火,我正好想要爬取某一个Gitbook 电子书,因此尝试使用Trae和Python进行爬取,在尝试完成后,大感AI代码编辑器真好!!!尽管我没啥爬虫基础,但是也完成了目标。

我使用Kimi-K2模型,第一次代码基本是成功运行,但是存在几个小的问题:重新爬取,总体上爬取成功,但是我有三个新的要求:(1)要把图片也保存下来,目前图片没有成功保存,例如是这样的内容:(assets/WebGIS.png) ;(2)每一个md文档末尾都有# results matching “”# No results matching ""这样的内容,请删除;(3)将所有的文件合并成一个md文档,并且按照情况调整大纲级别。

第二次也是运行成功,但是出现了新的小问题:(1)图片保存在assets文件夹内,在md文档中 图片使用相对路径 assets/xxx.png这样的路径;(2)很多图片没有下载成功,需要重新下载,打开后显示图片损坏;(3)删除原文链接相关的内容。因此,第三次运行脚本。

此次修改后仍旧有问题,再次提示:我在先前已经执行过了3次命令,并且已经生成了第三版的代码。我的目的是将目标网站的章节爬取下来,保存为md文档。第三版已经基本成功,但是出现了两个补充修改:(1)二级标题很多是重复出现了3次,并且部分标题的大纲级别不对,要按照科学的情况组织大纲级别;(2)把所有的代码块的代码语言设置成JS。

这样处理完后:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/92465.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/92465.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/92465.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

嵌入式知识日常问题记录及用法总结(一)

文章目录摘要问题一、内核启动流程1.1 ARM内核上电复位与BootROM执行​启动代码(Startup Code)执行跳转到用户程序1.2 内存管理问题二、C语言基础2.1 常量指针和指针常量区别2.2.函数指针和指针函数区别2.3 关键字Volatile2.4 队列结构体数据摘要 嵌入式…

使用Navicat备份数据库MySQL、PostGreSQL等

Navicat 支持多种数据库系统,可通过手动或自动方式进行数据备份,整个过程还是相对简单且直观,比自己敲命令行方便多了。一、备份步骤1.1、手动备份1、打开Navicat并连接数据库:首先,启动Navicat并连接到您的MySQL数据库…

Web3: 用ERC-1400革新公司股权激励

大家好!今天,我们来聊一个非常酷的话PEG话题:如何利用Web3技术,特别是ERC-1400证券型代币标准,来革新传统的公司股权激励模式。 大家是否想过,派发给员工的期权或限制性股票(RSU)可以…

【Python 高频 API 速学 ④】

一、为什么是这 4 个? 列表(list)是 Python 最常用的可变序列, 90 % 的操作可以浓缩成 「增、并、删、排」 四个字, 而这四个字正好对应 append / extend / pop / sort。二、四剑客一览方法作用原地?返回值…

K8S的POD数量限制

#k8s-v1.11.11.查询当前节点的最大pod数kubectl describe nodes | grep pods2.编辑配置文件把单台的pod数量调到150个vim /etc/systemd/system/kubelet.service #添加最大数量--maxPods: 1503.加载配置重启服务systemctl daemon-reload systemctl restart kubelet#k8s-v1.21.41…

OpenAI开源大模型 GPT-OSS 开放权重语言模型解析:技术特性、部署应用及产业影响

注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AI Agent智能体》(跟我一起学人工智能)【陈敬雷编著】【清华大学出版社】 清华《GPT多模态大模型与AI Agent智能体》书籍配套视频课程【陈敬雷…

CSS--后端也有自己的CSS要学

CSS,即Cascading Style Sheets,它描述了网页的表现与展示效果 为了演示CSS,我写了一个简单的index.html 为了使用控制变量法,一开始我先不写style.css文件的内容 右键在默认浏览器里查看页面,看看效果 1-选择器 根据标签名进行匹配,所以也叫元素选择器 页面效果: 根据…

Docker swarm 常用的命令集合

#docker swarm## 初始化单节点Swarm docker swarm init# 部署测试服务 docker service create --name web --publish 8080:80 --replicas 3 nginx:alpine# Manager节点初始化(指定IP) docker swarm init --advertise-addr 192.168.1.100# 获取加入令牌 M…

231. 2 的幂

Problem: 231. 2 的幂 文章目录思路解题过程复杂度Code思路 2的幂 n 的二进制只有一个1,而 n - 1的二进制则是把 n 的二进制1变0, 0变1。 例:2^24100,34-1011. 解题过程 n & n - 1 0 复杂度 时间复杂度: O(1)O(1)O(1)空间复杂度: O(1)O(1)O(1) Co…

浅尝AI辅助C转Verilog方法

一、常规算法模块的开发流程日常芯片开发工作中,挺多看工作是把C语言转verilog。例如ISP的代码,都很先由算法进行C model的开发,验证完性能后,输出算法原理文档和c代码;数字设计接手,把C语言转换为verilog代…

Redis分布式锁详解:原理、实现与实战案例

目录 1. 什么是分布式锁? 分布式锁的核心要求 2. 基于Redis的分布式锁实现方案 (1)基础方案:SETNX EXPIRE (2)优化方案:SET NX PX(原子性加锁) (3&…

【能碳建设1】用AI+开源打造物联网+能碳管理+交易SaaS系统的最短路径实施指南

摘要 本指南为技术小白设计,目标是在最短时间内利用AI工具与开源系统,独立完成一套物联网平台 + 能碳管理平台 + 碳交易系统的SaaS最小可用版本(MVP),并可后续扩展。流程分为目标定义、技术选型、环境搭建、核心功能开发、SaaS化、多租户、上线运维等环节,按天推进,每步…

CVPR中深度学习新范式:通用性、鲁棒性与多模态的创新突破

来gongzhonghao【图灵学术计算机论文辅导】,快速拿捏更多计算机SCI/CCF发文资讯~分享一个深度学习领域正在迅速升温的前沿方向:通用性与鲁棒性的深度神经网络架构创新。随着大模型在视觉、文本乃至多模态任务中的广泛应用,体现出深…

Vue3 学习教程,从入门到精通,Vue 3 + Tailwind CSS 全面知识点与案例详解(31)

Vue 3 Tailwind CSS 全面知识点与案例详解一、Vue 3 核心语法知识点 1. Vue 3 基础 创建 Vue 3 项目 使用 Vite 创建项目:npm create vuelatest # 选择需要的特性(如 TypeScript、Vue Router)响应式数据 使用 ref 和 reactive:im…

Android中RecyclerView基本使用

一、RecyclerView 核心概念1. 基本组件关系2. 核心组件作用Adapter:数据与视图的桥梁LayoutManager:控制布局方式(线性/网格/瀑布流)ViewHolder:缓存视图组件ItemDecoration:添加分割线等装饰ItemAnimator&…

A100用transformers推理gpt-oss

A100本地用transformers推理gpt-oss GPT-oss试用 gpt-oss有两个原生配置是目前(2025-8-8)Ampere系列显卡不支持的,分别是默认的MXFP4量化,以及Flash-attn V3。tranformers推理是比较慢的,可以用于研究模型本身&#x…

虚拟手机号工具使用

背景:注册部分国外应用时需要国外手机号验证,例如在注册cursor时需要国外手机号 解决:使用虚拟手机号网页进行验证 https://temp-number.com/ 选择自己需要的国家 选择一个手机号 复制手机号到自己的app注册页面 并发送消息,然后…

【线程池】压测确定线程池合适的参数

【线程池】压测确定线程池合适的参数【一】案例说明【二】明确线程池核心参数及优化目标【1】线程池核心参数(需压测验证的关键参数)【2】优化目标【三】压测前准备【1】环境搭建【2】线程池初始配置(基于经验值)【3】压测工具与监…

GPT OSS 双模型上线,百度百舸全面支持快速部署

GPT OSS 是 OpenAI 推出的重量级开放模型,专为强推理能力、智能体任务及多样化开发场景设计,标志着大模型在开放性与实用性上的重要突破。该系列包含两款高性能模型:参数规模为 117B 的 GPT‑OSS‑120B 和 21B 的 GPT‑OSS‑20B。二者皆采用 …

C++高频知识点(十七)

文章目录81. 你对智能指针的了解82. 一元、二元仿函数的区别和使用背景一元仿函数二元仿函数83. 描述Linux下文件删除的原理84. 什么是菱形继承?有什么问题,怎么解决?解决菱形继承问题85. IO多路复用是什么?selectpollepollselect…