六、deep research

这是 chatgpt 推出的功能,但我这里是免费用户,一个月才有 5 次使用机会,而且使用的是轻量化模型版本,相对体验上比较鸡肋一些。

那这个深度思考研究是个什么东西呢?

根据 openai 对其的解释是,它是一种专业的人工智能能力,利用网络数据进行深入、多步骤的研究。基于 o3 推理模型(免费轻量版本应该是 o4-mini)进行了微调,能够自主搜索并阅读来自不同在线来源的信息。这使得它能够针对复杂主题创建详尽、有据可查且引用清晰的报告。

在场景上,它非常适合从事金融、科学和法律等领域高强度知识工作的人士,以及需要全面、精确和可靠研究的研究人员和精明的购物者。每项输出都完整记录,并清晰标注来源引用,便于验证和参考信息。深度研究尤其擅长发现小众、非直观的信息,这些信息通常需要在多个网站上进行多步骤查找。

所以简单来说,深度研究是网络搜索与深度思考的结合体,经过长期研发才推出——模型会持续运行数十分钟进行深度分析。

例如我们随便问一个,关于高考结束后选专业的一个话题,例如,我们可以问,

作为即将高考结束的学子,在未来选专业上,计算机专业是否还是一个热门专业,就业前景、压力相比之下如何,在 AI 时代,计算机专业和数理统计等专业上应该做如何取舍,如果我考了 600 分,如果今年各高校录取水平与 2024 年差不多的话,给出你的综合性建议及理由。并且作为一个刚走出校园的高中生,如果未来想进入 AI 领域并打算深入下去,请你给出学业或有关 AI 学习的路线图。

它首先会根据你的问题,罗列出一些需要你澄清的问题,就挨个回答一下就好了,然后它就开始进入漫长的搜索与思考过程,如果你点击这个进度条,右侧会给出他当前在搜索什么或者思考什么,大概来说就是根据问题,去搜索,然后思考整理答案,并自行发出新的搜索指令,重新整合,整体上就像我们不断搜索网页内容整理笔记,再搜索再整理的要给过程。

整个过程相对比较耗时,这期间你可以先去干点别的事情,不必在这里一直等待,

Image 1 Image 2 Image 3

最后就会形成这样的一份报告,并支持 pdf 下载,单从报告整体风格上看还是挺不错的,从内容上看很一般,首先我假设的是 600分,给我推荐的都是 600 多的,然后跟我说不可及,难以进入(我用你说),然后专业对比上只有对比,没有结论,学习路线图也很官方,不具有可操作性,整体内容上我其实不太满意。

需要强调的是由于免费版该功能背后使用的模型是轻量化,大概就是 o4-mini 吧,加上我的这些问题可能本身就搜不到太多好的内容或者它引用的网络源质量偏低,大概结果就是这个样子吧。

七、文件上传

需要提醒的是,尽管这些工具在进行研究并整合信息,但并不能保证完全没有幻觉内容。任何时候都可能出现虚假信息。它可能是编造的、虚构的,或者被模型误解的。这就是为什么这些内容中的引用源非常重要。如果当前问题对你比较重要,你需要结合它给出的引用源资料,自行阅读验证一下,你当然也可以关掉该模式,切换到普通对话模型继续就一些问题做出交流。

这里真正有趣的是,我们正在为大型语言模型提供额外的具体文档,这些文档可以在其上下文窗口中被引用。因此,模型不仅仅依赖于其参数中的知识和对世界的模糊理解,即不仅仅依赖于它"大脑"中的知识。我们实际上这些工具是在给它提供具体的文档,就好像我们在回答某个问题时,会参考互联网上的具体文件或类似资料。现在我们可以通过互联网搜索或类似工具来实现这一点。

但我们也可以通过文件上传的方式,直接为这些大语言模型提供具体的文档。我发现这个功能在很多方面都非常实用。

这是 meta 最近刚出的一篇论文,还蛮有意思,我们以 chatgpt 为例,直接将这篇论文扔给它,要求其介绍下这篇论文的研究内容,研究过程,以及他们的一些研究发现和结论内容,并对一些关键术语进行解释说明。

现在,当 chatgpt 收到这份文档时,它们大概就会将 pdf 文件解析为文字,我猜它们可能会丢弃图片等信息,后台的处理方式很可能是将这份 PDF 文件转换成一个文本文件,然后把这个文本文件加载到 token 窗口中。一旦它进入 token 窗口,就会进入工作记忆,我们就可以对其提问,就像图中这个样子,这样一来可以辅助我们阅读论文、读书、读报告等。

例如当你在读一本小说或者学习某个专业领域的书籍,当你具有电子版的时候,你可以将书籍内容直接复制粘贴到对话框中,或者将 pdf 文件或内容截图上传进来,你都可以要求它首先给出概要或者内容梗概、重点知识抽取、人物关系图等,当然,pdf 文件或内容截图受限于文件解析的准确率或 OCR 识别准确率,当你能够复制粘贴原文时,最好的方式是直接复制粘贴过来,这是一种非常高效的阅读体验。虽然某些书籍,可能已经存在于模型的内部知识中,但我们一再说明,这种记忆是模糊的,因此如果你手里有这本书的内容,那还是再给他上传一遍吧。

[!warning]
另外需要注意的是,不要轻易上传自己的个人资料,如果确实需要模型帮你做一些事情,请注意脱敏,不要傻乎乎的什么都上传

八、Python 解释器

这虽然会涉及到编程,但 AI 时代,即便不是程序员,了解一些基础的编程内容也是很有益的,尤其是像 python 这种入门学习门槛很低的编程语言。

Python 解释器,基本上就是让大语言模型能够使用和编写计算机程序。因此,大型语言模型不再直接给出答案,而是具备了编写计算机程序的能力,并能输出特殊 token。这些 token 会被 chatgpt 应用识别为——嘿,这不是给人看的。这实际上是在声明:我在此输出的所有内容都是计算机程序,请去执行它并把运行结果反馈给我。这就是语言模型与 Python 等编程语言的整合过程,这非常强大。

我们随便举几个例子:

当我们直接问 chatgpt,30x9,它可以直接计算出 270,但请注意,这实际上并不是算出来的,而是靠内部记忆记住的东西,所以我们必须让题目难一些,好吧,打眼一瞅,很像正确答案,但实际上是错的,这可以和计算器计算结果对比一下,但很神奇的是,chatgpt 给出的结果虽然不对,但很接近,我猜它可能还是学到了一些数学计算方面的某些知识,例如首位部分是对的,尾数是对的,总位数也是对的。

然后我们再将这个问题拿给 gemini 试一下

好吧,虽然是个 thinking 模型,也不对,但是这个模型也展现出了前面的现象,头尾部分正确,位数正确。

这是 claude-4-sonnet 的结果,它竟然会列竖式,结果也是对的,哇,真的被惊艳到了,我甚至怀疑它内部偷偷使用工具了,为此我们必须再加深难度为难它一步,我让它计算 823485243*43891723=?

OK,这次也罗列了一个较长的算式,但最后结果错了,但依然头尾准确,位数长度准确,我猜这些模型内部一定学到了关于乘法计算头尾数字计算以及总体位数方面的某些技巧,我不确定数学上是否真的存在此类先天性校验技巧,如果没有,这或许是一个值得研究的内容。

好吧,我们不为难这些模型,让我们使用代码工具辅助这些模型完成计算

Image 1 Image 2 Image 3

我们可以让 chatgpt 使用 python 编码的方式进行计算,这里 LLM 将我们的问题抽取出来,并进行编码,将代码文本发送给 python 解释器这个工具,由 python 解释器负责具体的运算过程,并将结果发送给模型,模型再将结果整理输出给我们。

这就是编码工具的使用,强大得令人难以置信。OpenAI 训练了 ChatGPT,让它能大致了解在什么情况下应该借助工具,他们通过示例教会了它这一点。因此,人类标注员会参与整理数据集,通过示例告诉模型在哪些情况下应该使用工具以及如何使用。但基本上,我们也可以明令要求它使用一些工具来进行作答。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/news/909833.shtml
繁体地址,请注明出处:http://hk.pswp.cn/news/909833.shtml
英文地址,请注明出处:http://en.pswp.cn/news/909833.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

若依框架前端调用后台服务报跨域错误

背景:使用若依框架的前后端分离项目,前后端开发在同一个办公室情况下前端调用后端服务提示如下报错:Access to XMLHttpRequest at http://ip1:8089/online/layer/dataType from origin http://ip2:6090 has been blocked by CORS policy: Res…

PHP商城源码:构建高效电商平台的利器

一、PHP商城源码的核心优势 1. **开源免费,降低成本** PHP作为开源语言,拥有庞大的开发者社区,成熟的商城源码(如EcShop、OpenCart)可免费获取,大幅降低企业的技术投入成本。 2. **开发效率高** PHP语法…

【学习笔记】C++代码规范整理

【学习笔记】C代码规范整理 一、匿名空间namespace 匿名命名空间(Anonymous Namespace)是一种特殊的命名空间声明方式,其作用是将声明的成员限定在当前编译单元(源文件)内可见,类似于使用 static 关键字修…

数学复习笔记 29 不定积分

前言 复习的时候时常复习一下以前复习的高数,温故而知新,可以为师矣。现实生活中有非常多让我难受的事情,贤者模式的时候也会对一些自己的行为嗤之以鼻,复习考研对其他三门科目都没有学出来正反馈,只能从数学这儿找一…

微软因安全漏洞禁用黑暗环境下的Windows Hello面部识别功能

面部识别技术在各种场景中的应用日益广泛,但身份欺诈事件仍时有发生,这表明即使面部识别也并非万无一失。在某些情况下,这些系统可能被攻击者利用。 漏洞发现与应对措施 近期,微软在Windows 10和11系统中禁用了黑暗环境下使用Wi…

产品经理课程(十五)实战点评(3)

(一)复习 需求文档是产品的说明书 需求文档包含:修订记录、背景、主要流程、详细功能逻辑、数据上报,发布策略 bug也是需求文档的一部分 (二)案例讲解 案例一: 一个版本里面的4-5个功能点就比…

大模型量化与剪枝

大模型量化,剪枝 量化有助于减少显存使用并加速推理 GPTQ 等后训练量化方法(Post Training Quantization)是一种在训练后对预训练模型进行量化的方法。 ### model model_name_or_path: meta-llama/Meta-Llama-3-8B-Instruct template: llama3### export export_di…

Oracle 数据库数据操作:精通 INSERT, UPDATE, DELETE

作者:IvanCodes 日期:2025年6月18日 专栏:Oracle教程 在 Oracle 数据库中,对表内数据进行增加、修改和删除操作是通过数据操作语言 (DML - Data Manipulation Language) 来完成的。核心的DML语句包括 INSERT (插入新数据), UPDATE…

推荐使用的Unity插件(InputSystem)

本文将提供更简洁的步骤和常见问题解决。 一、极简入门步骤: 安装:Package Manager中安装Input System(确保Unity版本在2019.4) 创建Input Actions: 在Project窗口右键 -> Create -> Input Actions 双击打开…

清理 Docker 容器日志文件方法

操作总结与问题解析 一、操作目的与背景 用户旨在清理 Docker 容器日志文件以释放服务器存储空间,主要通过以下命令组合完成操作: 查看容器日志空间占用清空指定容器的日志文件验证容器运行状态与日志清理效果二、关键命令与输出解析 1. 查看 Docker 容器日志空间占用 du…

图片压缩工具 | 按指定高度垂直切割图片

OPEN-IMAGE-TINY,一个基于 Electron VUE3 的图片压缩工具,项目开源地址:https://github.com/0604hx/open-image-tiny ℹ️ 需求描述 在上一篇文章一段代码利用 snapdom 将 CSDN 博文转化为长图片(PNG/JPG/PDF)中&…

山东大学软件学院创新项目实训开发日志——第十七周(二)

目录 1.优化前端日历页面显示,增加鼠标悬停显示当日会议基本信息的效果。 2.优化会议计划生成与会议PPT生成功能,使得能够加载多页docx文件与PDF文件 3.优化了会议PPT生成功能,使得可以上传多个文件并根据多个文件生成会议PPT 4.修改了识…

Ubuntu 使用kubeadm部署k8s系统组件反复重启的问题

系统:Ubuntu 24.04 LTS 问题现象:kubeadm init 后系统组件proxy、apiserver、etcd等频繁挂掉重启 问题原因:cgroup配置问题 解决方法: 编辑系统cgroup默认配置文件 sudo nano /etc/default/grub 将GRUB_CMDLINE_LINUX_DEFAU…

Oracle获取执行计划之EXPLAIN PLAN 技术详解

#Oracle #执行计划 #EXPLAIN PLAN 一、引言 在Oracle数据库性能优化中,​执行计划(Execution Plan)​是理解SQL语句如何被数据库处理的关键工具。EXPLAIN PLAN是Oracle提供的一种静态分析SQL执行路径的方法,它通过生成逻辑执行…

【论文阅读】Qwen2.5-VL Technical Report

Arxiv:https://arxiv.org/abs/2502.13923 Source code:https://github.com/QwenLM/Qwen2.5-VL Author’s Institution:Alibaba 背景 多模态大模型 多模态大模型MultiModal Large Language Models (MM-LLMs) 的发展可以通过一篇综述了解:MM-LLMs: Re…

vue中computed和watch区别

在 Vue 中,computed 和 watch 都是用来响应式地处理数据变化的工具,但它们的用途和行为有明显区别。 🔍 一句话总结 computed:用于声明式计算属性,有缓存。 watch:用于监听响应式数据的变化并执行副作用逻…

大语言模型:提示词决定自我反思效果: “检查回答是否错误” “验证回答是否正确”

大语言模型(LLMs)自我反思的结果很容易受提示词构造的影响 大型语言模型(LLMs)展现出令人印象深刻的零样本和少样本推理能力。有人提出,这些能力可以通过自我反思来提升,即让大型语言模型反思自己的输出,以识别和纠正初始回答中的错误。然而,尽管有一些证据表明自我反…

【iReport】实际开发中,解决iReport中打印图片不显示问题

ireport 中增加图片,添加上属性,但是运行时报错如下,是属性logoPath没有声明到map中 1. Parameter not found : logoPath net.sf.jasperreports.engine.design.JRValidationException: Report design not valid : 1. Parameter not fo…

【MySQL进阶】常用MySQL程序

目录 一. mysqlcheck——表维护程序 1.1.作用 1.2 注意事项 1.3 使用方法 1.4 常用选项 1.5 mysqlcheck的特殊使用 二. mysqldump——数据库备份程序 2.1.作用 2.2 注意事项 2.3 使用方法 2.4 常用选项 三. mysqladmin——MySQL 服务器管理程序 3.1.作用 3.2 使用…

EMQX高效存储消息到MySQL指南

配置 EMQX 存储消息到 MySQL EMQX 可以通过规则引擎和数据桥接功能将消息和事件存储到 MySQL 数据库。以下是具体实现方法: 创建 MySQL 数据表 在 MySQL 中创建用于存储消息的表结构: CREATE TABLE mqtt_messages (id int(11) NOT NULL AUTO_INCREME…