写这一篇的缘由一是因为我也在摸索如何降低 AI 幻觉提升 AI 工具使用效率,二是因为前两周在MIT学习时老师讲的一节课,刚好也解释了这个问题,所以一并做个总结,分享给大家。

近几年,大型语言模型(LLM)如 ChatGPT、Claude、Gemini 等快速走进公众视野。它们能生成结构完整、逻辑清晰的长文本,甚至可以进行代码编写、法律文书撰写、医学咨询等高难度任务。然而,我们也越来越频繁地听到一个术语:AI幻觉。简单说,它指的是模型“说得像真的,但其实是错的”。

本文将尝试解释三个问题:

  1. 什么是 AI 幻觉?为什么语言模型会产生幻觉?

  2. GPT-4 等新一代模型是否真的减少了幻觉?

  3. 如何尽可能减少幻觉带来的误导?


一、语言模型不是在“理解”,而是在“预测”

GPT 的全称是 Generative Pre-trained Transformer,其核心任务是:给定一段输入,预测下一个最可能出现的词(token)。这种机制的本质是统计语言模式,而不是基于事实的知识回忆或理解。

举个例子,输入“乔布斯和马斯克在球场上”,模型会续写出“展开了一场激烈的篮球比赛”,尽管这从未真实发生。这不是模型有意捏造,而是它识别出“人名 + 球场”常出现在比赛语境中,于是生成符合语言习惯的句子。

这类“幻觉”即来自其构建方式:模型的目标不是还原事实,而是生成“在训练语料中最常见或最自然”的文本。也就是说,它输出的是“语言上的合理”,而非“世界中的真实”。

这也是幻觉的来源:在不知道答案时,模型仍然会“给出一个听起来合理的回答”

二、幻觉的技术根源:训练机制、知识覆盖与任务设定

  1. 训练机制决定幻觉倾向:GPT 采用的是无监督学习方法,即在大规模互联网文本上训练模型,其唯一目标是最大化下一个词出现的概率,而不是核查事实。这种机制天然就倾向于生成“似是而非”的内容。

  2. 语料中的事实不等于知识库:模型并不保存某种结构化知识图谱或数据库,它记住的是“什么词经常和什么词一起出现”,而不是“谁获得了 2022 年冬奥会金牌”这种事实信息。

    在 MIT 的课上,教授举了一个例子:

    “问 GPT 3.5:‘谁赢得了 2022 年冬奥会冰壶金牌?’——模型回答错误,称韩国女队获胜,而实际上是英国队。”

    原因在于:GPT 3.5 的训练数据截止于 2021 年,不包含 2022 年的事实。因此只能“模仿出一个合理答案”,而不是“查找真实答案”。

  3. Prompt 的诱导效应:用户的提问方式对模型结果有很强导向性。例如:“请写一篇关于爱因斯坦和马斯克辩论环保问题的稿件”,这个语句默认了事件的真实性,模型不会去验证事实,只会按“剧本”生成。

  4. 缺乏世界建模能力:GPT 不理解时间、空间或因果关系。即便在逻辑上存在冲突,模型也不会主动识别,而是依赖文本连贯性生成语言。

三、GPT-4 相较 GPT-3.5 幻觉减少了吗?为什么?

整体来看,GPT-4 的幻觉率相较 GPT-3.5 有所下降,背后有以下几点改进:

(来源:OpenAI. :GPT-4 Technical Report. 2023)

1. 更大的训练数据集:覆盖更多领域与长尾知识,减少“知识空白”导致的猜测;

2. 更强的上下文理解能力:GPT-4 的 context window 扩大至 32k token,使其能记住更多上下文,减少断章取义和语义漂移;

3. 引入人类反馈强化学习(RLHF):在模型微调阶段,使用人类标注反馈强化“承认不知道”优于“胡编乱造”的行为;(之前介绍的 Scale AI 做的就是这个生意)

每天一个 FUN AI|Scale AI:AI 产业链的“隐形军火商”

4. 微调策略优化:特别针对幻觉问题,引入了对输出置信度的判断机制,使模型在低置信度时更倾向于给出模糊或保守的回答。

不过,即使如此,幻觉依然存在,尤其在以下场景更容易触发:

  • 冷门专业领域(如罕见病、边缘法律问题);

  • 问题提示模糊或含有虚构前提;

  • 用户询问的是未来或最新事件;

四、如何最大限度减少 AI 幻觉?用户与系统端的协同策略

1. 用户端优化:

  • 使用明确提示语,例如:

    “如果你不知道,就说不知道”

    “基于我上传的文档回答”

  • 使用结构化 Prompt 限制模型的自由发挥范围,如“请分三点说明”“用表格列出”;

  • 避免诱导性或假设前提问题,尤其是在高风险领域;

2. 系统端优化:

  • 检索增强生成(RAG):给模型增加一个“查资料”模块,让它回答前先查外部数据库或网页;

  • 插件与联网设计:如 Wolfram Alpha(做计算)和 Bing Search 插件(查新闻)已集成至 GPT 产品中,提升事实查验能力;

  • 多阶段生成机制:将“任务理解、信息检索、生成内容”分阶段执行,避免一次性完成的单步误导;

  • 专业模型精调:在医学、金融、法律等专业领域,训练专门子模型来提供更安全、准确的答案。

最后:语言的流畅,不等于事实的可靠

幻觉是当前大型语言模型的结构性副产物,它既不是“错误”,也不是“欺骗”,而是模型生成机制与真实世界之间的落差,是语言模型当前能力边界的自然结果。

理解这一点,是我们理性使用 GPT 和类 AI 工具的基础,也提醒我们:生成式语言的“像真度”,并不等于它的真实性

未来,随着外部工具接入、Agent 机制完善、责任机制明确,幻觉问题会被进一步缓解。但在那之前,任何看起来“说得头头是道”的 AI 回答,我们都应保留验证的习惯。

周一,祝大家今天开心。

封面和摘要

深度解析 | AI 幻觉的形成和应对路径

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/91588.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/91588.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/91588.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java把word转HTML格式

Java把word转HTML格式&#xff0c;两种方式方式一&#xff1a;maven引入依赖,pom.xml<dependency><groupId>e-iceblue</groupId><artifactId>spire.office.free</artifactId><version>5.3.1</version> </dependency>然后代码读…

#C语言——学习攻略:探索字符函数和字符串函数(一)--字符分类函数,字符转换函数,strlen,strcpy,strcat函数的使用和模拟实现

&#x1f31f;菜鸟主页&#xff1a;晨非辰的主页 &#x1f440;学习专栏&#xff1a;《C语言学习》 &#x1f4aa;学习阶段&#xff1a;C语言方向初学者 ⏳名言欣赏&#xff1a;"编程的本质是理解问题&#xff0c;然后把它分解成可执行的步骤。" 目录 1. 字符分类函…

(吃饭)质数时间

题目描述如果把一年之中的某个时间写作 a 月 b 日 c 时 d 分 e 秒的形式&#xff0c;当这五个数都为质数时&#xff0c;我们把这样的时间叫做质数时间&#xff0c;现已知起始时刻是 2022 年的 a 月 b 日 c 时 d 分 e 秒&#xff0c;终止时刻是 2022 年的 u 月 v 日 w 时 x 分 y…

【RK3568 RTC 驱动开发详解】

RK3568 RTC 驱动开发详解一、Linux RTC 子系统架构​二、设备树配置​三、驱动四、时间相关命令实时时钟&#xff08;RTC&#xff09;是嵌入式系统中不可或缺的硬件模块&#xff0c;负责在系统断电后继续计时&#xff0c;为设备提供稳定的时间基准。本文将以瑞芯微 RK3568 平台…

文本编码检测库`chardet` 和 `uchardet`对比使用示例及注意事项

在处理未知编码的二进制数据时&#xff0c;chardet 和 uchardet 是两个非常实用的字符编码自动检测库&#xff0c;尤其适用于从卫星通信、文件、网络流等来源获取的未标明编码的文本数据。一、chardet&#xff08;Python版&#xff09; ✅ 简介 chardet 是一个用 Python 编写的…

[Windows]Postman-app官方历史版本下载方法

Postman-app官方历史版本下载方法最新版&历史版本官网地址最新版本下载历史版本下载禁止自动更新方法Postman最新版安装后必须要登录才能使用某些特定功能&#xff0c;多有不便&#xff0c;因此花了点时间整理了一下历史版本如何下载的方法&#xff0c;链接均为官网链接&am…

【Spring Boot 快速入门】三、分层解耦

目录分层解耦案例&#xff1a;将 emp.xml 中的数据解析并响应三层架构分层解耦IOC & DI 入门IOC 详解DI 详解分层解耦 案例&#xff1a;将 emp.xml 中的数据解析并响应 emp.xml 内容如下&#xff1a; <emps><emp><name>Tom</name><age>18…

井云科技2D交互数字人:让智能服务触手可及的实用方案

在如今的数字化时代&#xff0c;智能交互已成为各行业提升服务质量的重要方向。而井云 2D 交互数字人系统凭借其独特的技术优势&#xff0c;正逐渐成为众多企业实现智能服务升级的优选。它无需复杂的操作和高昂的成本&#xff0c;就能让数字人在各类线下场景中发挥重要作用&…

本地部署VMware ESXi,并实现无公网IP远程访问管理服务器

ESXi&#xff08;VMware ESXi&#xff09;是VMware公司推出的一款企业级虚拟化平台&#xff0c;基于裸机&#xff08;bare-metal&#xff09;安装的虚拟化操作系统。它可以在一台物理服务器上运行多个虚拟机&#xff0c;广泛应用于数据中心和云计算环境中。很多公司为了方便管理…

让科技之光,温暖银龄岁月——智绅科技“智慧养老进社区”星城国际站温情纪实

七月的风&#xff0c;带着夏日的热情&#xff0c;轻轻拂过邯郸星城国际社区葱郁的绿意。2025年7月30日&#xff0c;一个以“幸福晚景&#xff0c;乐享银龄—智慧养老进社区”为主题的活动&#xff0c;如一股暖流&#xff0c;浸润了社区的长者们。智绅科技怀揣着“科技赋能养老&…

Java单元测试和设计模式

单元测试 . 测试分类 什么是测试? 测试的目的是尽可能多的发现软件中存在的BUG,而不是为了隐藏BUG。事实上测试有很多种类,比如:边界测试,压力测试,性能测试等 黑盒测试 黑盒测试也叫功能测试,主要关注软件每个功能是否实现,并不关注软件代码是否有错误;测试人员…

UOS统信桌面系统解决编译错误:C compiler cc is not found指南

一、系统环境 1.操作系统版本2.编译环境 PC:~$ gcc --version gcc (Uos 8.3.0.13-deepin1) 8.3.0 Copyright (C) 2018 Free Software Foundation, Inc. This is free software; see the source for copying conditions. There is NO warranty; not even for MERCHANTABILITY o…

深入理解 Docker 容器网络:为什么用 host 网络模式能解决连通性问题?

Docker 已经成为现代应用部署的标配&#xff0c;大家都知道它的网络隔离做得很好&#xff0c;既安全又灵活。不过&#xff0c;在实际用 Docker 部署服务的过程中&#xff0c;相信很多人都遇到过这样的情况&#xff1a;主机上能连通的外部服务&#xff0c;一到容器里却死活连不上…

Spring Boot 异常处理:从全局捕获到优化用户体验!

全文目录&#xff1a;开篇语**前言****1. Spring Boot 异常处理的基本概念****2. 使用 ExceptionHandler 局部处理异常****示例&#xff1a;局部异常处理****优化建议&#xff1a;****3. 使用 ControllerAdvice 和 RestControllerAdvice 进行全局异常处理****示例&#xff1a;全…

vue3.0 + TypeScript 中使用 axios 同时进行二次封装

项目背景是vite搭建的vue3.0 TypeScript 的项目&#xff0c;需要统一处理和统一维护就对axios进行了二次封装 axios的安装 npm install axios定义http文件夹然后内部定义index.ts文件&#xff0c;内部开始封装 import axios, {type AxiosInstance} from "axios";…

ESP32- 项目应用1 音乐播放器之sd的驱动配置 #1

音乐播放器 ESP32- 项目应用1 音乐播放器之sd的驱动配置 #1 文章目录 音乐播放器 1 sd卡介绍 1.1 SDCARD介绍 1.2 物理结构 1.3 协议说明 1.4 sd 卡模式 1.5 数据模式 1.6 sdio 初始化流程 1.7 SPI 模式下的 SD 卡初始化 2 原理图 2.1 sd原理图 2.2 esp32的接口 3 代码配置 3.…

Vue.js 指令系统完全指南:深入理解 v- 指令

Vue.js 的指令系统是其最强大的特性之一&#xff0c;通过以 v- 开头的特殊属性&#xff0c;我们可以在模板中声明式地绑定底层Vue实例的数据。本文将深入讲解Vue中最重要的指令&#xff0c;帮助掌握Vue的核心功能。 文章目录1. v-model&#xff1a;双向数据绑定的核心基本用法修…

计算机分类汇总大全

前端部分有 Node.js、ActionScript、Swift、TypeScript、Webpack、JavaScript。需要分别详细说明它们的定义、特点、应用场景、优缺点等。比如 Node.js&#xff0c;要提到它的运行环境、事件驱动、非阻塞 I/O&#xff0c;适合的应用如 API 服务、实时应用&#xff0c;以及常用框…

模拟链路滤波器设计一些细节

目录 原设计思路剖析 300M带宽仿真与计算 原设计思路剖析 滤波器设计的一些细节,以下为ADS54J60模拟链路的一些问题设计原理图 实际电路设计如上所示,但是实际bom并未按此设计,根据实际的BOM明细以及ADC使用说明书,可以间接理解原设计者的设计初衷,是将ADC的一部分特性…

CatBoost 完整解析:类别特征友好的梯度提升框架

1️⃣ 什么是 CatBoost&#xff1f;CatBoost&#xff08;Categorial Boosting&#xff09;是由 Yandex&#xff08;俄罗斯搜索引擎公司&#xff09;开源的梯度提升框架&#xff0c;专为类别特征处理优化。核心特点&#xff1a;无需手动 one-hot / LabelEncoding&#xff0c;原生…