一、NLP通向智能之路

1.1 图灵测试

1.1.1 提出背景

由计算机科学家阿兰・图灵于 1950 年提出,是早期衡量机器智能水平的重要概念。

1.1.2 提出目的

  • 判断机器是否能表现出与人类相当的智能行为。

1.1.3 测试原理

  1. 场景设定:测试中存在一位人类测试者,以及一个被放置在“不可视房间”中的对象(可能是机器或人类)。
  2. 互动方式:人类测试者通过文本对话等非视觉方式与房间中的对象交流,无法直接观察对方的真实身份。
  3. 判断标准:若人类测试者在对话结束后,无法准确分辨与自己交流的对象是机器还是真人,则该机器被判定为 “通过图灵测试”。

1.1.4 测试结论

通过图灵测试的机器,在传统定义中会被认为 “拥有人工智能”,即其智能表现达到了与人类难以区分的程度。这一测试为早期人工智能的研究提供了具象化的评判标准,尽管随着技术发展,其局限性逐渐显现,但仍是人工智能发展史上的重要里程碑。

1.2 三种智能层次

1.2.1 运算智能

  1. 定义:让计算机拥有快速计算和记忆存储能力。
  2. 相关技术:
    • 硬件加速器:例如 GPU(图形处理单元)、TPU(张量处理单元)、ASICs(应用特定集成电路)等。
    • 并行计算:多核处理器、分布式系统、超线程技术等。
    • 高效算法:如 FFT(快速傅里叶变换)、Strassen算法(快速矩阵乘法)等。
    • 内存和存储技术:如 SSD、RAM、以及新型存储技术如 3D XPoint。

1.2.2 感知智能

  1. 定义:让计算机系统具备感知外部环境的能力。
  2. 相关技术:
    • 计算机视觉:包括以卷积神经网络(CNN)和图像处理在内的一系列内容,应用于图像识别、目标检测、图像分割等。
    • 语音识别:技术包括递归神经网络(RNN)、长短时记忆网络(LSTM)、声谱图等。
    • 触觉技术:例如电容触摸屏、压力感应器等。
    • 其它传感器技术:如雷达、激光雷达(LiDAR)、红外线传感器、摄像头、麦克风、气味检测传感器等。

1.2.3 认知智能

  1. 定义:让计算机系统具备类似于人类认知和思维能力的能力。
  2. 相关技术:
    • 自然语言处理:如 RNN、transformer、BERT、GPT架构、语义分析、情感分析等。
    • 增强学习:技术包括 Q-learning、Deep Q Networks (DQN)、蒙特卡洛树搜索(MCTS)等。
    • 知识图谱:结合大量数据,构建对象之间的关系,支持更复杂的查询和推理。
    • 逻辑推理和符号计算:如专家系统、规则引擎、SAT solvers 等。
    • 模拟人类思维的框架和算法:例如认知架构(如 SOAR 和 ACT-R)。

1.3 人机同频交流

1.3.1 社会共识

无论是图灵测试的设计方式,还是GPT爆火引发的AI浪潮都说明——在人工智能发展的过程当中,深度学习学者们、甚至整个人类社会都无意识地达成了一种高度的共识:认知智能是智能的终极体现,人机同频的交流是智能被实现的象征,无论一个人工智能算法有多强大的能力。

1.3.2 三大核心要求

  • 普适性地理解人类
  • 让人类理解
  • 与人类顺畅交流

1.4 自然语言处理

1.4.1 语言

  人类 90% 的信息获取与交流依赖语言,且语言承载着逻辑、情感、知识、智慧,是社会构建与文明传承的基础。

1.4.2 定义

  作为研究计算机认知、理解、生成人类语言,并依托语言完成交流与特定任务的学科,它是计算机实现 “与人类同频” 的核心路径。

1.4.3 地位

  自然语言处理的发展直接关系到人工智能能否真正具备 “智能”,因此在学术与工业领域均占据极其重要的地位。

1.4.4 学术界

  1. 学术会议热度攀升:NLP 领域的经典会议 ACL 和 NAACL 中,被接受的论文数量与比率逐年增长,反映出领域研究的蓬勃活力。
  2. 跨领域渗透显著:得益于语言与其他信息形式的强融合性,NLP 架构被广泛借鉴到多个领域,催生了众多突破性成果:
    • 计算机视觉领域,非卷积架构 ViT(Vision Transformer)凭借借鉴 NLP 的 Transformer 结构,在图像领域展现出强大能力。
    • 自动驾驶领域,谷歌大脑 2023 年 3 月发表的《LEAST-TO-MOST PROMPTING》论文显示,大语言模型结合提示工程,在高难度导航数据集 SCAN 上的预测精度从约 50% 提升至 99%。
  3. 学术成果占比领先:2023 年 3 月发布的 “机器学习 / 深度学习领域年度百佳论文” 中,专注 NLP 或依赖 NLP 技术的论文占比达 2/3,覆盖生成式语言模型、预训练技术、大语言模型、语音技术、图文模型等多个方向。

1.4.5 工业界

  1. NLP技术的工业化普及:NLP技术已深度融入各类实用场景,成为众多产品与服务的核心支撑:
    • 从搜索引擎的精准检索、推荐系统的个性化内容推送,到语音助手的交互响应、聊天机器人的智能对话,再到自动摘要的信息提炼、情感分析的用户态度洞察——这些高频应用的底层逻辑均依赖NLP技术。
    • 实际上,在PC端或移动设备中,几乎所有涉及文本交互或语音沟通的产品与服务,都离不开NLP技术的赋能,其已成为连接人机交互的“隐形基础设施”。
  2. NLP技术的爆发式扩散:自大语言模型诞生后,NLP技术的工业化应用呈现爆发式增长:
    • 2023年世界人工智能大会上,软件展区几乎被大语言模型相关的软件及应用程序全面覆盖,直观展现了NLP技术在产业端的热度。
    • 从前沿科技企业到互联网巨头,全行业均在积极布局自有大模型产品,推动NLP技术从基础能力向垂直场景的深度渗透,进一步巩固了其在工业界的核心地位。

二、大模型引发行业剧变

2.1 三大发展阶段

2.1.1 探索阶段:2011~2015(前Transformer时代)

  1. 时代背景:在AlphaGo和卷积网络掀起第三次人工智能革命之前,NLP领域主要依赖人工规则和知识库构建非常精细的“规则类语言模型”,当人工智能浪潮来临后,NLP转向使用统计学模型、深度学习模型和大规模语料库。
  2. 重要目标:研发语言模型、找出能够处理语言数据的算法
  3. 重要技术:
    • 隐马尔可夫模型(HMM)
    • 条件随机场(CRF)
    • 支持向量机(SVM)
    • 循环神经网络(RNN)
    • 长短期记忆网络(LSTM)

2.1.2 提升阶段:2015~2020(Transformer时代)

  1. 时代背景:2015年谷歌将自注意力机制发扬光大、提出了Transformer架构,在未来的几年中,基于transformer的BERT、GPT等语言模型相继诞生。
  2. 重要目标:大幅提升语言模型在自然语言理解和生成方面的能力
  3. 重要应用:
    • 搜索引擎
    • 推荐系统
    • 自动翻译
    • 智能助手

2.1.3 应用阶段:2020-至今(大模型时代)

  1. 时代背景:2020年秋天、GPT3.0所写的小软文在社交媒体上爆火,这个总参数量超出1750w、每运行1s就要消耗100w美元的大语言模型(Large Language Models,LLMs)为NLP领域开启了一个全新的阶段。
  2. 重要目标:
    • 模型研发:虽然GPT系列大模型的原理并未开源,但GPT的成功无疑为“如何提升语言模型表现”指出了一条明路。在GPT的启发下,海内外各大科技企业正在研发基于BERT、基于GPT或基于Transformer其他组合方式的大模型,国内一线大模型ChatGLM系列就是基于BERT和GPT的融合理念开发的中文大模型。同时,大模型研发和训练技术、如生物反馈式强化学习(RLFH)、近端策略优化(PPO)、奖励权重策略(Reward-based Weighting)、DeepSpeed训练引擎等发展迅速,势不可挡。虽然现在已不是NLP理论发展的高峰,但毫无疑问,大模型算法研发与训练依然是NLP最前沿的研究方向之一。
    • 成本降低:大模型吞吃大量语料、训练成本极高,要将大模型应用到具体商业场景、还需进一步研究和训练。因此降低大模型应用成本的预训练、微调、大规模语料库构建等技术正蓬勃发展!自2020年以来已诞生十余种可行的微调方法和自动语料生成方法,如有监督微调(SFT)、低阶自适应微调方法LoRA、提示词前缀微调方法Prefix Tuning、轻量级Prefix微调Prompt Tuning、百倍效率提升的微调方法P-Tuning V2、以及自适应预算分配微调方法AdaLoRA等。这些方法催生了GPT4.0和大量语言方面落地应用,已经大大改变了NLP的研究和应用格局。
    • 技术变现
      • 大语言模型的性能十分强大、足以很好地支持各类NLP方面服务。
      • 大语言模型使用自然语言与消费者交互,可以大幅降低新产品的使用门槛,还可以与图像、语音等领域强势联动、形成多模态的产品。

2.2 大模型产品

  • ChatGPT
  • 跨语言代码编译工具Cursor
  • Github官方代码编写工具CopilotX
  • 一键生成PPT内容的Gamma AI
  • office全家桶中配置的Copilot
  • Photoshop中配置的fill features
  • 广泛生成图像的MidJourney和Stable Diffusion
  • 大模型APP研发范式LangChain

三、NLP带来危险与机遇

3.1 GPT的重大突破

GPT的诞生引发社会轰动,其代表了大模型技术和预训练模型在自然语言处理领域的关键突破,被比尔·盖茨(“与个人电脑或互联网同样重要”)、黄仁勋(“AI领域的iPhone,是更伟大事物的开始”)等行业领袖高度评价。

GPT不仅提升了人机交互的能力,还为智能助手、虚拟智能人物和其他领域的创新应用打开了新的可能性。随着大模型的进一步发展和应用,有理由期待GPT以及类似的技术在未来带来更多令人惊叹的创新和进步。

3.2 行业结构的变化趋势

整体行业呈欣欣向荣态势,但结构将发生显著变化:

  • 核心技术发生转移,大模型技术成为核心方向
  • 论文发表难度上升,理论研究门槛提高

3.3 从业者的机遇与挑战

  1. 就业市场:不会爆发针对NLP从业者的大规模失业潮(因多数从业者并非聚焦理论研究)。
  2. 转型需求:NLP从业者需主动适应技术变革,面临转型压力。
  3. 人才趋势:掌握大模型技术的NLP从业者将成为行业抢手人才。
  4. 具体领域:
    • 参与大模型的研发与优化,探索更高效的模型结构和训练方法。
    • 开发创新NLP应用,提升人类语言交互的智能性与效率。
    • 涉足多模态、具身智能、人类行为模拟等前沿研究,推动NLP技术边界拓展。

微语录:我的天空里没有太阳,总是黑夜,但并不暗,因为有东西代替了太阳。——东野圭吾

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/89132.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/89132.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/89132.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Ansible 查看PostgreSQL的版本

Ansible的基础知识就不说了直接贴剧本- name: Check PostgreSQL versionhosts: db_serversbecome: yesvars:ansible_python_interpreter: /usr/bin/python3db_name: postgresdb_user: postgresdb_password: your_passwordtasks:- name: Install psycopg2ansible.builtin.packag…

【视觉SLAM笔记】第9章 后端1

一、理论1. 状态估计的概率解释我们来深入探讨一下视觉SLAM中状态估计的概率解释。这可以说是理解现代SLAM算法(尤其是后端优化)的基石1. 问题的核心:不确定性SLAM(同步定位与建图)的本质是在一个未知环境中&#xff0…

(数据结构)复杂度

基本概念说明 数据结构 定义:数据结构(Data Structure)是计算机存储、组织数据的方式,指相互之间存在⼀种或多种特定关系的数据元素的集合。没有⼀种单⼀的数据结构对所有用途都有用(要考虑适配、效率问题,在不同情况下使用合适的…

玩转Docker | 使用Docker部署bender个人导航页工具

玩转Docker | 使用Docker部署bender个人导航页工具 前言 一、bender介绍 Bender 简介 Bender 的主要特点 二、系统要求 环境要求 环境检查 Docker版本检查 检查操作系统版本 三、部署bender服务 下载bender镜像 编辑部署文件 创建容器 检查容器状态 检查服务端口 安全设置 四、…

解决了困扰我的upload靶场无法解析phtml等后缀的问题

本文章为解决困扰我的 upload 靶场无法解析 phtml 问题 ​ 这个问题直接让我过不了Upload-Pass-03这一关,一直卡着。 ​ 痛太痛了 ,为什么无法解析上传之后的 phtml 后缀文件!这块儿折磨了博主一天多,太不容易了,查找…

Leetcode百题斩-二分搜索

二分搜索也是一个很有趣的专题,被做过的题中,刚好一个Easy,一个Medium和一个Hard,刚好可以看看,二分搜索的三个难度等级都是啥样的。 124. Binary Tree Maximum Path Sum[Hard](详见二叉树专题)…

【IDEA】格式化代码工具配置

格式化代码快捷键: CtrlAltL格式代码的时候不会再方法名与参数中间添加空格默认不勾选的情况下:代码样例:勾选之后的样例:选择不勾选,IDEA默认情况下就是不勾选的状态忽略加载文件有些非必要加载到开发工具中的文件我们…

驱动开发(3)|rk356x驱动GPIO基础应用之点亮led灯

点亮LED灯看似是一个基础的操作,但实际上,许多高级应用也依赖于高低电平的切换。例如,脉冲宽度调制(PWM)信号可以用来精确控制电机的转速,通过改变脉冲的频率和占空比,实现对电机的精确调节&…

手动搭建PHP环境:步步为营,解锁Web开发

目录一、引言二、准备工作2.1 明确所需软件2.2 下载软件三、Windows 系统搭建步骤3.1 安装 Apache 服务器3.2 安装 PHP3.3 集成 Apache 与 PHP3.4 安装 MySQL3.5 配置 PHP 连接 MySQL四、Linux 系统搭建步骤(以 Ubuntu 为例)4.1 更新系统4.2 安装 Apache…

DrissionPage:一款让网页自动化更简单的 Python 库

在网页自动化领域,Selenium 和 Playwright 早已是开发者耳熟能详的工具。但今天要给大家介绍一款更轻量、更易用的 Python 库 ——DrissionPage。它以 "融合 selenium 和 requests 优势" 为核心设计理念,既能像 requests 一样高效处理静态网页…

理解Grafana中`X-Scope-OrgID`的作用与配置

X-Scope-OrgID的作用 该HTTP Header用于标识Loki日志数据的所属租户(组织)。在多租户模式下,Loki通过此Header隔离不同团队或用户的数据,确保查询和存储的独立性。数据隔离: 租户A的日志标记为X-Scope-OrgID: team-a&a…

【PycharmPyqt designer桌面程序设计】

在 main.py 中调用 Qt Designer 生成的 windows.py(假设它是 PySide2 版)。 只要把两个文件放在同一目录即可直接运行。 ──────────────────── 1️⃣ windows.py(Qt Designer 生成,已转码) # -*-…

Unity Android Logcat插件 输出日志中文乱码解决

背景之前安卓真机调试看日志,一直用的是Android Studio自带的adb命令进行看日志,不太方便,改用Unity自带的安卓日志插件时,存在中文日志乱码问题。插件安装基于Unity6000.1.11版本:Window -> Package Management -&…

Halcon双相机单标定板标定实现拼图

1.Halcon图像拼接算法在之前的文章里也写过,主要是硬拼接和特征点拼接两种方式,今天增加另一种拼接图像的方式。应用场景是多个相机联合一起拍大尺寸的物体,并且相机视野之间存在重叠区域。通过在同一个标定板上面标定,计算两个相…

动物世界一语乾坤韵芳华 人工智能应用大学毕业论文 -仙界AI——仙盟创梦IDE

提示词在一个奇幻的童话森林里,所有的动物都像人类一样直立行走,穿着各种搞怪的衣服。 一只戴着超大眼镜、穿着背带裤的乌龟,正一本正经地站在一个蘑菇舞台上,拿着一根树枝当作麦克风,准备唱歌。它的眼镜总是往下滑&am…

SpringBoot(原理篇)

大家好,这里是 盛码笔记。 本篇我们来聊一聊 Spring Boot 的“魔法”是如何实现的。你可能已经用过 Spring Boot 快速搭建项目,但有没有想过:为什么只需要引入几个 starter,Spring Boot 就能自动配置好整个应用环境? …

数据结构:栈(区间问题)

码蹄集OJ-小码哥的栈 #include<bits/stdc.h> using namespace std; #define int long long const int N1e67; struct MOOE {int ll,rr; }; stack<MOOE>st; signed main( ) {ios::sync_with_stdio(false);cin.tie(nullptr);int n;cin>>n;while(n--){int opt…

Vue 中 data、watch、created 和 methods

以下是 Vue 中 data、watch、created 和 methods 的详细解释&#xff0c;结合常见使用场景和示例&#xff1a;1. data&#xff1a;响应式数据容器 作用&#xff1a;定义组件的响应式数据&#xff08;状态&#xff09;&#xff0c;当数据变化时&#xff0c;视图自动更新。特点&a…

精密模具冷却孔内轮廓检测方法探究 —— 激光频率梳 3D 轮廓检测

引言精密模具冷却孔的内轮廓精度直接影响注塑成型效率与制品质量。冷却孔具有深径比大&#xff08;可达 25:1&#xff09;、结构复杂&#xff08;多为螺旋形或异形&#xff09;、表面质量要求高&#xff08;Ra≤0.2μm&#xff09;等特点&#xff0c;传统检测方法难以满足其高精…

Vue单文件组件与脚手架工程化开发

一、Vue与VueComponent原型关系解析1. 原型链关系图解在Vue中&#xff0c;组件实例(VueComponent)与Vue实例之间存在特殊的原型链关系&#xff1a;VueComponent.prototype.__proto__ Vue.prototype这种设计使得所有组件都能访问Vue原型上定义的方法和属性。2. 原理验证示例// …