主题层次的情感分类

1 任务及数据集介绍

该项目作业的具体任务是来自于 BDCI2018-汽车行业用户观点主题及情感识别的题目。数据是网络中公开的用户对汽车相关内容的评价文本。此任务是对每条文本内容(即用户评论)进行分析,确定该条评论中讨论的主题以及每个主题的情感信息,以此获知用户对所讨论主题的偏好。

其中主题一共分为 10 类:动力、价格、内饰、配置、安全性、外观、操控、油耗、空间、舒适性。情感分为 3 类:中立、正向、负向,分别用数字 0、1、-1 表示。

训练集数据一共有 10654 条评论,已由人工进行标注,为 CSV 格式的文件,以逗号分隔,首行为表头,字段说明如表 1 所示。其中 content_id 与 content 一一对应,但同一条 content 中可能包含多个主题,此时会出现多条记录来标注不同的主题及情感,因此在整个训练集中 content_id 存在重复值。

测试数据也为 CSV 格式的文件,首行为表头,字段有 content_id 和 content,与训练集对应字段相同。

但由于 BDCI 官网上此比赛已结束,线上提交接口已关闭,我们无法在测试数据对模型进行评估。因此,此次项目作业完全是在训练数据上进行的。我们将训练数据按照 8:1:1 的比例划分成训练集(8523 条数据)、验证集(1066 条数据)、测试集(1065 条数据)。

    表1: 训练集字段说明

字段名称

类型

描述

说明

content_id

Int

数据 ID

content

String

文本内容

subject

String

主题

分析出的主题

sentiment_value

Int

情感分析

分析出的该主题的情感

该任务采用 F1 值评估指标,按照“主题 + 情感词”精确匹配的方式,用 Tp 表示判断正确的数量,Fp 表示判断错误或多判的数量,Fn 表示漏判的数量。则准确率

,召回率

2 相关工作

上述任务是一个主题级别(Aspect-level)的文本情感分类任务,它是情感分类的一个分支,其目标是识别出句子中某个特定主题的情感极性。相比文档级别的情感分类任务,主题级别的情感分类是更细粒度的分类任务,它可以克服文档级别情感分类的局限性。尤其是当一篇文本中同时涉及多个主题时,正负的情感极性通常是混杂在一起的,如果忽略主题信息,我们很难确定目标文本的情感极性。比如“great food but the service was dreadful”,在这条用户对餐厅的评论中同时涉及到了“食物”和“服务”两个主题,而且用户在这两个主题上的评价的情感极性是相反的,如果我们在文本层次进行情感分类,很难说这条文本是正向的,还是负向的,甚至是中性的。

在主题级别的情感分类任务上,目前已有的工作大致可以分为两类。一类是基于手工提取的特征和机器学习算法的级联方法,例如 Nasukawa 等人[1]的工作中,首先对句子进行依存句法分析,然后使用预定义的规则确定每个主题的情感极性。Jiang 等人[2]提出,基于句子的语法结构构造一些主题依赖的特征,将这些特征和其他文本内容特征一起作为 SVM 分类器的输入,从而提高主题依赖的情感分类的准确度。另一类工作是采用端到端的神经网络模型,使用神经网络模型可以自动进行表征学习,不需要花费大量时间进行手工工程或者编写规则。在这类模型中,大多数是基于 LSTM 的网络架构,因为 LSTM 可以很好地处理像文本这样的序列数据,而且可以捕捉到长期依赖。例如 Tang 等人[3]提出了 TD-LSTM 的方法,该方法的基本思路是通过两个 LSTM 网络分别来建模主题的左、右上下文,然后使用这两个 LSTM 网络的输出的串接进行情感预测。除此之外,近年来的工作中也大量使用注意力机制,它和 LSTM 结合,在很多任务上可以提高网络性能。例如 Wang 等人[4]提出了 AE-LSTM 模型和 ATAE-LSTM 模型。AE-LSTM 模型是先将文本通过 LSTM 网络层,得到每个词对应的隐单元输出,然后结合主题向量表示计算一组注意力值来加权句子的不同部分,从而得到最终的向量表达,进行情感分类。相比 AE-LSTM 模型,ATAE-LSTM 模型更强调主题向量表达的影响,它把主题向量表达和每个词的向量表达串接在一起进行建模,得到文本的表示。Ma 等人[5]提出了 IAN 模型,该模型使用两个 LSTM 网络分别对句子和主题进行建模,然后对句子的隐状态进行池化操作,使用池化的结果和主题的隐状态计算一组注意力值,对主题的隐状态进行加权得到主题的最终向量表示,同时对主题的隐状态进行池化操作,使用池化结果和句子的隐状态计算另一组注意力值,对句子的隐状态进行加权得到句子的最终向量表示,最后将两个向量表示串接起来进行情感分类。

3 模型

针对 BDCI-2018 的汽车行业用户观点主题及情感识别任务,我们在调研的基础上对一些模型进行改进,从而使其能够适应该任务的特点和需求。最终实现的 3 个模型的具体思路如下。

3.1 基于 AOA 的改进模型 1

第一个模型架构如图 1 所示,是对 AOA(Attention Over Attention)模型[6]的改进,一共分为四个部分:词嵌入模块、双向 LSTM 模块、注意力模块和最终的分类预测模块。

词嵌入模块:对于一个给定的句子,经过分词之后可以将其表示为

。对于所有主题,我们可以将其表示成

(此任务有 10 个主题词,则 m=10)。我们首先使用预训练好的词向量将每个词

映射到一个低维的实值向量

。则句子和主题分别通过一个词嵌入层之后我们可以得到两个词向量集合

双向 LSTM 模块:我们将得到的词向量 s 和 t 分别通过一个双向 LSTM 层来学习句子和主题的隐含语义表达,结果为双向 LSTM 隐单元输出的串接,此时可以得到句子和主题的表达

注意力模块:对于上一步得到的

,我们首先计算一个相互作用矩阵

,矩阵中的每个元素

表示句子中的某个词

和某个主题

之间的关系。然后我们对矩阵

的每列进行 softmax 操作,得到 aspect-to-sentence 的注意力值

,其中

。直观来讲,

每一列的意义是,对于某个主题而言,句子中的哪些词比较重要。最终根据注意力值

和句子的隐含语义表达

来计算各主题感知的句子向量表达,即

分类模块:我们将上一步得到的句子表达向量

展平,然后输入到两层的全连接网络,得到 40 维的分类结果。对于 10 个主题中的每一个主题,对应有 4 维输出结果,分别表示句子中不含该主题的概率、该句子在该主题的情感极性为中性的概率、该句子在该主题的情感极性为正向的概率、该句子在该主题的情感极性为负向的概率。对每个主题的四维输出结果进行 softmax,以此判断该句子是否不含该主题或者该句子在该主题上的情感极性。

图1:AOA模型整体架构

3.2 基于 IAN 的改进模型 2

第二个模型架构如图 2 所示,是对 IAN(Interactive Attention Networks)模型的改进,一共分为四个部分:词嵌入模块、双向 LSTM 模块、交互注意力模块和最终的分类预测模块。

词嵌入模块:与上一个模型相同,句子和主题分别通过一个词嵌入层之后我们可以得到两个词向量集合

双向 LSTM 模块:将得到的词向量 s 和 t 分别通过一个双向 LSTM 层来学习句子和主题的隐含语义表达,结果为双向 LSTM 隐单元输出的串接,此时得到隐状态

交互注意力模块:对于上一步得到的

,我们首先进行平均池化,得到

。然后由

和句子的隐状态

计算一组注意力分值,其中每个分值

,由注意力值对句子的各部分进行加权,得到句子的最终向量表达

。同时由

和主题的隐状态

计算另一组注意力分值,其中每个分值

,由该组注意力值对各主题进行加权,得到主题的最终向量表达

。两组注意力分值的计算公式中,

分类模块:我们将上一步得到的主题和句子的最终向量表达

串接起来,然后输入到两层的全连接网络,得到 40 维的分类结果。对于 10 个主题中的每一个,有 4 维输出结果,分别表示句子中不含该主题的概率、该句子在该主题的情感极性为中性的概率、该句子在该主题的情感极性为正向的概率、该句子在该主题的情感极性为负向的概率。这一步与上一个模型相同,对每个主题的四维输出结果进行 softmax,以此判断该句子是否不含该主题或者该句子在该主题上的情感极性。

图 2:IAN 模型整体架构

3.3 基于 AEN 的改进模型 3

第三个模型架构如图 3 所示,是利用 AEN(Attention Encoder Networks)模型[7]对 AOA(Attention Over Attention)模型的更深层次改进,一共分为五个部分:词嵌入模块、双向 LSTM 模块、注意力模块、多输入池化模块和最终的分类预测模块。

词嵌入模块双向 LSTM 模块注意力模块:这三个模块与第一个模型 AOA 相同,总共得到三个输出向量,句子的隐层状态

和主题的隐层状态

以及句子和主题交互得到的主题交互状态

,这三个向量都是下一个模块的输入。

多输入池化模块:将上一步得到的三个输出分别进行一维最大池化,得到三个池化结果向量,对应为

以及

,然后将三个池化向量串接,得到最终分类模块的输入向量 x

分类模块:最终的分类模块输入为上一步三个池化向量的串接展平结果,分类机制与前两个模型相同。对每个主题的四维输出结果进行 softmax,以此判断该句子是否不含该主题或者该句子在该主题上的情感极性。

图3:AEN模型整体架构

4 实验过程与结果

4.1 实验过程

第一步:对任务数据进行分词,得到数据集的词典,及每个词的 embedding,结果文件 embeddings.p 会输出到指定目录下。(因为本实验使用腾讯公开的预训练的汉语词嵌入,数据量比较大,为了减少模型训练时的计算资源需求,我们先处理得到本任务数据集的词典,并提取出这些单词的 embedding 另存到文件 embeddings.p)

python get_embed.py \
--train_data_path=path/to/train_data \
--embed_data_path=path/to/pretrain/word_embedding \
--out_embed_dit=dir/to/save/output_file

第二步:模型训练及评估。如前所述,我们将训练集以 8:1:1 的比例划分成训练集、验证集和开发集进行实验,此处我们的超参数具体设置如下所示。

python aspect_senti.py \--train_data_path=path/to/train_data \--embed_data_path=path/to/embeddings_.p \--out_dir=/dir/to/save/model \--max_sentence_length=256 \--lstm_hidden_size=100 \--dense_hidden_size=512 \--leakyRelu_alpha=0.01 \--drop_rate=0.5 \--reg_rate=0.001 \--optimizer=adam \--lr_factor=0.65 \--batch_size=32 \--epochs=30

为了方便运行,模型必须的参数都已经在代码中设置了默认值,均是在验证集上进行调参之后的最佳参数设置,而且项目目录已经按照需要进行调整,只需输入 python 加模型名称即可运行不同的模型,比如 python aen.py。

4.2 实验结果

三个模型训练时使用的损失函数均是各主题的交叉熵损失之和。训练过程中我们保存在验证集上

值最大的模型,然后在测试集上进行评估,同时每个模型还测试了不同的固定文本长度。三个模型在测试集上的评估结果如下表:

据 BDCI 官网上该任务的排行榜,官方测试集上最好的模型表现为 F1=0.708。由于我们无法再官方测试集上进行模型评估,因此我们的结果和排行榜结果无法进行的严格比较,但从结果来看,我们的模型还是表现不错的。

5 总结

通过此次项目实践,我们了解了文本情感分析的相关模型,尤其是主题级别的情感极性分析,改进了端到端的神经网络模型,如 AOA、IAN 和 AEN,使得模型能够适应主题层次情感分类任务的特点和需求。我们遇到的问题要比普通的文本分类任务更加复杂,在该问题中,一篇文本中通常会同时涉及多个主题,正负的情感极性通常是混杂在一起的,如果忽略主题信息,我们很难确定目标文本的情感极性。因此,在在主题级别的情感分类任务上,我们在调研的基础上对 AOA、IAN 和 AEN 模型进行了改进,从而使其能够适应该任务的特点和需求。

在 BDCI 官方数据集上,我们将训练集以 8:1:1 的比例划分成训练集、验证集和开发集进行实验,设置模型的固定文本长度分别为 60 和 256,三个模型的表现不错,其中 AOA 模型和 AEN 模型的 F1 值均超过了官网测试集上最好的模型表现。由于我们无法对官方发布的测试集进行线上评估,因此无法和赛题排行榜进行精确对比,但就排行榜情况来看,最好成绩也不高于 0.71,我们的方法所取得的结果是不错的。

情感分析是自然语言处理中常见的场景,比如汽车行业用户观点主题及情感识别,对于指导产品更新迭代具有关键性作用。通过对用户评价进行情感分析,可以挖掘产品在各个维度的优劣,从而明确如何改进产品。比如对用户评价进行分析,可以得到汽车动力、价格、内饰、配置、安全性、外观、操控、油耗、空间、舒适性等多个维度的用户情感指数,从而从各个维度上改进现在汽车行业的制造和销售状况。

深度学习在 NLP 领域内应用相当广泛,在情感分类领域,我们同样可以采用深度学习方法。基于深度学习的情感分类,具有精度高,通用性强等优点。通过完成这次项目作业,我们对情感分类问题有了更深入的认识,对神经网络模型有了进一步的掌握,获益良多。

参考文献:

1.Nasukawa, T., Yi, J.: Sentiment analysis: Capturing favorability using natural language processing. In: Proceedings of the 2nd international conference on Knowledge capture. pp. 70–77. ACM (2003)

2.Jiang, L., Yu, M., Zhou, M., Liu, X., Zhao, T.: Target-dependent Twitter sentiment classification. In: Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics: Human Language Technologies-Volume 1. pp. 151–160. Association for Computational Linguistics (2011)

3.Tang, D., Qin, B., Feng, X., Liu, T.: Effective lstms for target-dependent sentiment classification. In: Proceedings of COLING 2016, the 26th International Conference on Computational Linguistics: Technical Papers. pp. 3298–3307 (2016)

4.Wang, Y., Huang, M., Zhu, X., Zhao, L.: Attention-based lstm for aspect-level sentiment classification. In: EMNLP. pp. 606–615 (2016)

5.Ma, D., Li, S., Zhang, X., Wang, H.: Interactive attention networks for aspect-level sentiment classification. In: Proceedings of the Twenty-Sixth International Joint Conference on Artificial Intelligence, IJCAI-17. pp. 4068–4074 (2017)

6.Huang B, Ou Y, Carley K M. Aspect level sentiment classification with attention-over-attention neural networks[C]//International Conference on Social Computing, Behavioral-Cultural Modeling and Prediction and Behavior Representation in Modeling and Simulation. Springer, Cham, 2018: 197-206.

7.Song Y, Wang J, Jiang T, et al. Attentional Encoder Network for Targeted Sentiment Classification[J]. arXiv preprint arXiv:1902.09314, 2019.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若转载,请注明出处:http://www.pswp.cn/pingmian/85105.shtml
繁体地址,请注明出处:http://hk.pswp.cn/pingmian/85105.shtml
英文地址,请注明出处:http://en.pswp.cn/pingmian/85105.shtml

如若内容造成侵权/违法违规/事实不符,请联系英文站点网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot 线程池 配置使用详解

一、核心特性 Springboot 集成 支持 Async 注解,简化异步方法调用。 参数可配置化 核心线程数、最大线程数、队列容量、拒绝策略等均可通过配置调整。 生命周期管理 实现 Lifecycle 接口,支持线程池的启动和关闭(如应用关闭时优雅终止任务…

Elasticsearch/OpenSearch MCP Quickstart

项目概述 elasticsearch-mcp-server 是一个基于 Model Context Protocol (MCP) 的服务器实现,提供了与 Elasticsearch 和 OpenSearch 交互的能力。该服务器允许用户搜索文档、分析索引以及管理集群,通过一系列工具函数实现这些功能。 项目结构 项目主…

《Elasticsearch 分布式搜索在聊天记录检索中的深度优化》

Elasticsearch 分布式搜索在聊天记录检索中的深度优化 引言 在现代聊天应用中,聊天记录检索面临着数据量大、查询复杂、实时性要求高的多重挑战。以某社交平台为例,其聊天记录每天新增数千万条,总数据量达百亿级,用户需要在海量…

CSS实现元素撑满剩余空间的5种方法

CSS实现元素撑满剩余空间的5种方法 🎨 在日常开发中,我们经常需要让某个元素占据容器的剩余空间。这是一个常见的布局需求,比如侧边栏主内容区、头部内容区底部等布局。本文将介绍5种不同的方法来实现这个需求,并分析各种方法的优…

[AI]从零开始的YOLO数据集增强教程

一、前言 不知道大家在训练YOLO时有没有遇到过这样的情况,明明数据集已经准备了很多了,但是YOLO还是不认识某个物品,或者置信度低。那么有没有办法让我们不制作新数据集的情况下让代码帮我们生成新的数据集来训练模型呢?当然有&am…

软件工程的相关名词解释

目录 1. 软件生命周期2.开源软件3.软件工程4.模块化原则5.信息隐藏原则6.双向追踪7.原型8.软件需求9.需求工程10.边界类11.软件实现(的任务)12.软件缺陷13.回归测试14.软件β版15.软件部署16.纠正性维护17.改善性维护18.适应性维护19.软件逻辑老化 1. 软…

2025.06.17【BUG】|多样品VCF文件合并技巧及注意事项(以bcftools为例)

文章目录 [toc]一、合并VCF的常用命令1.1 合并多个bgzip压缩的VCF文件1.2 使用文件列表合并 二、合并前的准备与注意事项2.1 文件格式要求2.2 样本名唯一性2.3 检查文件模式匹配 三、常见报错与解决方法3.1 报错:Error: Duplicate sample names (sample1), use --fo…

包含30个APP客户端UI界面的psd适用于旅游酒店项目

包含30个APP客户端UI界面的psd适用于旅游酒店项目 此资源包含30个完全可编辑的psd界面组成。内容包括欢迎页、登录、注册、首页、搜索、侧边菜单、用户中心、个人介绍、用户空间、产品详细信息、酒店预定、天气情况等各种常用界面,您可以将其用于旅游酒店类的APP应用…

ArrayList源码分析

目录 ArrayList简介 ArrayList和vector的区别(了解即可) ArrayList添加null值 ArrayList和LinkedList区别 ArrayList核心源码解读 ArrayList扩容机制分析 一步一分析ArrayList扩容机制 hugeCapacity()方法 System.arraycopy() Arrays.copyOf()方法 …

NX二次开发C#---通过Face找Edges,再通过Edges找Curve

文章介绍了一个名为AskFaceEdge的静态方法,用于处理3D建模中的边缘曲线生成。该方法通过NX Open API调用,主要功能是获取指定面的边缘并生成相应的曲线。方法接收两个参数:faceTag(面标签)和curveLoop(曲线…

设计模式笔记_创建型_工厂模式

1. 工厂模式简介 工厂模式是一种创建型设计模式,主要用于创建对象实例。 它通过定义一个接口或抽象类来创建对象,而不是直接实例化具体类,从而将对象的创建过程与使用过程分离。 工厂模式通常分为两种类型: 简单工厂模式&#x…

2025.6.16总结

工作:今天闭环了个遗留问题。在做专项评估时写得太简单,这让测试经理质疑你的测试质量。如果换位思考,你是测试经理,你该怎么去把握风险和保证产品的质量,就知道写得太简单,没有可信度。 找开发看了下后台…

记录:安装VMware、Ubuntu、ROS2

安装了VMware,就能够在Windows系统装安装Ubuntu,使用Linux系统。安装了Ubuntu,就能在里面安装ROS2,之后写代码控制机器人儿。 安装VMware 我安装的是16 pro【具体是vmware16.2.4】,下载网站:VMware Works…

将后端数据转换为docx文件

使用docx npm install docx 按照注释处理数据并转换为对应的bolb数据流 <template><Button type"primary" click"handleDocxCreate">{{buttonTitle || "报告生成"}}</Button> </template><script> import {Doc…

数据结构排序算法合集

快排 private static void quickSort(int[] ret) { quick(ret,0,ret.length-1); } private static void quick(int[] ret, int left, int right) { if(left>right) 记一下这里是大于等于 return; int pivot partition(ret,left,right); quick(ret…

【算法笔记】红黑树插入操作

红黑树插入与调整详解 一、红黑树的五大性质 红黑树是一种自平衡的二叉搜索树&#xff08;BST&#xff09;&#xff0c;其核心特性如下&#xff1a; 颜色属性&#xff1a;每个节点非红即黑根属性&#xff1a;根节点必须为黑色叶子属性&#xff1a;所有的 NIL 叶子节点都是黑…

认知计算革命:从算法创新到产业落地的AI专业核心应用全景

​​一、自动化机器学习&#xff08;AutoML&#xff09;​​ ​​技术机理与产业实践深度剖析​​ ​​神经网络架构搜索&#xff08;NAS&#xff09;​​ 强化学习方案&#xff1a;Google Brain的NASNet采用策略梯度优化卷积单元进化算法方案&#xff1a;DeepMind的AmeobaNe…

篇章十 论坛系统——业务开发——板块和帖子

目录 1.板块 1.1 思路 1.2 实现逻辑 1.3 参数要求 1.4 实现步骤 1.Mapper.xml 2.Mapper.java 3.Service接口 4.Service实现 5.单元测试 6.Controller 7.测试API 8.前后端交互 2.帖子 1.1思路​编辑 1.2 参数要求 ​编辑 1.3 实现步骤 1.Mapper.xml 2.Mapper…

React Native 上线前的准备与企业实战经验总结

上线前的准备与企业实战经验总结 关键要点 热更新简化部署&#xff1a;CodePush 和 Expo OTA 允许快速推送 JavaScript 和资源更新&#xff0c;绕过应用商店审核&#xff0c;适合修复 Bug 或小规模功能迭代。监控与分析提升质量&#xff1a;Sentry 提供实时错误跟踪&#xff…

【AI时代速通QT】第一节:C++ Qt 简介与环境安装

目录 前言 一、为什么是 Qt&#xff1f;—— C 开发者的必备技能 二、Qt 的核心魅力&#xff1a;不止于跨平台 2.1 优雅之一&#xff1a;代码隔离&#xff0c;清晰明了 2.2 优雅之二&#xff1a;信号与槽&#xff08;Signal & Slot&#xff09;机制 2.3 优雅之三&…