Argument Mining with Sructured SVMS and RNNS

Abstract:

提出了一种新的用于论辩挖掘的因子图模型,设计于处理文档中的非树结构数据(大概有20%的数据是非树结构的)。

我们的模型联合学习论元分类和论元关系预测

此外模型支持SVM和RNN参数化,可以强制执行结构约束(例如传递性),并且可以示相邻关系和命题之间的依赖关系,我们的参数化设计是什么意思方法在网络评论和论辩文章中超过了非结构数据集的基础线。(这个不懂)


Introdu人工智能北京共识ction

论辩挖掘包括自动识别文档中的论辩结构,可以应用于决策,总结和教育领域人工智能al女神古力娜扎(医学难道不行吗hhh)。论辩挖掘的子任务包括将命题分类为元素级别,并且识别元素单元之间的关系。

这个感觉20年的文章讲的更详细一些

希望得到的输出是一个人工智能北京共识文档论辩结构图。

论文里面好多也是重复的话。就是把论元当成节点,然后关系作为有向边。

大多数的标记和预测都在致力于挖掘一些树结构或者森林结构的文档(Joint prediction in MST-style系统运维的主要任务 disco系统运维工程师面试问题及答案urse parsing for argumentation mining 2015)(Parsing树结构是什么 argumentation structures in persuasive essays),参数化建模是什么意思约束论辩结构来建造一个或者多个树结构。通过支持使用最大生成树样式的解析方法来使得问题计算更容四叉树结构易(不太看得懂这句)(This makes the proble数据集中趋势的示方法有m comp参数化建模是什么意思utationally easier by enabling the use of maximum spanning tree–style parsing approach)

但是论辩结构可能实际上并不是那么理想的树结构。通过将论辩挖掘述为因子图中的推理,我们的模型可以解释这两项任务中的相关性,可以考虑二阶链路结构。比如c->b->a。可以施加任意约束(比如传递性)

为了参数化我们的模型,人工智能al女神古力娜扎我们评估了两种备人工智能北京共识选方向

1.线性结构SVM(Large margin methods for structured and interdependent output variables)

2.RNN和结构损失,扩展(Simple and ac人工智能al女神古力娜扎curate dependency parsing using bidirectional LSTM f参数化建模是什么意思eature repre深度学习sentations.)

有趣的是RNN在使用分类loss人工智能对人类社会发展的影响的时候执行的很差劲,但是在我们提出的结构化学习模型中进行培训之后可以linux操作系统基础知识和特征功能化结构化SVM一样优秀。

我们在两种论辩挖掘数据集上评估我们的模型

1.CDCP,一堆非树结构的

2.UKP,树的(Parsing argume柳树结构ntation structures in persuasive essays 2016linux系统

在这两种case下,我们的模型超过了非结构化基线。

UKP中,我们改进了基于整数线性规划后处理的最佳报告结果中的链路预测


                                            Argument Mining with Sructured SVMS and RNNS

为了深入了解提出模型的优缺点,以及SVM和RNN参数化之间的linux必学的60个命令差异,我们进行了误差分析。

支持论辩挖掘研究,我们发行了我们的Python实现我们模型支持命题分类的多任务学习,参数化高阶结构的邻接矩阵(c->a->b) 和对链接结构强制性执行任意约束,不限于树。

高阶结构和逻辑约束成功的应用在了依赖和语义解析(Turning on the Turbo: Fast third-or系统运维工程师der non-projective Turbo Parsers 2013)(Priberam: A Turbo Seman树结构是什么tic Parser with second order features)

据我们所知,我们是第一个将它应用于论辩挖掘的,也是第一个来将其用神经网络参数化的。

(Parsing argumentation structures in persuasive essays 2016)人工智能北京共识使用整数线性规划,使用手工编制的评分公式来联合独立命题和链接分类器的输出。

我们的因子图方法可以以一种更具有原则性的方式将两项任务联合起来,因为它充分了解了两项任务之间的相关性,而无人工智能概念股人工智能概念股依赖手工评分,因此可以很容易的应用于其他树结构图论证数据集。此外,我们的模型可以使用(Parsing a数据集下载网站rgumentalinuxtion structures in persuasive essays 2016)使用的MS数据集是什么意思T循系统运维工程师面试问题及答案环约束来强制执行UKP数据集所需的树结构约束,多亏了 AD3 参考算法(AD3: Alternating directions dual decomposition fo犀牛参数化r MAP inference in graphical models 2015).

序列标注已应用命题识别和分类相关的结构化任务

(Parsing argumenta树结构和部首是什么tion str参数化是什么意思uctures in persuasive essays

Argumentation mining in user-generated web dislinux操作系统基础知识course Conditional random fifields for identifying appropriate types of support for p数据集市和数据仓库的区别ropositions in online user comments) 整合这些模型是下一步的重要步骤。与此同时,一个新的方向探索了pointer networks四叉树结构( Here’s my point: Argumentation mining with pointer networks) 一种很有前途的方法人脸参数化,目前缺乏对树结构和领域特定约束的支持。


Data

发布了一个新的论点挖掘数据集,包括消费者金融保护局从eRulemaking 网站上手机的关于消费者债务催收实践(CDCP)的规则建议的用户评论。​

在网站里找到的论辩结构比如我们使用的eFulemaking可以是更自由的,引出了

( Joint prediction in MST-style discourse parsing for argumentation mining 2015 )。 正因如此,我们采用了( Toward machine-assist犀牛参数化ed participa树结构中数据元素之间是什么关系tion in eRulemaking: An argumentatio人工智能电影n model of evaluab数据集网站ility 201数据集网站5)提出的模型,该模型使用无限制有向图,不对树结构进行约束。 事实上20%评论,在我们的数据集中显示了树中不允许的结构。 可能的链接类型是原因和事实,命题类型分成五个细人工智能al女神古力娜扎粒度类别

  • POLICY和VALUE包含主观判断,解释,其中只有POLICY规定了要采取的具体行动。另一方面
  • TESTIMONY和FACT不包含主观的解释,前者包括个人经历,或者趣闻。
  • REFE系统运维主要做什么RENCE包括URL和引数据集用,用犀牛参数化于在线环境中指向客观证据。

作为比较,UKP数据集值使用了句法的区分,数据集市和数据仓库的区别CLAIM,MAJOR CLAIM和PREMISE,但是他也包含了attack linlinuxks。UKP中允许的连接结构更为严格,链接在注视中受到约束,已在每个段落内形成一个或者多个不相数据集交的有向树。 此外,优于web论辩不一定是完全开树结构图发的,我们的数据集包含许多论辩参数化设计案例命题是没有论辩关系的。事实上,评论中完全没有争论性的链接并不罕见:28%的CDCP评论是没有链接的,而UKP,所有的文章都有完成的论辩结构。这种没有链接的评论使问题变难了,强调了系统/运维捕捉缺失论辩支持的重要性而不仅仅只是存在的。


Annatation results

每个用户评论都有两个哥linux删除文件命令们进行注释,他们分别注释了命题的边界和类型,以及命题人工智能专业之间的链接(使用的GATE a深度学习nnotation tool(cunningham et al., 2011))人工智能概念股为了生成最后的语料,第三种注释者手动的解决了冲突。(本章看不懂,跳过,偷个懒)