特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

云栖号资讯:【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

最近,美国前国家安全顾问约翰‧博尔顿出版了他的新书The R: N # p . R ? I hoom Wher% % b [ ]e It M H v r J Happened,在书中,博尔顿写道,p G L L特朗普很容易受威权式领导人影响,经D + b o Z {常被他自己的顾问鄙视。

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

面对这项“U M & u v 0指责”,特朗普坐不住了,在接受《华尔街日报》采访时,特朗& 1 I d普直接说,“博尔顿是个骗子”,“白宫每个人都讨厌他”。

特朗普的这一说法尚未得到博尔顿发言人的回应。 8 k . u 0

特朗普这类迷惑言h 0 9 % v u z论对全世界民众来说也是见怪不怪了,不过,不知道你有没有想过,如果用AI识别这些特朗普的“川言川语”,会f S K c V 8 Q是什么情形?

别急,我们先回到三年前,当时特朗普正在针对第二次世界5 A Z u y i /大战发表演讲G a i Q q,那Q { ] S ] S :时特朗普式英语才面世不久,及其狂野的遣词造句、随意切换的时态和主语、扭曲的语法、前后冲突的连词、满天飞的介词,从句套从句、括号套括号,还多少让人有些不适应。

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

可能美国观众听了也蒙蔽一片。

不过也正是在那个时候,Bill Frischling就开始让他的AI机器人Margaret去转录特朗普讲话中一段127字的内容,当特朗普第四次提到“获胜”时,Margaret崩溃了。Frischling回忆说:“它仍% M v ? % v o x然试图像处理普通英语那样给这段话添加标点符号,而不是处理‘特朗普式英语’。”

科罗拉多大学人工智能与机器人技术实验室的负责人Frischling是一个自学成才F g t 3 {的程序员,疫情期间他在弗吉尼亚州的家中工作。

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

鉴于此,Marga] c Oret不得不重Y X i ^ H , [新设定特朗普模式,从头开始学习“O ! ~ 2 L { L川言川语”,于是Frischling聘请了一位有自动标点博士) D C u }学位的计算机专 . | M v 5 ~ n 3家来教Margaret“忘记”正常语法,转而学习分析特朗N I / n普的讲话。

特朗普生气了吗H $ a / ] - %

首先需要纠正一个说法,特朗普并不是AI学习的第一位美国总统,此前就有不少学者利用AI从各个角度分析了? u G @林肯的《葛底斯堡演说》,虽然整个演说只有272个单词,但相关研究书籍可以说能塞满整个图书馆。$ l k

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

面对“正统”的历任美国总统们,AI还能算是游刃有余,但是特朗普是普通人吗?因此| 3 0 ] t要学习“川@ y d C j r言川语”,难度可不是一般的大。

比如,在4月23日,特朗普在白宫举行了新冠病毒的简报会,那天特朗普建议医生应考虑向患者注射家用消毒剂以杀死病毒。会议开始后第52分钟,《华盛顿邮报》s c e Y p 2 $ I c记者Philip Rucke* S o r [r正在质问特朗普,他是否承认曾不负责任地大肆宣传q F E A P未经证实U ; k u = $ [ r的关于热和阳光可以治愈冠状病毒的消息。

特朗普回击道:“我r I l I E o是总统,而你才是在制造假新闻!”

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

让我们再往a R A 0 h / !前看看,2018年中期选举后的一场新闻发布会上,特朗普与0 q E k E 4 m $ ECNN记X H ( a D Q t m者Jim Acosta发生了一场令人难忘的对峙,当天共和党损/ } @ h q失惨重。

对话初期,特朗普针对AcosI G 7 e H h : M ;ta就移民问题向他施压时+ 1 ] ^ p 9 & R @怒吼道,“够了”!随后他下台。

这两场发布/ X y , x V会上,特朗普都真的生气了吗?

Margret的答案是,在新冠简报会上,特朗普真的生气了,在2018年的新闻发布会上, # J特朗普也真的生气了,但是当他下台后,他的情绪发生了“明显的变化”,他在享受这场冲突。D ~ } x L

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

要学习“川言川语”,到底难在哪?

某种程度上A U ` p # T,在Margaret眼[ J D l ) 7 ` y U中,特朗普是完全可以预测的。

几乎所有情况下,特朗普在脱稿时说话更快,大约每分钟220字,作为对比美国人均速度为每分钟110-150字;同时,大多数人在要说假话时语速会放慢,吞吞吐吐或者感觉很不自o X a H m在,但是特朗普相反,他会开始加快语速,而且会用一些“虚词”过渡,比如“S - k # B l % J (首先”,“人们在说”等,然后逐步放缓到正常语速: q {

Frisch# J m 3 N / G ` jling把这种速度变化称为特朗普的“推销员模式”。

当对着提词器读稿时,特朗普的语速会减慢到每分钟111字,对于这类准备好的演讲,特朗普说话听起来很单调麻木,在重点处随意发挥,好像是第一次见到稿子一样。特朗普之前说过,对于竞选总统! 8 # o s _ %的人来说B Z l + 4 `,读稿是非法的。

Frischling总结道:“你可以把这个过程想象成是开车,一般人是正常行驶,特朗普则是超速行驶。”不过,他认为,这个结果并不能说明特朗普话语中的真假成分,在这方面,他会单独请人在核查事实后,再对数据进? h x行交叉8 G f检查。

除了语言上的不同,肢体上呢q 5 6?在这我们就可以解答一下上面的答案了。

特朗普真正生气时,他的话也会随之变得简洁,i j e i - &挥舞着的手臂也会静止下来,“当他停止做手势时,那g Q t A就意味着该小心了。无论要发生什么事,请保持警惕。”

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

根据Margret用曲线描绘的特朗普压力水平变化情况,在新冠简报会上,他和《华盛顿邮报》= W ] w # v ~ Y 0记者对峙时,曲线突然飙升。不过根据以往的经验,特朗普在面对“假新闻”这类攻击时,y ^ % G x o他的内心其实是毫无波动的,“声音、语速、说话方式…..一切都和说‘天气怎么样’时一N 8 , , @ # ! ) .样”,Frischling说。

而在选举后的新闻D z & E G O p w发布会上+ [ j q V Z ^,当特朗普在台上的时候,曲线也处于. l R & 8 ] i十分高的水平,但当他戏剧性地走下讲台并交叉双臂时,压力曲线下降到了平均值,这正是他在享受这场冲突的标志E : M ) U 2 F a

学习了1100万字的内容后,Margret比特朗普还了解自己

迄今为止,Margaret已经学习了超过1100万字的特朗普讲话、推文、书籍、集会、视频、广播和电视剪辑,这些资料可以追溯到1976年,特朗普第一次在纽约时报发表公开信的时候。

如今Margaret比许多美国人更能理解特W E l朗普的讲话模式,甚至更理解特朗普,他的用词,他的下意V D X l S识的表达,他的倾向[ ( W X V 0 e |和习惯。说Margret是这个世界上c s O k最了解特朗普的人也不为过。

而且她还有着极强的耐心和学习能力,她不会因为} | 0特朗普的演讲而欢呼、嘲讽或转台,她只是在那里静静地分析特朗普的每一句话和他说话的方式,再用算法从一个存有四十多年语言资料的数据库中收集信息,. K }试图解读s R M [ T / n i w他“不稳定的内心”。

Margaret的_ B ` l i o R - (一项重要发现就是,特朗普之所以可以快速地说出一些明显很荒谬的假话,是因为他根本不在乎。

Frischling解释道:“大多数人在不说实话时,不会感觉更自在,反而会感觉不太舒服。但特朗普正相反。”Margaret可以评估出特朗普的压力水平,他是否冷静,是m ; r真的生气,还是只是在表演,甚D k _ 2至还可以模拟特朗 ) T N z T x 6 k普的公开讲话。

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

为了得出这些结论,Margret会追踪特朗普说话的停顿、手势、语速,他使用的形Z & j r V E { @容词类型,他是否在使用他的常用词汇,以及他的语气等等。

“他说的每B & % = p个字都使Margaret变得更聪明,并让她能够听出更微妙的区别。”Frischling说。

MIT学生:建立特朗普模型?太简单!

特朗普被分析也不是最近才出来的。

早在2016年,一位麻省理工学院的研究生Bradley Hayes就创造o e 3 !了一个发推特的机器人@DeepDrumpf,这个机器人能用混乱的语言来模q M 4仿特朗普在社交媒体中的发言,比如“我们必须制造美国。他们做不到。因为我要为这个国家付出代价”。

特朗普演讲逼疯AI?从头学习了1100万字后,AI能读懂“川言川语”吗

由于在一条推文中,该账号提到将释放暴力恐怖分子来威胁前总统奥巴马,Hayes不得不屏蔽一条推文。不过他表示,如果有更多的时间、更好的数据,这个机器人将会变得更强大。

Hayes在接受采访时坦言道,特朗普的语言比其他人更简单,因此在建模上,特朗普的模型是最容易建立起来的。如果能与某一天之内所有人与特朗普谈话8 } L / 9 v W t过的人进行交流,那么你很有可能会建立一个更加9 @ ) | { E 7 f准确的模型,更好地预测他将要谈论的内容和他的立场。

Hayes表示,他们只让AI学习了几个小时的特朗普演讲内容,然后随机选择字母作为句子的开头,逐个字母进行构建。比如,如果AI首先选择了字母“M”,它可能会在其后马上跟上字母“A”,然后“K”,直到整个单词和句子能够阐明特朗普最喜欢的口号,“再次使美国变得伟大”(Make America Great Again)。

一个特朗普M ( L m,竟然要AI与其他多领域专家共同联手

AI技术显然提升了研究的手段和标准。! . P # | S t Y

Margret是新闻工作者、学者和政治家的首选资源,亚马逊的数百万个语音激活的Alexa设备,也会利用Margaret获取特朗普的日程X = ? O e安排和最8 D 4 y v 0新推文。在新冠病毒危机中,为期数周的每晚简报为分析提供了最典型的v C i t素材,他肆无忌惮地宣称自己取得了成功,并完全无视对政府错误应对的质疑。

至此,为了研究特朗普非正统的讲话风格,AI与语言学家、认知专家、理论心理学家和政治学家建立了合作关系。

计算机科学家认为,人工智能可以检测对人类大脑而言F P ) z y过于复杂的大量数据= [ a ] B m,从中发现模式。情报专家怀疑,外国间谍服务正在将AI分析与人格特征和传统的基于个人的研究方u B ( S v法相结合,以分析特朗普和其他世界领导人。

“一开始,特朗普把所有人都搞晕了”,前中央情报局特工John Sipher说道,他V # ` k F I ( Z几十年来一直被部署在俄罗斯和其他国家,“现在大家才开始理解他在想什么”。

麻省理工学院可部署机器学习中心的教授Aleksander Madry警告说,这项技术并非万无一失,而且通过机器学习发现的K y ` K p - T T模式“通常不是我们想象的那样。”

一些程序员曾使用机器人伪造特朗普演讲,而这些“假货”拥有可能搅乱美国政治的能力。这种应用是一个危险的信号。

Bradley Haye0 H ] & %s表示,几乎每个拥有大型数据集的人v % & C m都可以使用AI机器人得出有意义的结论——或者歪曲这些结论。

如果说特朗普的语言通常可以预测,那么他的决定有时似乎完全是随机的。

Frischling为他的私人客户研究M ^ A _ $ O过一些国会议员,他认为他们在决定转变政策之前会有一些预兆,比如会就某些话题发表更$ P } w多的公开评论,或者改变说- 7 - / f c 2 T U话方式。但这些关系在特朗普身上几乎没有看到。

Frischling表示,“对于一项政策提议,他可以先是说‘我认为这太糟糕了’,然后又在10小时之内签署一条行政命令批准这项政策。”MargaretW b 8 O V m # a仍在努力理解这一点。

或许可以说,特朗普的种种迷惑行为也正“歪打正着”地保护着美国。

【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live

立即加入社群,与+ Y 6专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8W q b + 7 fgvnK

原文发布时间:202_ , r L ) K ?0-06-22
本文作者:大数/ C : N r f ,据文摘
本文来自:“3Y X G {6kr”,k N / b p ?了解相关信息可以关注“36kr”