今天,如果是AI在辩论…… 励志故事

/ / 2019-05-31
洪泰出品: 北京时间今天上午8点25分,万众瞩目的中美女主播大辩论正式开战!不过,让大家失望的是,这场辩论毫无“火花四溅”,也不够透彻“过瘾”,16分钟的简短对话远未达到大家的期待值。 说到辩论,这一起源于两千年前的古典希腊的表达方式,常常应用在当人们遭遇进退两难、难以抉择的公共问题之时。延续至今......

洪泰出品:


北京时间今天上午8点25分,万众瞩目的中美女主播大辩论正式开战!不过,让大家失望的是,这场辩论毫无“火花四溅”,也不够透彻“过瘾”,16分钟的简短对话远未达到大家的期待值。


说到辩论,这一起源于两千年前的古典希腊的表达方式,常常应用在当人们遭遇进退两难、难以抉择的公共问题之时。延续至今,辩论已成为人类文明的标志之一。


显然,在这一人类独具优势的领域开发人工智能系统,是一项艰巨的挑战。与国际象棋、围棋相比,辩论是一种更开放的活动,就AI的难度和挑战而言拔高到了一个新梯级。


那么今天,如果是机器人/人工智能进行辩论,那么会是怎样的一种局面和结果呢?


此前已有科学团队进行过相关尝试,虽然AI在与人类的辩论交锋中有输有赢,但这些无不表明,机器的语言表达和理解能力都达到了史上全新的高度,未来协助人类制定复杂决策指日可待


明赢实败


第一场人机辩论赛,AI系统是赢了的。


在旧金山的一间办公室里,IBM举办了历史上第一场人机辩论比赛。两道辩论题目分别是:“我们是否应当资助太空探索”;“我们是否应当更多地使用远程医疗”。而两场辩论,IBM耗时超过六年研发的首个能与人类进行复杂辩论的AI系统Project Debater(下称Debater)的对手都不容小觑,前一位是以色列全国辩论冠军Noa ovadia ,后一位是以色列辩论专家Dan Zafrir。虽然对手强大,但是现场辩论Project Debater由于提供了更多有利的证据而更具说服力,最终观众的投票也倒向了Project Debater。


但在辩论的世界里,关于输赢有这样几条说法:

  • 1、辩论辩的是真理;

  • 2、辩论辩的是逻辑。


是真理也好,是逻辑也好,反正比赛的胜负不可能仅由信息量的多少来决定。如果信息量多少可以决定胜负,那么我们不如去和电脑去辩论,只要在搜索栏里稍加搜索,我们一定会输得很爽。


Debater在辩论场上的重复啰嗦可以说是背离了用最简单的话把道理和逻辑讲通的这样一个在辩论当中基本要求。所以在智能相对论分析师(aixdlun)杨苏颖看来,这场辩论赛,人工智能完败。不过尽管这样,人机辩论大赛这件事仍然还有一定的讨论余地。


AI的幽默品质有救


幽默在辩论当中是使人信服的一个关键因素。在科幻电影《霹雳五号》当中有这样一个桥段,一名逃跑的机器人有了意识,坚称自己有生命。而男主角最终测试它所言非虚的方法是给它讲了一个笑话。在讲完笑话后几秒,这个机器人发出了一连串笑声。这时,男主角才开始认为它真的具有自我意识。因此,也有很多人把机器有没有幽默感作为判断机器是否进化到具有人类思维的重要标准之一。


不管是93年央视首创的电视辩论赛,还是现在风生水起的辩论网综,亦或是我们身边各大高校内每年一届的学生辩论比赛,幽默一直都是获得观众和评委认可的一个重要因素。幽默的前提是冲突。北京大学心理与认知科学学院毛利华副教开元棋牌授说,“人类大脑的最主要功能是让我们预期这个世界。”当我们面对眼前发生的一件事情,我们的大脑会思考出事情可能存在的几种不同发展方向。有的方向概率大,有的方向概率小。但如果我们大脑最后接受的东西与大脑之前预期的结果不一致,就会产白金会生冲突。此时,大脑进入紧张状态,希望用认知资源对这个刺激进行加工。一旦大脑发现自己的经验可以解释它,那么紧张的情绪就会得到释放,转而进入愉悦的情绪状态。


所以,如果机器想要获得“幽默”这种人类的独特品质,那么首先它应该学会预测。去年,谷歌旗下的科技孵化器Jiasaw、康奈尔大学和维基媒体基金会合作开发了一个预测人类谈话走向的智能系统以预防不必要的吵架和攻击行为。通过自然语言处理技术,AI会自动对其所接触到的内容进行语义分析,并提取在对话双方的讨论内容中出现的关键词有怎样的特征,然后进一步通过机器学习算法构建分析结果。目前已经有相关论文的数据表明,一台经过训练的计算机可以以61.6%的准确率预测一场对话是否会朝产生敌意的方向发展,而人类在这件事情的判断上准确率为7九乐棋牌2%。按照前文的逻辑来,构建一个有幽默感的机器人并非不可能的事情,首先人工智能学会了预测对话走向,这时只要再设置一项功能:If人工智能预测的结果与现实不符,Then打开控制人工智能笑声的开关,Enter一个能get人类笑点的机器人诞生。


AI的辩论风格难立


强者都有风格,辩士也是。人称宝岛辩魂的少爷黄执中开创了辩论学派——“新剑宗”,是亚洲有系统建构辩论学理的第一人。但他的风格却并不好学,坊间对“新手学黄执中必死”的论断心照不宣。所谓不同的派别有不同风格,在金庸的小说《笑傲江湖》当中华山派二十五年前因葵花宝典之争被分为两家,一家主练气,称为“气宗,”一家主练剑,称为“剑宗”,武学之路大相径庭,却也都各有特色。而金庸本人与另一武侠小说大家古龙的风格差异也使他二人在武侠创作上各有其高峰。人说金庸的江湖再远都有一座庙堂,但是古龙的庙堂再高都是一片江湖。金庸写世,而古龙写人。


那么,话说回来,AI的辩论有风格吗?别说风格了。Project Debater这家伙连抑扬顿挫都还没搞清楚。可以说如果没有人类辩手的参与,两个人工智能之间的辩论足以让一大片观众在现场呼呼大睡。风格如何形成?高手自创风格,但是社会学家塔尔德告诉我们,创造是极少数的,而模仿是大多数的。加拿大一家新创公司琴鸟发布的一款人工智能语音系统,能够通过分析讲话录音和对应文本以及两者之间的关联,在1分钟之内模仿人类讲话。琴鸟公司的AI系统使用的是一种模仿人脑思维的算法,能在倾听的过程中掌握每个人说话时字母、音位和单词的发音特点,然后推理并模仿这个人说话的情感和语调,也即“风格学习”。琴鸟的AI语音系统还曾经模仿过特朗普、奥巴马和希拉里三人之间声音并让这三个人成功开展了一场“对话”。


不同于苹果的Siri,琴鸟的智能语音系统已经做得相对自然了。但是尽管如此,美国卡内基梅隆大学语言技术研究所的教授迪莫鲍曼还是表示这个AI系统尚不能模仿人们在讲话中的呼吸和唇部运动,因此仍然可以听出计算机的语音特征。而AI要真正的复制人声,还要再等几年。所以最后的结论是:对于目前的这些AI来说,风格难立。


AI的逻辑匡扶正义


社会民主存在的前提是有一群理性、智慧的公民。而这样的公民实际上是不存在的,因为在公民投票选举的民主制度当中,先不去评判公民们的选择是否正确,在对错之前他们甚至连真假都不曾清楚地了解。但美国著名新闻学者李普曼为了尽力维持社会民主的存在,在《幻影公众》中谈到一种公开辩论的手段。他指出人们可以通过公开辩论的方式来分辨某个人的发言是为了私利还是公共利益。而这样有助于我们决定是否采纳他所提出的建议和规则。


或许正因为辩论有这样的能力,美国历届总统的选举才都采取了辩论这种形式。但随着社会信息爆炸,如何在越来越复杂的环境和公民有限的政治判断力中架起一座讨论的桥梁变得尤其重要。AI辩白金会手Project debater具有非常强大的数据处理能力,能够处理几十个与主题相关的数百万篇新闻。此外,Facebook也正在通过机器+人工的方式削减虚假消息的传播数量。通过机器学习算法来标注可疑消息,然后将其发送给第三方事实审核人员。因此,我们能够推出在辩论当中,AI也有能力提醒公民,他们所听到哪些信息是真的,哪些信息有可能是假的。


另外,AI辩手Project debater或许还可以帮助人类建立一个最公正的辩论环境。众所周知,AI是逻辑大佬,这一点在之前“阿尔法狗”与人类的对战当中体现得淋漓尽致。所以,如果说辩论的胜负由逻辑决定。那么使用AI作为公平的裁判是一个不错的想法。名家公孙龙曾以其“白马非马”的诡辩之术让古代许多大儒无言以对,但利用数学当中的集合论却可以轻松解决这个问题。一直以来,AI都被誉为常识的“婴儿”,逻辑的“巨人”。所以,只要将人类在辩论当中所用到的词语都抽象成数学符号,那么当你还在冥思苦想对方的逻辑漏洞的时候,人工智能或许早就已经帮你发现了。


明败实赢


今年的第二场人机辩论赛,Debater 败北。


但其对手——人类顶尖辩手、2012年欧洲辩论冠军、牛津剑桥学霸哈利什-纳塔拉(Harish Natarajan)认为,在不久的将来,人工智能的辩论水平有望超过人类


AI辩手和人类辩手的交锋现场视频片段(字幕版)


赛制与第一场类似:双方辩手直到开场前15分钟才被告知此次辩论的主题——是否应该资助学前教育(中华娱乐We should subsidize preschool)。辩论分为三个回合,观点阐述和观点反驳两个回合分别为各方不间断发言4分钟,第三回合总结陈词为各方不间断发言2分钟,最终结果由现场800位观众投票决定。


在辩论开始前,观众几乎一边倒地支持正方,也就是人工智能辩手的立场,支持率高达79%,反对的比例仅13%,然后在20分钟辩论过后的第二轮投票中,人工智能的支持率下降到62%,跌幅17%;人类辩手的支持率则上升了1欧博平台7%至30%。这意味着人类辩手的说服力仍然高于人工智能,最终获得了这场辩论的胜利。


尽管如此,反方人类辩手纳塔拉依然认为在不久的将来,人工智能的辩论水平有望超过人类。他表示,令自己印象最为深刻的,是人工智能引用论据和统计数据的能力,如果与人类的智慧结合起来,将发挥无穷的潜力


一位亲历辩论全过程的分析师也表示,“虽然整体来看,人类辩手的表达更好,但AI辩手传递信息量的丰富度则优于人类,Debater很好地证明了自己观点的说服力。”


纵观这场人机辩论赛,可以得出以下三个结论:


1、人类和AI双方事前都不了解辩论的话题。因此Debater并未受到事先对某一专业领域的训练,展现出对跨领域、多种话题的潜在适应性。


2、尽管AI在辩论中战败,但调查显示,58%的观众认为Debater提供的论据丰富了他们在这个领域的知识,而人类辩手只有20%。IBM以色列海法研究院(Debater的开发团队)AI科学家Aya Soffer女士对此说道:“我们开发AI不是为了替人们做决策,而是为他们提供知识,帮助他们做决策。在提供知识、辅助听众决策这个层面,机器显然更有优势,我们认为我们已经赢得了辩论”。


3、有理论认为,人类获得90%的信息都是通过视觉获得,而Debater显然只能通过听觉传递信息。在提供引起共鸣的论据时,Debater的黑色方盒子显然没有专业人类辩手富有激情和表现力的发言更吸引人。制造共情方面,AI显然无法与人类匹敌。


Debater诞生记:


Debater由IBM研究院以色列海法实验室于2011年提出,是全球首个可以在全程直播辩论过程中与人类进行有意义互动的AI系统。拿到辩题后,Debater首先会分析单个辩论问题,然后扫描庞大的语料库文档,通过算法找出与辩题相关性最高的观点性内容,同时通过算法减少重复信息。在此基础上,Debater会挑选出最有说服力、最具多样性和支持最完善的论点,并对这些论点进行编排,从而形成一段完整且有说服力的叙述。


2012年:Project Debater诞生

2013年:被赋予了人类的声音

2014年:IBM发表了首篇相关研究论文

2016年:第一次进行实时辩论

2017年:第一次成功说服人类同意了它的观点

2018年:首次公开与人类专业辩手进行辩论,一鸣惊人

2019年:旧金山再次亮相,引爆对AI里程碑的讨论


为了突破AI在辩论领域的一系列挑战,Debater被IBM的科学家们赋予了三大能力:


  • 它善于倾听和理解自然语音语义的理解能力


在辩论的开始,Project Debater能够像人一样倾听,对人类语言及其中及其细微的差别有深刻的理解和消化。我们知道人类语言博大精深,人类自身尚且不能轻易地准确获取对话人传递的信息,这对机器来说无疑是更大的挑战。


不同于我们熟知的阅读理解的功能,当对方辩手开始讲的时候,Project Debater要能听懂长达4分钟的内容,对方人类辩手在讲的过程中语速可能是快的,情感可能是充满激情的,同时还会有一些道德性、伦理性的问题,Project Debater要在听力理解中做到能够理解对方所表达的主旨。这和我们已经熟悉的个人助手一类的智能是完全不同的,因为像个人助手类只需要听懂一句话就可以,比如开灯、关灯,而在Project Debater要在很长的语句中去听懂对方的主旨。


  • 它拥有博学似海的“知识”储备,并善于表达。


模拟人类语义的逻辑结构进行输出的能力、数据驱动的信息生成能力,并可构建有意义的反向输出。


Project Debater能够在装满了上亿篇主流报纸、杂志文章的海量的知识库中快速地、精准地找到数百个恰如其分的论据,并能在几分钟内快速组织回应。它第一次证实了计算机能够消化海量语料库,针对给定的有争议的简短主题描述,能够撰写结构良好的演讲内容,并清晰且有针对性地表达出来。


  • 它模拟人类的两难困境,基于知识图谱系统性提出原则性论点。


在信息科技领域,AI 领域的人士和IBM的专家总结了人类专家辩手的一些共同性,对Project Debater进行模拟、建模,并且把这个注入到系统中去,就形成了一个知识图谱给到Project Debater来用。所以一旦开始去进行辩论的时候,Project Debater就可以在已经形成的图谱中去做自己的向导和索引,找到可以支撑他的证据。


那么,在技术上,Debater怎么工作?


1、以数据为基础的演讲编写技术。Debater收集了几百万篇报纸和杂志文章中的100亿句信息,她能从中挑选出对不同论题最有帮助的论点信息,去掉不相关或无用的信息,并将其组成一篇令人信服的文章/演讲。


2、语言识别技术,尤其在反驳环节,Debater要听取人类对手长达4分钟的演讲,它需要理解对手话语中蕴含的复杂主题、细微的语义变化。


3、Debater要具备对论题正反两难状况建模的能力,AI需要掌握某个论题的关键原则,并创建话题的知识图谱,再将其他辅助信息填充到其中。有了这三项关键的技术,AI才具备与人类辩论的能力。


Debater仅仅预示着一个开始,未来,Debater将有潜力在全球范围内协助人类制定日常的复杂决策,这些潜在用途包括金融顾问、律师、公共事务决策、学生助手和企业决策等多个领域。


参考资料:

-黑科技数据|《观众都在“吃瓜“,所以有了AI辩手的胜利》2018-06-28

-科技茱比莉Jubilee|《从AI诗人到AI辩手,这场人机辩论赛AI赢了什么?》2019-02-13

-IBM中国|《AI下棋还在喧嚣,AI辩论早已启航》2019-05-19

-哈佛商业评论|《AI辩手面世,TA会是白领“终结者”吗?》2019-05-30




推荐

阅读



---------------- 点赞是个好习惯

-------盛京棋牌---------