阴影
阴影 阴影
第A20版:国际新闻 上一版3  4下一版
中国科学家让“沃森”听懂人话
      
返回主页 | 郑州晚报 | 版面导航 |      
     【打印】  
人机大战再次上演
电脑“沃森”战胜两名人类顶尖选手
它为何会成为全世界最善于抢答问题的机器人?
中国科学家让“沃森”听懂人话

人机大战再次上演

电脑“沃森”战胜两名人类顶尖选手

它为何会成为全世界最善于抢答问题的机器人?

日前,美国智力问答节目《危险边缘》迎来了自1984年播出以来第一位电脑选手“沃森”,而且这台超级电脑在前两个回合比赛中已险胜两名人类顶尖选手。

美国媒体普遍预测称,在最后一轮比赛中,我们将见证人脑彻底败给电脑的历史时刻。《纽约时报》称“沃森”为“全世界最善于回答问题的机器”。

17日,记者采访了IBM“沃森”研发团队的中国工程师王敞,了解到中国科学家在研发中作出了重要贡献。王敞,曾就读于南开大学计算机系,在马萨诸塞大学获得计算机博士学位。

两位人类前冠军肯-詹宁斯(左)和布拉德-鲁特(右)分居左右,中间为“沃森”。

研发背景

创意缘于一个节目,“沃森”思维模式很像人类

记者:“沃森”是怎么诞生的?

王敞:“沃森”的诞生只是一个偶然的机遇,这背后还有一个小故事。2004年的一天,我们公司的副总在酒吧喝酒时发现,很多客人都放下手中的酒杯,兴奋地观看一个节目,那就是很具挑战性的节目《危险边缘》。节目里涉及大量知识问答,而且涉猎范围很广。于是从2004年开始,IBM组织团队进行研发,经历了4年的艰辛努力,“沃森”这个“神童”终于诞生了。

记者:跟其他智能电脑相比,“沃森”有什么独特之处?

王敞:我们研发“沃森”的时候采用了大量的自然数据,而不是输入已知数据,这样计算机就可以自行检索,对数据进行计算了。“沃森”的思维模式和人类很像,因为它可以“自主学习”。

记者:“沃森”能完全理解人类想出的问题吗?

王敞:其实我觉得研发中的最大挑战是让“沃森”能够在现场回答问题。语言是自然的、开放的、模糊的,我们在不同语境下说同一句话,表达的意思可能完全不同,需要上下文提示才能理解。

例如“Winter(冬天)走了”这句话,只要有一定的上下文语境,就不难判断其意思。可是电脑呢?它要分析此“Winter”指的到底是冬天,还是一个叫“Winter”的人,在我们看来这非常容易,可对于超级计算机来说则是一个很挠头的问题。

发挥作用

中国科学家贡献巨大,让电脑听懂人话

记者:你在研发团队里担当什么样的角色呢?

王敞:我们的整个研发团队一共由三支队伍组成,分别是计算组、策略组和系统组。我所在的队伍是计算组,主要负责“沃森”的计算方法、答案分析等,是“沃森”研发最主要的研发小组。具体来说,我的工作内容包括让“沃森”学会寻找问题、分析各个问题之间的关系、比较不同问题的相似性等。策略组的工作是让“沃森”能够判断答案的筛选,让它回答问题的正确率更高。系统组则负责提供硬件。

记者:这次的研发成果中,中国科学家发挥了怎样的作用?

王敞:我们的团队有多位中国工程师,用我们副总裁约翰·凯利的话来说,“中国内地科学家作出了重要的贡献”,因为我们让“沃森”掌握了处理人类语言的能力,否则它是无法到现场参加比赛的。没有我们的努力,“沃森”就像是一个聋哑人,就算再聪明,也听不到主持人的话,也讲不出“脑袋”中的答案。不仅如此,我们在语言处理方面的技术很先进。不但赋予了“沃森”听说的能力,还让它能在非常短的时间内对复杂的问题作出分析并加以回答,使它“思考”得更快。

媲美“深蓝”

“沃森”计算能力为“深蓝”千倍

记者:我们都知道14年前战胜了国际象棋大师卡斯帕罗夫的“深蓝”。“沃森”和“深蓝”相比,它俩谁更聪明呢?

王敞:“深蓝”的计算能力非常强,但是它的计算模式很狭小,只要覆盖国际象棋的比赛规则就可以了。而“沃森”不同,它最显著的优势是知识覆盖面非常广。目前“沃森”存储的信息量相当于2亿页书籍。单从计算能力来比较的话,“沃森”也是绝对领先的。它的计算能力大约是“深蓝”的1000倍。所以它的身体更庞大,它的服务器要占据整整一个房间。

商业前景

取代键盘输入,“沃森”未来能当大夫

记者:虽然“沃森”设计用于参加《危险边缘》,但这项技术的应用不止于此吧?

王敞:我觉得“沃森”背后的商业价值非常大,因为它有了自主学习、分析的能力,所以将会是信息决策的好手。人们可直接向电脑提问,取代键盘输入后再查找、分析等。

举个例子,我们给一个没有接触过医学知识的人一万份病历,再让他给一位得了怪病的人看病,他需要花很长的时间去阅读病历并进行分析,才有可能得出结论。如果把这项工作交给“沃森”的话,它会在一天之内浏览完所有病历,在最短的时间内比较准确地分析出病人得了什么病,从而省去了一群专家的会诊,给病人的治疗赢取宝贵的时间。 据17日《法制晚报》A21 赵展 杨璐

部分问答点评

人机大战,问的啥问题?

电脑是咋思考的咋抢答的?

问题:“任何时候当你感到痛苦,嘿”谁,“请打住,不要把整个世界都背负在你自己的肩头”(其中引号中是原歌词,“谁”则是被问的出现在歌词中的人) (“And anytime you feel the pain, hey”this guy “refrain, don't carry the world upon your shoulders”)。

答案:Jude。

点评:由于机器的知识库里包含了大量的明星歌词,而且调出这些歌词很快,因此机器在这类问题上占了上风。这是甲壳虫乐队Hey Jude歌曲的歌词,这个“谁”正是Jude。完整的歌词是:任何时候当你感到痛苦,嘿Jude,请打住,不要把整个世界都背负在你自己的肩头。

对于这题,沃森计算出答案是Jude,并且认为其可靠性高达98%,抢答成功。如图所示。

问题:米洛拉德查维奇几乎破坏了这个人的完美2008奥运,仅仅输给这个人百分之一秒。(Milorad Cavic almost upset this man's perfect 2008 Olympics, losing to him by one hundredth of a second)

答案:菲尔普斯。

点评:这是关于2008年北京奥运会中的一个问题。首先通过题目,沃森可以分析出,答案是一个人。虽然题目中没有提到游泳,但是沃森可以从百分之一秒、米洛拉德查维奇、2008奥运中找到线索,所以沃森回答了“菲尔普斯”。

问题:1976年,在一个“现代”什么的项目中,一位选手因为在他的重剑和计分点之间做了手脚,能够在没有触碰到对手的情况下得分,而被驱逐出该项目。(A 1976 entrant in the “modern” this was kicked out for wiring his epee to score points without touching his foe)

答案:现代五项。

点评:这题仍然属于奥运奇闻类别,所以应该是个奥运项目。名字和“现代”相关。沃森阅读过大量的信息,并作统计分析。这里派上了用场。在所有沃森的备选答案中,只有“五项”和“现代”搭配在一起概率比较大。再结合其他的线索,沃森正确回答了此题:现代五项,包括跑步﹑骑马﹑游泳﹑击剑和射击。

问题:这是生理的奇观,1904年,美国体操运动员George Eyser赢得了双杠的金牌。(It was the anatomical oddity of U.S. gymnast George Eyser, who won a gold medal on the parallel bars in 1904)

答案:他少一条腿。

点评:人类选手Ken(肯)抢到了第一次回答,给出的答案是“他只有一只手”,答错了。沃森抢到了第二次回答,给出了“腿”作为答案,也不对。沃森回答的是腿,而不是George Eyser少了一条腿。“奇闻”是一个比较主观的词,对于缺少主观意识的计算机是很难判断什么是奇闻的。它不仅需要知道Eyser少了一条腿,还需要知道这是一件奇闻,这是很困难的。仅仅回答“腿”是不对的。

问题:迪斯尼乐园开张&和平标志被创建(Disneyland opens& the peace symbol is created,要求说出年代)。

答案:20世纪60年代。

点评:这个类别的问题人类很熟悉,他们知道答案肯定都是年代,所以在没有听完问题的时候,人类就准备抢答了。而沃森要在计算出答案后,才去抢答。所以即便沃森可以找到正确答案,但是抢得没有人快。还有,这一组题目都给出了两个线索,导致计算量比较大,导致沃森的速度没有人类快。

虽然沃森找到了答案,但Ken抢到了该题。

问题:第一个现代的填字游戏发布&奥利奥饼干出现(The first modern crossword puzzle is published & Oreo cookies are introduced)

答案:20世纪20年代。

点评:Ken先回答了30年代,主持人说答案不正确。沃森又抢答说30年代。 沃森不能听或看到Ken之前的错误答案,因此把错误答案又报了一遍。在设计沃森的时候,工程师觉得分析对手的错误是不需要的,没想到沃森也会犯和人一样的错误。难怪沃森回答问题的时候总是像“旁若无人”一样。

      
版权声明 @ 中原网 网站版权所有