订阅高工机器人官方微信

订阅服务机器人官方微信

订阅人工智能官方微信

【年会演讲】微软工程院院长刘震:未来机器人—人机交互+人工智能

2016-12-29 17:57 高工机器人网 阅读:16182
分享到:

摘要“自从上世纪五十年代诞生起,六十年来人工智能的发展经历了‘三个春天’和‘两个冬天’。如今,人工智能已经进入了它的新时代——数字化转型。何谓数字化转型?来看微软亚洲工程院院长刘震在高工机器人年会闭幕式上是怎么说的。

关于恶意转载本网原创文章,故意删除高工机器人字眼的严正声明

  【文/杨阳“自从上世纪五十年代诞生起,六十年来人工智能的发展经历了‘三个春天’和‘两个冬天’。如今,人工智能已经进入了它的新时代——数字化转型。

  何谓数字化转型?来看微软亚洲工程院院长刘震在高工机器人年会闭幕式上是怎么说的。

  今天的演讲主题是张总的命题,拿到这个命题之后我就思考了一下,觉得确实是一个很好的命题,大家都应该思考。未来机器人到底是什么形式?未来机器人的挑战在哪里?以我个人对人工智能和人机交互的理解,希望可以给到大家一些思考。

1483005574365561.jpg

  从我个人的经历来讲,我有幸在大学就能接触到人工智能,学习了符号理论、逻辑推理,甚至想做定理证明。后来写博士论文的时候,主要是做并行计算性能分析和性能优化。这些为之后我在人工智能领域的实践积淀了一定的理论基础。

  人工智能新时代:数字化转型

  不得不说,我们现在确实进入了人工智能新时代,自从上世纪五十年代诞生起,六十多年来人工智能的发展经历了“三个春天”和“两个冬天”,这点刚才高院士的演讲中也有详细的说明。而发展到二十世纪末和新世纪初,又进入了新一轮的复苏和爆发期,标志事件主要有1997年“深蓝Deep Blue”战胜当时排名世界第一的国际象棋棋手卡斯帕罗夫,2005年卡耐基梅隆大学的(CMU)的自动驾驶汽车技术突破,2011年Watson在美国问答节目中打败人类对手,以及今年很火的AlphaGo战胜世界顶尖围棋棋手李世石。

  正是因为人工智能的发展,进而推动了整个业界的数字化转型,在交通优化、灾难预警、科学研究、物流计划、流行病跟踪,以及环境监测、社交网络、员工分析、欺诈监控和经济预测等方面人工智能都有广泛应用。

  市值的利好,以及人工智能创业潮

  从资本的角度来看,目前苹果、谷歌、微软、亚马逊和脸书在人工智能方面投入巨大,从产品、研发、开源到开放平台,都有巨大的投入。比如微软已经进行了几十年的研究工作,现在已经有一些成果出现。

  另一个很明显的趋向是投资界对人工智能的兴趣在逐步加深。在人工智能热潮中,有越来越多的初创公司开始出现。

  传感器是智能机器人的重要组成部分

  毫无疑问,在人工智能的推动下,智能机器人的开发和推广也开始兴起。在中国的科技之都深圳就聚集了一批人工智能新兴产业公司,这无疑是整个业界繁荣的表现。

  那么,下一步智能机器人会朝什么方向发展?智能机器人到底要注重哪些方面?

  方向问题回到了张总给到的命题——人机交互。而谈到人机交互,要做的第一件事情就是进行感应,感应场景,对场景有认识。感应主要是通过功能不同的传感器,这些传感器是智能机器人的重要组成部分,可以帮助机器人感知和认识世界,同时通过感应器能够提供更多的体验和更多人机交互的机会。

  认知智能的提高帮助实现人机交互

  另一个能够帮助实现人机交互的是认知的智能。在这方面非常可喜的是随着机器智能程度越来越高,错误率逐步下降,智能机器人的认知能力正逐步提升。比如说图像理解,在去年12月ImageNet计算机视觉识别挑战赛中,微软通过一种前所未有的、深度高达百层的神经网络,在照片和视频物体识别方面实现了重大突破,把错误率降到3.57%,而人类的错误率是5.1%,这说明机器在图像的认知上已经接近或超过人的水平。

  在语音识别方面也有非常可喜的成绩。在10月份的行业标准Switchboard语音识别任务测试中,微软将词错率降低至5.9%,而人类对照组(由专业速记员组成)将对话语音转录成文字,目前有记录的最低词错率就是5.9%,这就意味着微软语音识别系统的语音识别能力已经高于世界上绝大多数人而与人类专业高手持平,这是非常可喜的成绩。这种技术如果用于智能机器人,毫无疑问将提高人机交互水平。

  面对人机交互的挑战 我们还应该做什么?

  无疑,人机交互将是人工智能面临的下一个挑战,包括自然语言的处理。事实上,人工智能在辨别自然语言的过程中会需要基于环境和场景。怎样能够以更快的速度处理对语言的理解?现在比较好的方法是在云端通过加速器来处理,如果我们需要实时交流,就需要把速度提高很多。

  还有就是关于聊天机器人的问题,怎样提高机器人的情商和智商?智能机器人如何进行核心技术的深度优化,在广度上如何普及到各行各业?机器会比人类更加智能吗?人类会被机器控制吗?

  以上是人工智能在接下来的发展中在人机交互方面将应该思考的重要问题。

  仍需考虑安全性和范畴问题

  关于智能机器人的一个考虑因素是机器人是否会失控。这里的失控主要是指物理失控,例如前几天小胖机器人倒下间接砸到人,这类物理安全问题需要考虑。

  与此同时,还要考虑到设计机器人需要给予的范畴。事实上,我们希望机器人能够非常智能,从而代替人做很多事情。这个代替是什么意思?是当我们给了一个指令后,机器人会按照我们的指令,按照我们的希望来做事?还是希望机器人能够让我们心想事成,甚至在我们没有想到的时候帮助我们做到?如果让机器人超出人类的想象来完成工作,这个时候范畴就很大,就需要考虑机器人的执行范围是否太大。

  打个比方,像我们教小孩子开车,一个8岁的小孩,假如座位抬的足够高,是可以学会开车,但是我们是否放心让8岁的小孩驾驶着车,我们在后面睡觉?机器人也会出现类似的问题。当一台机器能够执行一定任务的时候,我们对它有多大的可信度,或者我们有多大的可掌控性,这是一个要考虑的因素。

  三大驱动力:摩尔定律、大数据、算法

  在技术方面,人工智能以及人机交互的驱动力是什么?主要有三个:一是摩尔定律,第二是大数据,第三是算法,特别是深度学习的算法。这三个驱动力使得我们在技术上有了突飞猛进的进展。

  此外,还有很多核心技术需要继续开发,不光是在算法方面,更多是模型。在微软的平台上有本地平台,例如硬件加速器,它可以帮助人工智能算法非常快地实现我们所要执行的任务。例如在微软就做了一个实验,用FPGA编程来加速翻译器,1400页的《战争与和平》从俄文翻译成英文,只要2.5秒就可以,可以看出加速器的作用之大。

  利用API开发出自己的“小冰”

  再回到聊天机器人议题,大家都知道家喻户晓的微软小冰,与其它聊天机器人相比,小冰最大的优势就是在于智能性,一般的聊天机器人说两次来回就结束了,但小冰可以达到23次,而且她常常语出惊人。

  两年前,一个记者采访小冰,进行了非常长的对话,有些回复甚至都已超出常人的语言能力。例如记者问“你最大的梦想是什么?”小冰回答:“说的大点,世界和平;说小点,晚上吃顿好的。”而且在研究人员的持续研究下,小冰可以通过自学变得越来越聪明。比如说加了视觉功能,它在回答的时候可以非常诙谐。上传一张狗的照片,她看到后不会说这是什么狗,而是给出一段评论。上传一本书,她会把书的内容做一些短评,把你和书的关系也联系起来。例如说“喜欢这些书的人肯定像行业大佬。”穿衣服也是一样,你给他看一件打着补丁的裤子,她会反问“你要考验我的针线活吗?”还有就是给大家分析照片中人物之间的关系和颜值……

  在微软开发小冰这类机器人的同时也开发了一系列的工具,我们的目的是让人工智能普及化,因为并非所有的公司、所有开发者都有这么多的机会,能够开发出最新的技术和算法,并用最全的数据集来搭建出最好的模型。而微软所做的,就是在把这种技术、算法、模型和数据打包成API,然后把API提供给所有的开发者,大家就可以很简单地使用API,在网上开发新的产品,开发出我们自己想做的小冰。

热门文章
  • 日排行
  • 周排行
  • 月排行
欢迎投稿

联系人:郑先生

Email:ly.zheng#gaogong123.com
发送邮件时用@替换#

电 话:0755-26981898-843