返回   上一版    下一版
   
 
 
网站首页 | 数字报首页 | 版面导航 
  往期回顾:    高级检索   出版日期: 2016-08-31
2016-08-31 第05版:五版 【字体】大 |默认 |

人工智能如何“侵入”市场与生活

作者: ■本报记者程武 来源:中华工商时报 字数:5010
    中国科学院副院长、中国人工智能学会副理事长谭铁牛表示,一年以来包括语音识别、自动驾驶在内的全球专用人工智能领域已取得突破性进展,但通用人工智能的研究与应用依然任重道远,可以用"有智能没智慧,有智商没情商,会计算不会算计,有专才无通才"这四句话描述人工智能的现有水平。
    人工智能简单缩写就是AI,简单来说就是机器、计算机拥有人的智能,这个概念是在1956年在美国的一个会上提出来的,到今年8月28日正好是60年。
    在当日由宜信、华创资本及《商业周刊中文版》联合主办的“2016硅谷对话北京”大型论坛活动中,人工智能峰会吸引了近千与会人员的关注。人工智能峰会主持人为宜信财富投米RA首席技术官胡金辉,参加讨论的几位均是国内AR增强现实、语音识别、自动驾驶、图像识别以及智能机器人领域当之无愧的大咖,他们分别是量风台创始人、CEO廖春元、云知声CEO黄伟、盛开互动CEO曾祥永、慧眼科技创始人&CEO单霆、赛格威机器人创始人蒲立。
    带上AR眼镜
    能看懂见到的一切
    胡金辉:在座5位都是非常牛的专家博士,我们很想知道,人工智能在各个领域的现状是什么,到底怎样改变市场和我们的生活?
    廖春元:AR的底层技术是人工智能,大家经常问我AR是什么,简单说就是在我们的现实世界的基础之上,叠加一个虚拟的世界。VR是你戴上眼镜以后,你和现实的世界脱离了,到了另外一个世界,VR戴上眼睛以后是“白日做梦”,跟你现实没有关系了。增强现实是“活见鬼”,就是你在现实中看到了虚拟的东西。以后会是什么样子呢?在我来看有几点。
    第一,人机交互应该跳出电脑、手机等屏幕的限制。作为一个人,坐在会场上看到这么大物理的会议场所,为什么人机交互时要局限于小小的5英寸的手机屏幕来访问计算机?
    第二,人和人的交互并不是用键盘和鼠标,用我们自然的视觉、语音和手势,这是最自然的。
    第三,虚和实的结合,不管云端有多少的数据,必须和当前的场合整合,比如说汽车修理的问题,我们能否虚实结合,能否带上AR眼镜,有很好的手段解决当前的问题?
    胡金辉:未来能否带上AR眼镜,就认识我对面的陌生人是谁?能做到吗?
    廖春元:结合人工智能的技术,在眼镜上可以体现出周围人的资料,不需要交换名片。包括旅游,到了北京天安门、长城等,AR眼镜能告诉我看到的一切的背后的故事和资料。
    带上语音自动翻译机
    你可走遍天下
    胡金辉:黄博士是语音专家,您分析一下,我们人工智能在语音文字识别现状如何,怎么样改变市场和生活?
    黄伟:人和人之间的交流,90%沟通都是靠对话,而不是靠挤眉弄眼,对话里面包含了最大的信息量,我们希望解决好人和机器人之间的交流,就是通常所说的人机交互。
    人工智能所有的东西里面,语音识别是最完善的,这不是即将发生的,是已经发生。我讲的这段话,不管用什么语速,我带什么口音,都可以达到了97%的语音识别准确率,速度是人工的3倍以上,现在很多行业的从业者会逐步地被技术所替代,用语音识别可以做到实时语音生成。
    胡金辉:如果我去西班牙旅行,带上黄总发明的自动语音翻译器,我就可以跟他们交流,我说中文,他们听到的是西班牙文吗?
    黄伟:没问题,可以实现。但是语音识别和机器翻译,技术今天都已经实现了。语音识别技术已经发展了七八十年,以前准确率只有80%左右,现在我们做到了95%以上,已经达到了商用的临界点,但是还有很多需要突破的。还有很多强噪音需要处理,我在街头、餐厅,会遇到噪音污染,还有口音、方言等挑战。
    无人驾驶离你并不遥远
    胡金辉:单霆博士是从事自动驾驶,10年前我去谷歌面试的时候,他会问你最大的梦想是什么?因为我做了图像识别、AR、VR做了很多年,10年前我跟他们说无人驾驶是未来的非常大的方向,他们那时候根本不知道我在说什么,现在谷歌已经在做这个事情,也感谢单霆博士帮我实现这个梦想。现在无人驾驶做到什么地步了,什么时候可以坐上自动驾驶的车?
    单霆:无人驾驶这个事儿稍微有点遥远。说无人驾驶,智能驾驶分为这么几个阶段。
    第一个阶段就是辅助驾驶阶段,就是你人在开车,但是你有时候会走神,即将产生事故的时候,这一刹那,汽车计算机帮你驾驶,这是辅助驾驶,这个阶段很多车上已经有了,有的时候你车会追尾,我们的雷达会帮你自动刹车。
    还有半自动驾驶阶段,主要的时间都是人控制汽车和驾驶汽车,只是某些特定的场景,比如说高速上,路况、车况比较简单,没有那么复杂,这个时候就由计算机控制汽车,以这个为主要代表的,在座有些人开特斯拉已经实现这个功能。
    第三是全自动驾驶阶段,无人驾驶阶段,这个稍微有点遥远,没有完全的像谷歌那样连方向盘都不带,稍微有点遥远,5-10年之后有可能会出现。但是某一些特定的场景下,比如说园区、景区、矿场是可以实现的。为什么呢?第一,低速,第二是场景很简单,第三是线路比较限定。高尔夫球场车,A点到B点,以前是球童开车送你过去,有了这个之后,可以省了这个球童。类似特定的场景,无人驾驶可以实现的。其实大家感觉无人驾驶、智能驾驶很遥远,这两年才兴起,但是已经深入到你生活中的方方面面了。
    胡金辉:我稍微挑战一下单霆博士,无人驾驶在美国还好,他们遵守交通规则,中国的司机不太乐意遵守交通规则,这个条件下怎么做无人驾驶?
    单霆:假如在中国做好自动驾驶和无人驾驶,在世界上一定能做得最好。中国是最有挑战的。我2011年刚回国是不敢开车的,在国外是按照他们的规则去开,但是在国内他们基本上是不按规则开的。在中国做自动驾驶一定最有挑战性的。
    第一,人多、车多,规则的执行有非常大的灵活性,对于技术上的挑战也是最大的。但我们有信心。首先是技术不弱于国外的公司,第二针对中国的国情做特定的优化。比如说三车道开了四部车的问题,这放在国外是不允许的,放在国内的场景,太常见了。在国外的时候,国外开车你打变向灯的时候,旁边的车是允许你变道,在国内你打变向灯的时候,旁边的车会加速冲上来了,如果再用国外的逻辑放到国内来,会产生交通事故的,我们一定要做国内的定制化开发。有了智能机器人家中不用请阿姨了
    胡金辉:请曾博士分享图像识别这个领域,人工智能是怎么样改变了我们的生活?
    曾祥永:前面黄博士讲得很好,认为声音或者是语音在人人交互当中起到了重要的作用,但是实际上我们人和外界进行信息收集的时候,图像是占了更大的比重,甚至占到了80%的比重,我一直在计算机视觉和图像识别领域工作,目前大家知道基于最近几年的深度学习、神经网络机器学习算法的突破进展,在图像识别这个方面也是突飞猛进,图像识别就是让计算机能够识别场景当中有什么,在哪里。具体讲,包括人脸识别和物体分类、物体检测这些最新的算法,在测试题上已经达到了超越人脸准确性很好的成绩。这是最新的技术上的进展。
    胡金辉:要不要举一个具体的例子,我本人也是做图像识别的,比如说咱们在座的有很多美丽的女士,你看到对面的女孩穿的衣服很漂亮,我拿手机一拍就可以识别它这个衣服是什么牌子,能做到吗?
    曾祥永:能做到了,预先我们要做很多同款服装的数据,包括橱窗的数据和真人穿着的数据,可以做到的。刚才提到的技术在测试上取得了很好的成绩,但是现实世界很复杂,今天的环境有很多光线和不同的背景,都会影响实际应用的准确性。
    另外,基于深度学习的识别技术,运算的要求是非常高的,相关的算法要经过大量的优化和效率方面的提升,才能够在低端设备上和主流设备上运行。大家知道图像数据比语音数据大得多得多,现在还有一个趋势就是专用的芯片,就是基于深度学习的芯片,一些大公司和创业公司都在这个领域发力,这也是一个技术趋势了。从我个人而言,从去年开始我们就在做应用和智能机器人的图片识别技术,比如说针对家用场景当中的常见物品,搜集了2000类相应的图片、数据进行了深度学习的训练,包括我们吃的、用的、家电、家具、玩具,包括经常用的电子产品,这样做的目的是什么?机器人进入家庭成为家庭的新成员,机器人还要能够认识家庭里面的人,还要能够认识家庭里面的物。
    胡金辉:机器人可以用在智能机器人上,可以像服务人员一样,就不用请阿姨了。
    曾祥永:有可以做家务的,擦地擦窗的,还有陪伴的,还有进行娱乐的,我刚才讲的人工智能的意思,解决专用问题上已经做到了可达应用的阶段,但是通用的人工智能还需要时间。刚才我讲到了2000类相应物品的识别,现在做到了比较好的精度了。
    让机器人为你取快递
    为时不远了
    胡金辉:下面有请蒲博士,你们非常炫酷的平衡车机器人能给我们生活带来什么样的改变?
    蒲立:我今天想通过这个智能机器人做的方向,分析两个人工智能发展的趋势,第一个趋势就是人工智能研究范围的扩大,最初的图灵测试,我没记错的话是1950年提出的,测试的范围非常小,只测试了人做推理和学习方面的能力,不管是从视觉、语音方面的测试很少,更不用提人移动的能力了。
    人作为智能体这些能力非常重要,我们看到过去的10年、20年的范围内,人工智能的范围是在扩大的,不光在推理、学习方面,也在于语音、在于视觉、在于人的移动方面,这些人力的扩大带来了什么样的结果,我们今天发现人工智能不再是高高在上、云端存在的推理学习的东西,而是真正大家接触到手机上运用的东西,这是过去10年、20年的趋势。
    我们可以看到通过语音,通过计算机视觉这些方面是获取了物理世界当中的这些信息,然后再通过我们的大脑去处理这些信息,其实作为一个人工智能要模拟人这个智能体各种能力的话,还缺一步,要把思考的结果反馈到物理世界当中去。其实作为这个方面,机器人是一个天然的载体,人工智能的载体,能够把结果实实在在地反馈到物理世界当中。举一个例子,亚马逊的仓库里面已经使用拣货的机器人,以后通过人工智能告诉操作人员说你把货从这个地方拣到另外一个地方,现在通过机器人完成这个事情。
    赛格威机器人其实想实现的事情是想把这样的能力,人工智能在物理上的体现搬到生活当中,不光是仓库里面应用,我们想通过机器人的语音、视觉、推理能力想让人说赛格威机器人你把这个文件送到另外一个办公室的王总那儿去,或者说赛格威机器人帮我去楼下取个餐,在物理事件中做一个事情,背后的驱动力是人工智能。
    另外很重要的一点,人工智能是民主化,大家手机当中用到了这个东西,潜移默化的大家非常密切的使用人工智能所带来的好处了,现在硅谷、Facebook这样的企业推进计算机教育领域的民主化,在全世界各地资助非营利组织教大家编程,教大家人工智能的概念,带来的结果是什么呢?每一个人,每一个消费者对这些概念,对它背后的原理更加熟悉,会知道人工智能到底什么意思,知道我们人工智能预测未来优势在哪里?现在这个阶段局限在哪里,消费者使用这些产品的时候,不但是被动地接受产品,而是更加主动地要求各个公司去使用这个能力,这是未来10年我们看到市场的变化。
    热潮下的冷思考
    中国科学院副院长、中国人工智能学会副理事长谭铁牛在日前举行的2016中国人工智能大会上表示,人工智能的全球化热潮下,产业化应用蓬勃发展,但发展的同时要保持冷思考。我国人工智能领域有很多机遇,未来要推动行业利好政策落地,发挥互联网大国的优势做大做强智能产业。
    但他同时认为,在人工智能热潮下还要保持冷思考。智能机器人、认知专家顾问等技术发展虽然处于膨胀期,但切记不要跟风。同时,在科研领域仍要苦练内功,此轮深度学习技术的成功不是理论方法的突破,而是在大数据和大规模计算资源驱动下基于基础理论的技术突破,所以深度学习依旧存在明显的局限性,尤其是在任务的切换、对环境变化的自身完善和对小样本的举一反三等方面,人工智能与人类还是相差甚远。
    他说,一年以来包括语音识别、自动驾驶在内的全球专用人工智能领域已取得突破性进展,但通用人工智能的研究与应用依然任重道远,可以用“有智能没智慧,有智商没情商,会计算不会算计,有专才无通才”这四句话描述人工智能的水平。

 
地址:北京市东城区北河沿大街95号
邮编:100006 电话:010-56317399
技术支持:北京紫新报通科技发展有限公司
 
技术支持:北京紫新报通科技发展有限公司