大同在线

首页 > > 汽车点评 >> 本田

决策算法成为竞争焦点

发布时间:2019-03-18 11:15:29

决策算法成为竞争焦点

从技术角度讲,自动驾驶由三大主要技术构成:感知、决策和控制。那现在自动驾驶技术真正的门槛在哪里?

如果你去CES参观各家公司的自动驾驶样车,你会发现一个趋势:各家公司的传感器配置越来越趋同化:前视多目摄像头,77GHz长距/短距雷达、环视摄像头、加上十个以上的超声女人告诉我波雷达,豪华一点的再配上几个低线束的激光雷达,这些传感器的供应商也差不多。

在感知层面,随着ADAS的大量部署和长时间的技术开发,已经相当成熟,可以说感知技术已经不是主要的瓶颈。而控制则是传统车厂和Tier1非常擅长的领域,做了很多年,积累了大量的经验。

自动驾驶在技术上的竞争,主要聚焦于决策环节。事实上,区分一个系统是ADAS还是自动驾驶,也主要是看该系统是否有决策部分。无论是谷歌,还是特斯拉,他们的核心竞争力,都还是体现在其决策算法方面。

传统汽车界的研发是基于功能安全的设计方法学建立的,渗透到开发流程的每一个环节,并且在过去一个世纪,将汽车的安全性提高到了极高的水准。

如今,顶尖的公司已经可以确保汽车发动机能使用一百万公里!但是面对汹涌而至的机器学习热潮,传统汽车界突然发现自己严重缺乏技术储备,面对特斯拉和谷歌激进的策略,显得力不从心。

这已经成为制约传统车厂开发自动驾驶的最大短板,目前,传统车厂或者大肆收购机器学习公司,或者与其合作,他们需要尽快补上这块短板。

传统车厂出身的克拉富西克显然深知这一点,在他出任Waymo CEO之后,谷歌一改之前模棱两可的商业策略,明确表示向车厂提供解决方案,并迅速宣布和本田合作,事实上是将自己定位在Tier 1的角色。

此前谷歌虽然在技术积累上处于领先位置,但一直没有确定可行的商业模式,克拉富西克的到来,让谷歌对于商业化的态度更接地气,也更精准。在该解决方案中,硬件基本也是外购的,显然无法成为谷歌的竞争壁垒,最有价值的,还是一整套经过验证的软件,尤其是其中的决策算法。可以想象的是,谷歌将会向业界提供软件授权,就像它之前在安卓系统上所做的一样。

理性决策是必然趋势

决策算法面临的最大挑战,就是如何达到自动驾驶所需要的极高的安全性和可靠性。自动驾驶决策的结果会输出到控制器,根据ISO26262已有的功能安全的规定,这会反过来要求决策系统也需要达到ASIL-D的标准。

目前,ISO组织对专门针对自动驾驶的功能安全标准正还在制定中,有可能会用一种新的标准进行考量,但功能安全的基本原则依然有效。

端到端的AI方法有隐患

有才庸人皆妒嫉

这意味着,我们必须严肃地思考,如何才能满足功能安全的要求?对于谷歌、百度以及许多初创公司,这些非传统车厂出身的玩家来说,是一个全新的命题。

目前,很多创新公司都在使用深度学习加增强学习做端到端的训练,也就是说,从传感器的输入直接导出控制器(刹车、油门、转向等)的输出。但深度学习的问题在于它失去了透明性,仅仅依赖于概率推理,也就是相关性,而非因果推理,而这两者是有本质不同的。

相关并不意味着因果。举个例子,统计发现,手指头越黄的人,得肺癌的比例越大。但事实上,手指的颜色和得肺癌的几率之间显然没有直接的因果联系。那么为什么统计数据会显示出相关性呢?这是因为手指黄和肺癌都是由吸烟造成的,由此造成了这两者之间产生了虚假的相关性。

深度学习就像一个黑盒子,无法进行分析,出了事情你不知道原因到底是什么,也没有办法预测下一次会出什么状况。

有一个很搞笑的例子,用深度学习训练一个系统,来分辨哈士奇和爱斯基摩狗,初步测试效果非常好,但进一步的测试表明,这个系统其实是通过区分背景,而不是狗本身来判定其种类的,因为训练所使用的样本中,爱斯基摩狗几乎总是伴随者雪地的背景,而哈士奇则没有,想想看,如果这样的系统应用到自动驾驶,是多大的隐患!

深度学习的实际表现,基本上取决于训练的样本以及你所要求输出的特征值,但如果你的样本比较单一,输出特征值又比较简单,则很容易训练出你并不想要的结果来。就自动驾驶而言,这是无法接受的,它需要高度的理性决策。

如今,深度学习的热潮席卷了整个业界,很多人不再对基础算法进行钻研,而是疯狂加大数据,堆机器进行训练,以期更快地出成绩,结果看上去还不错,但这样的非理性态度其实是给自动驾驶埋下了隐患。我们需要的是对于事实逻辑的深入分析,以及不同方法论的结合,从这个意义上讲,如果用小数据可以达到好的效果,更能说明我们对机器学习技术的理解能力。

基于规则的专家系统不灵活

传统的主机厂和Tier 1面临的则是另外的问题。如果接触各大Tier1的ADAS产品,无论是AEB,还是ACC,LKA,你会发现都是基于规则的专家系统。这种系统精确可分析,但专家系统的问题在于,在场景非常多变时,创建的规则就无法保证足够的覆盖面。

结果,当添加更多新的规则时,就必须撤消或者重写旧的规则,这使得这个系统变得非常脆弱。并且,各个功能都有自己单独的规则,组合到一起,其可能性就非常多,甚至还存在矛盾,这使得ADAS向自动驾驶过渡之路变得更加艰难。

我曾经跟一家主机厂在交流他们的决策系统时曾询问过这个问题,得到的答案是:这种基于专家系统的规则经过组合,能产生一万种可能!你甚至很难对这个系统进行完整的测试。

新的决策机制:因果推理

因此,我们需要在自动驾驶领域引入新的决策机制。自动驾驶决策技术路线的一个重大趋势,就是从相关推理到因果推理。这样的人工智能框架是Judea Pearl在八十年代建立的,他也因此拿到了图灵奖。

上世纪80年代初,Judea Pearl为代表的学术界出现了一种新的思路:从基于规则的系统转变为贝叶斯络。

贝叶斯络是一个概率推理系统,贝叶斯络在数据处理方面,针对事件发生的概率以及事件可信度分析上具有良好的分类效果。它具有两个决定性的优势:模块化和透明性。

模块化的优势非常重要,假如任务是更新汽车的变速箱,当变速箱被更换的时候,你不必重写整个传动系统,只需要修改为变速箱建模的子系统,其余的都可以保持不变。

因此,我们可以把深度学习的系统作为一个子模块融入到其中,专家系统可以是另一个子模块,也融入其中,这意味着我们有了多重的冗余路径选择,这种冗余构成了贝叶斯络的子节点,将有效强化输出结果的可靠性,避免一些低级错误的发生。

透明性是贝叶斯络的另一个主要优势。对于自动驾驶而言,这尤为关键,因为你可以对整个决策的过程进行分析,了解出错的哪一个部分。

可以说贝叶斯络是理性决策的极佳实现,适合用于设计整个决策的顶层框架。

因果推理的另一个典型范例就是基于增强学习的决策框架,它把一个决策问题看作是一个决策系统跟它所处环境的一个博弈,这个系统需要连续做决策,就像开车一样。优化的是长期总的收益,而不是眼前收益。这有点像巴菲特的价值投资,优化的目标不是明天的收益,而是明年或者十年以后的长期总收益。

谷歌把这样的框架用在下围棋上,取得了革命性的成功。自动驾驶的场景也非常适合应用这样的决策系统。比如说要构建价值络,评估当前的驾驶环境风险,评估的是从现在时间到未来时间的整体风险;然后利用策略络输出本车的控制决策,选择最优的驾驶路径和动力学输出。

同时,我们还可以构建一个基于模拟路况的仿真环境,通过增强学习去做虚拟运行,获得最优的决策模型,并且还将产生大量的模拟数据,这对决策算法的成熟至关重要。

可以说,向因果推理型决策模型转化是自动驾驶技术迈向成熟的重大标志。

目前的硬件效能达不到实用要求

对于自动驾驶这样的复杂任务,在设计软件的同时,还必须考虑与之匹配的硬件效能,这里包括性能、功耗和功能安全。

为了保证自动驾驶的实时性要求,我们需要保证软件响应的最大延迟在可接受的范围内,对于计算资源的要求也因此变得极高,目前,自动驾驶软件的计算量达到了10个TOPS(每秒万亿次操作)的级别,这使得我们不得不重新思考对应的计算架构。

图灵奖获得者Alan Kay,他有一句话是乔布斯一直信仰的:如果你严肃地思考你的软件,你就必须要做你自己的硬件。

事实上,整个数字半导体和计算产业的产业驱动力,正在从转向自动驾驶,后者所需要的计算量比要大两个数量级。

今天,打开任何一家主机厂的无人车的后备箱,都是一堆计算设备,不但没有地方放行李,而且还要解决它的整个系统稳定性问题。之前在乌镇举行的世界互联大会,在实际体验百度的无人车时,提到非常有趣的一点:“这辆无人车平稳地行驶了起来,但位于后备箱的车载计算机噪音较大,可以听到风扇在运行的声音。”

为什么呢?因为它使用的是CPU+GPU+FPGA的计算平台,计算所需要的功率非常大,GPU尤其恐怖,如果没有强力风扇来散热的话,夏天很容易烧坏机器。坐在这样的车里,就别讲究体验了。

功能安全是另一个巨大的挑战,这里面其实包含了多个方面的要求:处理器要符合至少ASIL-B等级的要求,可靠性需要能够保证在至少十年的使用期内不出问题。

高通在领域有非常强的实力,而且向汽车电子进军的努力也从未停止,但去年高通依然决定花370亿美元重金收购了汽车电子老大NXP,这从另一个侧面折射出汽车电子的门槛之高。

人工智能处理器与自动驾驶计算平台

这让我们想起计算机的发展历史,50年代是大型机的时代,那个时候一台大型机可以占据实验楼的一整个楼层,需要一个庞大的团队来操作,价格高到数百万美元;七十年代小型机占据主导,小型机可以安装进一个房间,价格也降到数万美元;八十年代是PC时代,可以摆放到桌面,价格则又降低了一个数量级,如今是,可以装进口袋;贯穿其中的是三个主要方面的进步:体积、功耗和成本。

人工智能所需要的处理器,从2012年开始业界已经开始广为关注,比如从GPU到FPGA,再到TPU,业界也沿着之前计算机走过路,重构人工智能所需要的处理器。

英伟达在本届CES上发布了最新的车载计算平台“XAVIER”,512个Volta CUDA核心可提供高达30TOPS的计算性能,但最引人注目的还是其30W的功耗,大大低于之前还需要水冷的Drive PX2。这是一个很大的进步,但还不够,要让自动驾驶得到普及,性能、功耗、成本和体积因素,一个也不能少。

如今很多车厂都制定了非常激进的自动驾驶开发计划,但其实样车开发与其投入到量产车的日程表其实是差异非常大的。与量产车的设计理念完全不同,量产车必须考虑成本因素,不能跟今天的GPU或者其它的计算所需要的成本一样,而这就需要业界提供新的计算平台。

FPGA被越来越多的公司关注,其可编程特性可以满足专有计算构架的需求,微软、Intel等公司都在大量部署基于FPGA的系统。

FPGA在ADAS方面的出货量也在迅速增加,去年的出货量应该不会低于3Mu。但FPGA再往上走,计算资源的扩展会让成本上升到很难接受的地步。半导体业界无数的历史都表明,FPGA往往是定制化ASIC的前哨站,一旦某个应用的量足够大,定制化ASIC就会变得更经济。

地平线机器人则希望借助自己的研究优势,目标是将原本智能在云端运行的人工智能,实现在高性能低功耗的大脑引擎(BPU)上。这是一个全新的计算构架IP,将充分适配深度神经络算法的要求,由此带来革命性的嵌入式人工智能,预计其成本和结伴而行功耗都将比现有GPU低一个数量级。这样的IP可以嵌入到SoC中,或者单独作为协处理器使用。目前地平线正在推进代号为“高斯”的计算构架IP的开发,预计17年底推出。

软硬件协同设计是新的趋势

在过去,处理器都是作为标准平台提供给业界,软件工程师拼命优化编译器、代码、任务调度等来达到更高的性能表现,但现在,这已经无法满足产品快速上市的要求了。

英伟达在AI业界攻城略地,几乎已经成为标配,这其中有其高性能GPU的因素,但问题在于,为什么其它GPU供应商没有赢得这场竞争?

英伟达不仅提供GPU硬件,还提供了高度优化的CUDA平台,该平台封装了大量高频使用的数学运算库,英伟达更进一步面向自动驾驶提供了端到端的解决方案,这实际上是一种重要的产品理念:软硬件协同设计。

这揭示了英伟达市场竞争成功的秘诀:通过软硬件协同设计,优化软硬件系统的性能表现,缩短客户导入时间,赢得市场。

新的自动驾驶计算平台,实际上是因应算法和软件的需求而来的,例如,为了更好地支持深度卷积神经络极大规模的矩阵运算,你需要考虑如何使用二值化方法来降低对于硬件乘法器的需求,如何重新设计缓存机制以避免I/O带宽成为整个计算系统的瓶颈等。为了满足功能安全的需求,你需要硬件级别的虚拟化,这就要求处理器构架设计方面需要考虑多核、VMM、设备I/O请求管理等。

Intel也在加强其在人工智能算法方面的积累,对Nervana和Movidius的收购反映了这一点。通过提供至强处理器、FPGA,结合其Nervana平台以及面向深度学习优化的数学函数库(MKL),提供完整的AI解决方案。

能否提供同时满足经济性和性能要求的计算平台,是自动驾驶能否从样车转向量产车的关键因素之一。

结语

公众对于自动驾驶依然有深深的疑虑,但在每一次革命性的交通运输方式出现时,类似的疑虑都曾经存在过。航空服务刚刚出现时,安全性非常低,多数人甚至都不相信金属构造能飞起来。

美国海军统计表明,在二战期间,因技术原因损失的飞机达2100架,是被击落飞机的1.5倍,但航空业依然发展了起来;高铁同样有类似的经历,19世纪火车刚刚出现时,即使是最有远见的人都无法想象时速超过300公里的列车,那时候的人们认为仅仅是气压的问题就足以让乘客丧命,而后来这些都成为了现实,并且发展了体量惊人的配套基础设施:铁道和机场。

当技术不存在原理性的问题之后,只要有巨大的商业潜力,利益的驱动终能克服技术上的挑战。

如果我们考察一段文明的发达程度,运输水平可能是最直观的指标。唐代玄奘取经,鉴真东渡,耗去的是一个人半生的时间,这里体现的是客运成本;南宋时期,从福建泉州出发的瓷器运到欧洲,增值达一百倍,体现的是货运的价值;19世纪美国的崛起,很大程度上得益于其全国铁路的建立,将联邦的各个州融合成为一个单一市场。

文明的发展过程,也必然伴随着运输成本的逐渐降低,以及运输效率的持续提升,它深刻重塑了经济的形态。Elon Musk的终极梦想是殖民火星,同样是一个运输能力改变文明的故事,自动驾驶就是当下发生的故事,当人的劳动力被释放之后,成本下降就会驱动一波全新的机会。过去一年里,自动驾驶领域的进步已经超出了绝大多数人的预期,自动驾驶的未来值得期待。

急性肌肉酸痛原因是什么
发高烧手脚发热
经期延长胸胀痛怎么办
精彩图片
推荐阅读