先驱者(5) AI巨头如何跨界自动驾驶

一、先驱者(5) AI巨头如何跨界自动驾驶

[汽车之家技术]有这样一家成立于2014年,旋即成为该领域“独角兽”的高科技企业,说起它的名字大部分人可能以为是历史课本某一章节的名称,但不夸张的说,如今我们几乎每天都离不开它的产品或技术。它赋予机器超过人类的辨别能力,并且在还会创造出更多来自于科幻小说的未来场景,那么TA与我们的《先驱者》系列内容又有什么联系呢?且听我娓娓道来。

1、如今大部分主流智能手机都装载了TA的技术;

2、这家公司汇集了计算机视觉领域的顶尖人才;

3、TA让管理大型城市就像玩电子游戏一样简单直观;

4、TA可能是未来自动驾驶领域一家顶尖的技术供应商。

不知你有没有发觉如今的机器正在变得“聪明”起来:早晨你抬起手机,当屏幕亮起的刹那就会自动解锁,想回顾一下昨天郊游的精彩照片,手机相册会根据不同的主角把相册中海量的照片自动分类;在地铁站台旁的无人售卖机旁,可以直接刷脸支付购买饮料;在机场无需工作人员,只要用身份证和你的人脸进行比对就可以完成值机手续;特殊时期,公司入口的摄像头就能够自动侦测访客的体温……

在这些“聪明机器”的芯片内,可能都写入了这家公司的代码,创始人汤晓鸥教授将这家公司命名为“商汤”,它是中国有据可考的第一个朝代商的开国君主的名称,也意味着这家公司将要在一片新的领域开疆拓土。

说到计算机视觉技术,在如今大家可能耳熟能详,但是在上世纪90年代初,大部分人还没接触过电脑的年代,汤晓鸥就已经开始投身与相关领域的研究了。

基于多年深耕,汤晓鸥教授在计算机视觉以及人工智能领域成就卓著,2001年,他建立了香港中文大学多媒体实验室,这也是最早应用深度学习进行计算机视觉研究的华人团队。在2016全球GPU技术大会(GTC)上,多媒体实验室与来自麻省理工、斯坦福以及加州大学伯克利分校等实验室并列为10大顶尖AI先锋。如今,它仍然是计算机视觉以及深度学习领域最为活跃的实验室,每年在该领域的顶级学会上发表百余篇重量级论文。实验室吸引了诸多顶尖人才的加盟,也被业内誉为计算机视觉界的“黄埔军校”。

人脸识别是计算机视觉技术的一个主要应用场景,同时也被业内认为是一项挑战性非常高的技术,因为首先不同人的面部关键特征位置类似,其次即便一个人,在不同时间和环境下,TA的面部特征也因光线和情绪等不同而有着不小的变化。

人脸识别技术获得广泛应用的里程碑事件发生在2014年:Facebook首先发布了自己的DeepFace面部识别技术,在750万人脸数据的基础上,达到了接近于人类的识别率;而仅仅几个月后,汤晓鸥团队开发了一个基于高斯过程的人脸识别技术GaussianFace(高斯脸),取得了98.52%的识别率,首次超越了人类,随后团队发表的DeepID系列算法,将准确率逐步提升到了99.55%。这意味着计算机面部识别技术已经可以应用于金融以及重要的工业应用领域。

2014年,汤晓鸥教授正式开始自己的创业,获得IDG资本数千万美元的A轮投资之后,与徐立、王晓刚等一起创建了商汤科技。商汤科技成立之后,迅速“笼络”了多媒体实验室朋友圈的各路精英“学霸”,成为了将前沿尖端科技向产品落地转化的孵化基地。

凭借着在AI领域强大的技术优势,商汤科技创立以来受到了资本市场的格外青睐,是目前全球总融资额及估值最高的人工智能创新企业。

在文章的开头我们说过,我们几乎每天都在接触着商汤的技术:诸如智能手机上的面部识别解锁、手机照相美颜及AR特效、美图软件、直播视频平台,以及我们在银行柜台、支付软件、火车站、机场等场合使用的面部识别身份认证系统等等。在我们看不见的地方,商汤还在与各地政府合作建立智慧城市解决方案,诸如通过分析遍布城市的上百万个摄像头所采集的信息,可以迅速发现出在城市各个角落发生的异常情况,诸如共享单车违规停放、垃圾随意堆放、突发火情等,相当于削减了大量人力巡视成本,同时提升了城市管理效率。基于深度学习技术,智慧城市还会根据需求延伸出多种应用场景。

2017年12月,一家国际一线车企宣布与商汤合作研发L4级以上的自动驾驶技术,并为商汤自动驾驶团队投入了一笔大额启动资金用于后续项目的研究开发。这在业界掀起了不小的波澜:一家蜚声世界的大型国际车企为何要选择与这样一家仅仅成立3年,且之前在汽车界没有任何声量的企业进行合作?

事实上这家国际车企的决定绝非草率:在前期招标期间有十余家国际一流企业竞标,最终商汤团队凭借着其算法的高识别率、准确和稳定性一路过关斩将,凭硬实力最终赢得了甲方的信赖。在2016年,商汤便与这家车企合作推出了基于四个摄像头的自动驾驶解决方案,并且成功完成特定场景下的自动驾驶挑战,并且在大雨天气下仍然表现出色。这对于高度依赖感知技术的自动驾驶汽车来说,无疑是一个令人侧目的突破。

说到商汤的自动驾驶团队,究竟聚集了多少业界的“大牛”能做到这样的成绩?在《先驱者》采访期间,我们有幸在商汤位于北京中关村的办公地点遇到了商汤自动驾驶团队负责人本尊,令我们没想到的是,她竟然是一位“准九零后”姑娘——初次见面说她是一名在校大学生绝对没人怀疑,不过言行举止间透露着当年班中那位“学霸”的气质。

如同香港中文大学的其他师兄弟姐妹们一样,石建萍有着一份令人瞩目的履历。攻读博士期间,她专注图像模糊评估领域,发表了12篇顶级会议和期刊论文。

16年商汤开始着手研究自动驾驶时,她与团队提出了仅依赖摄像头实现特定场景下的自动驾驶技术所需的所有感知的方案。当时这样的想法在业内尚无先例,在非常短的时间内,他们从零开始,快速完成了数据标注、模型提升、数据多样性增强等多个方面的快速迭代,顺利实现了依靠摄像头达到特定场景下自动驾驶驾驶的要求。在毫无经验可言的未知领域探索,大概也只有像她这样天赋异禀的年轻人才能如此充满创造力吧。

随后,商汤自动驾驶团队迅速壮大,由10余人发展到了超过200人规模,这些都是在相关领域的尖端人才。凭借着人才和技术优势,相继攻克了多传感器信息融合、人车行为分析预测与决策系统等多重难题,建立了完整的自动驾驶/辅助驾驶解决方案,迅速实现了商业化落地。

说到与当前在辅助驾驶领域深耕多年并且占据绝大部分份额的国际巨头相比较,石建萍表现得相当自信:“在感知的核心算法性能,我们肯定是超越他们的。”——一种被学霸支配的恐惧感油然而生。不仅如此,在与主机厂进行合作时,商汤还有着本土化优势,无论沟通成本还是深度定制化能力,都是国际供应商所不能及的。

那么做好对一座大型城市的感知之后,做自动驾驶是否是一种“降维打击”呢?石建萍也坦言,即便是“学霸团队”,面对新事物仍然需要一个学习过程。相比智慧城市的相关感知,做自动驾驶对于精度和准确性无疑有着更高的要求——因为这与车上成员的安全息息相关,安全正是自动驾驶的第一要素。而与国际一线的汽车厂商合作,也让商汤的自动驾驶团队深入了解了汽车厂商的研发流程和思维方式,从而也为今后与更多的OEM合作打下了基础。

除了与国际厂商合作之外,商汤的高级驾驶辅助系统解决方案在国内的落地步伐也在逐渐加速——在今年的北京车展上,搭载商汤辅助驾驶解决方案的哪吒汽车正式与公众见面。

在上海临港智能网联测试园区以及周边开放道路,商汤科技的L4级自动驾驶车队正在进行着紧锣密鼓的路测,在这里测试车型收集的数据,将要在商汤的深度学习模型中进行积累训练,从而“培养”出更聪明的自动驾驶汽车“大脑”。

相比已经开始项目落地的L2级驾驶辅助功能,商汤的自动驾驶技术团队同时也在投入相当的精力用于L4级多传感器融合感知以及决策的研究。在石建萍看来,L4和L2之间并没有天然的壁垒,两者从技术角度来看有着一定的共通性:一方面L2的数据通过有效积累可以为L4打下基础;同时L4测试的数据可以积累回溯到L2的场景中。L2的视觉感知对于L4是不可或缺的部分,也是对于激光雷达一个必要的补充。石建萍颇有些自豪地说,对于商汤这个体量的公司而言,做自动驾驶不需要讲故事来吸纳风险投资,所以可以按部就班,潜心研究技术的迭代。这无疑是让许多自动驾驶公司眼红的地方。

通过多传感器感知算法的研究,目前商汤在该领域已经积累了相当的经验,在不久前,商汤与我们在《先驱者》第四期聊到的国内激光雷达头部公司禾赛共同推出了集成算法的PandarMind激光雷达产品,大大降低了客户的研发成本。

2020年“新基建”是一个热度非常高的话题,国家对于5G以及城市智能化基础设施的投入,对于自动驾驶而言绝对是个利好消息。除了车端之外,石建萍团队也在着手进行路端感知技术的推进工作——将传感器集成在路端,同时通过5G信号低时延地将海量感知数据传输给自动驾驶车辆,这相当于在路上的自动驾驶车辆可以“共享”传感器,对于自动驾驶车型而言也会降低单车成本,同时作为传感器的冗余,也可以提升车辆自身的安全性。

除了自动驾驶之外,以感知见长的商汤科技自然还会将自己的AI技术拓展到新的用车场景:在上海商汤总部,我们体验了商汤定义的智能车舱。通过视觉识别技术,相当于为车辆安设了双眼——以金融级的识别准确率来分辨车主,可以实现面部解锁、千人千面个性化设置,而在车内的摄像头,则可以识别驾驶员各种手势命令以及对不规范的驾驶行为进行识别和提醒等等。得益于商汤对于视觉识别技术的深厚积累,我们在现场体现各项识别功能可谓准确而流畅。据悉,商汤已经与另外一家欧洲豪华车厂达成合作协议,不久的将来就可以看到更多车内智能感知功能面世。配合驾驶辅助系统,商汤可以为主机厂提供一套完整的智能汽车解决方案,不同部门之间形成良好的协同效应。

先驱者(4)激光大战中的中国高端玩家

先驱者(3)中国激光雷达企业逆袭记

先驱者(2)机器视觉领域的中国挑战者

先驱者(1)一文了解世界自动驾驶格局

© 版权声明

相关文章