一、百度智能云AI技术加身,自动驾驶量变到质变倍道兼行
当前,自动驾驶技术的发展可谓日新月异,不过离最高级别还相去甚远。2022年,自动驾驶行业在喜忧参半中前行,一方面,众多自动驾驶公司估值缩水、裁员倒闭,高级别自动驾驶技术商业化落地尚需时日;另一方面,国内自动驾驶利好政策密集出台,首次实现立法突破,自动驾驶测试区不断增加。
据IDC《中国汽车云市场跟踪研究,22H2》报告显示,2022下半年,中国汽车云解决方案市场规模共计17.62亿人民币。其中,中国自动驾驶研发解决方案市场规模达4.95亿人民币,同比增长100.2%。百度智能云以35.9%的市场份额排名第一,同比实现162.0%的超高速增长,在国内汽车云市场中处于龙头地位。
在自动驾驶预冷之际,百度智能云为什么能够在竞争激烈的智能云市场取得如此骄人业绩?在自动驾驶赛道,百度智能云有怎样的布局和哪些合作模式?如何利用优越的闭环能力提升自动驾驶领域客户的核心竞争力?
图|百度智能云泛科技行业总经理张玮接受焉知专访
带着这些问题,记者在焉知第三届焉知年会线下专场会——百度智能云自动驾驶领域区域“智能行”系列活动(华东站)期间专访了百度智能云泛科技行业总经理张玮。他表示,百度智能云布局由来已久,之所以能够得到广大客户的高度认可,皆源于以合作模式、极致优化、全面数据服务,以及“AI大底座”技术,持续满足客户的差异化需求,为客户创造价值。
不言而喻,智能汽车是未来汽车发展的方向,自动驾驶技术已成为智能汽车研发的关键,汽车云市场竞争的关键领域之一正是自动驾驶。2023年,作为一种集成多种AI技术的综合模型,“AI+大模型”在自动驾驶中呈现出广阔应用前景,成为整个智能汽车行业关注的焦点。
百度智能云之所以在中国自动驾驶研发解决方案市场领袖群伦,张玮道出了个中缘由:“首先得益于百度智能云的领先架构。作为大模型与自动驾驶并重的头部科技公司,百度智能云基于‘云智一体’优势,正持续发力自动驾驶应用。”
他说,从2019年提出“云智一体”概念至今,百度智能云“云智一体”架构已迭代至3.0版本。通过切入行业核心场景,打造行业标杆应用,带动和沉淀了AI PaaS和AI IaaS层的能力,打造出极致性价比的异构算力和高效AI开发运行能力,其向上可优化已有应用、孵化新应用,向下可以改造数字底座。
“‘云智一体’战略让我们较早地在芯片、框架、模型和应用各层进行了布局和协同,成为全球唯一一家在各层都有领先产品的公司,”张玮说。
如果要给百度智能云找两个关键词,其一是“聚焦”,百度智能云依托“云智一体”的领先优势,聚焦自动驾驶研发过程,利用核心技术做最核心的事;其二是“完整”,百度智能云提供了从业务侧到资源侧的完整解决方案,包括端到端数据闭环、贯穿研发流程的工具链、为工具链提效的大模型,以及为全流程提供强大算力支持的“AI大底座”,能够满足从L2到L4的研发需求,加速自动驾驶业务落地。
谈到百度智能云在自动驾驶领域的布局,张玮表示,百度智能云依靠多年来在云计算、大数据、人工智能的深耕,赋能自动驾驶多个垂直赛道,客户涵盖乘用车造车新势力、商用车干线物流类、Tier1/2汽车零部件厂商、L4/L5无人自动驾驶小车,以及耕耘自动驾驶算法、解决方案的科技公司。
在解决方案层面,百度智能云提供自动驾驶云边协同、安全合规、量产车流量调度等解决方案,相关智能座舱解决方案、大数据解决方案都在场景打磨过程中。相比其他友商,百度智能云的产品与解决方案更为全面,无论是最佳实践,还是产品功能等都有丰富的最佳实践、落地场景,全面覆盖智驾、智舱、智图、智云四个领域。
灵活多样的合作模式也是百度智能云的一大特色,“合作既可以是双方共建式的战略合作,也可以是项目的合作,当然,我们也非常欢迎客户成为我们的生态合作伙伴,联合打磨解决方案和产品,”张玮表示。
在满足不同客户的差异化需求方面,百度智能云提供了丰富的产品和服务,包括基础云底座的IaaS和PaaS服务,还有上层应用级别的通用应用产品和行业应用产品,不同的客户可以各取所需。
在张玮看来,车企选择云服务合作伙伴的关键考量主要包括:一是技术实力和服务能力,比如能否提供先进的产品技术和解决方案,能否提供安全可靠的数据存储和计算服务,以及能否提供高效专业的客户服务;二是合作伙伴的支持和协同能力,包括是否有完善的合作机制和支持体系,是否能够协同创新和开拓市场;三是能否提供定制化解决方案,满足车企的差异化需求。
为了提供更好的服务,百度智能云从四个方面入手打造,一是加强技术研发和服务能力建设,不断提升产品技术和解决方案的先进性和服务质量;二是建立完善的合作机制和支持体系,为合作伙伴提供全方位的支持和服务;三是与合作伙伴一起积极进行市场推广和业务创新;四是注重定制化解决方案的开发,为客户量身定制。
构建自动驾驶端到端的模型生产和上线迭代的闭环能力,是自动驾驶领域客户加速技术研发和商用落地的核心竞争力之一。在这方面,百度智能云通过百度百舸方案对自动驾驶常用模型进行了优化与加速,尤其是通过百舸方案的AIAK训练加速能力。
截止目前,在CV、NLP、推荐场景中,基于百舸AIAK-Training2.0能力,针对自动驾驶典型模型,如resNET、bert、swin-transformer等,百度智能云携手英伟达,通过数据加载优化、模型计算优化、多卡通信优化等手段,实现了17个模型训练多达39%-390%的性能提升。“这项模型训练优化工作还在不断扩展和进行中。所以,百度百舸尤其模型训练加速能力,能为客户带来非常大的价值,”张玮信心满满。
他介绍说,百度智能云的AI IaaS,也就是百度百舸是一个AI异构计算平台,包含AI计算、AI存储、AI加速、AI容器四大核心套件,具有高性能、高弹性、高速互联、高性价比等特性。该平台充分汲取了百度异构计算平台多年的技术积累,深度融合无人驾驶场景的实践经验,能够为AI场景提供软硬一体解决方案,加速AI研发和工程化落地。
那么,在自动驾驶的数据采集、数据传输、数据存储、数据处理/标注、数据训练/仿真/测试等各个阶段,百度智能云是否都可以提供相应的服务呢?张玮给出了肯定的答案。
据他介绍,百度智能云可以提供自动驾驶领域全部的工具链能力,完整覆盖数据采集、传输、存储、数据处理与标注,以及训练/仿真/测试等自动驾驶业务环节。例如,在车辆数采环节,百度智能云有专业的数采服务,具备满足安全合规要求的甲级测绘资质。数据采集完成后,使用百度智能云移动存储设备月光宝盒及适配车机的硬盘,可满足用户对数据传输的时效性和安全性要求。随着采集数据量的不断增长,数据存储、扩展及成本控制已成为企业的重点考量,为此,百度智能云提供具备海量存储、AI数据处理等能力的对象存储产品。
在自动驾驶工具链的数据标注方面,百度智能云能够输出基于安全合规的数据标注解决方案。在自动驾驶训练环节,基于百舸AI异构计算平台,通过其AI计算层面的RDMA网络能力、AI存储层面的高速数据读取能力、AI容器层面的虚拟化与隔离能力,以及AI加速层面的训练推理加速能力,不仅可以大幅降低通信延时,提升训练与推理效率,还能在很大程度上帮助企业降低成本。百度智能云可以为企业客户提供基于海量场景精准度量的云仿真平台,帮助客户实现降本增效。
张玮坦承,自动驾驶数据,尤其是车采数据,量级非常庞大,随着存储规模的不断增大,存储成本也会成为一个棘手的问题。这种场景很适用百度智能云对象存储产品,因为它不仅具备分级存储能力,可以帮客户控制存储成本,同时轻松实现海量数据扩容,又具备原生的若干AI数据处理能力。PFS产品是专门针对高性能计算场景的并行文件存储服务,可以提供亚毫秒级访问能力、高IOPS及高吞吐的数据读写请求能力,非常适合AI训练场景,特别是自动驾驶训练数据集存储场景。利用存储分类,不仅能够精细化满足场景需求,也能提升业务和训练效率,帮助客户降低存储成本。
在数据标注环节,人工标注耗时费力,且标准不一。通常,云厂商都试图通过工程方法尽量减少人工标注,以提高标注效率。两种方法一是通过机器自动化标注,然后人工修正部分数据;二是通过仿真模拟生成大量标注好的数据。“这两种方式,在百度智能云内部都在使用。对于全新业务场景或经验积累较少的特定业务场景,优先以人工标注为主,以不断积累经验。之后再不断将能力完善到自动化标注工具中,所以目前已知的众多自动驾驶数据标注场景中,都在使用我们的自动化标注工具。”张玮说。
最后是路采车产生的海量数据的传输。张玮指出,通常企业会面临图商资质、采集备案、规范路采、脱敏脱密等业务痛点。“百度智能云有专业的数据采集服务,不仅有采集车队,还有专业的车辆改装技术团队,可进行深度定制,满足客户的多样化需求。”张玮补充说:“在具体数据传输中,都是按照安全合规要求进行;对于路采车是以加密硬盘形式离线运送数据,硬盘运送途中有2名具备安全资质的人员互相监督,从而保证数据与操作合规。”
“AI大底座”加速自动驾驶研发迭代
自动驾驶领域是一个强人工智能CV视觉的新兴高科技领域,大模型训练的支撑不可或缺,百度智能云是如何让大模型发挥作用的呢?
张玮告诉记者,百度智能云多年来一直在AI领域对相关技术能力进行深度研究与打磨,比如,以自动驾驶模型为重点的训练与仿真环节,利用百度多年沉淀的“AI大底座”技术栈,通过异构计算平台的GPU算力,在大幅提升性能的同时提高了利用率,有效解决了目前大模型的“算力恐慌”瓶颈;同时百度智能云还与英伟达合作,对一些特定算法模型进行定向优化,形成AIAK异构计算平台训练加速组件,目前这些能力都是免费提供给客户使用。
谈到百度智能云“AI大底座”异构计算平台的最佳实践,张玮分享道,某头部乘用车造车新势力的套整自动驾驶技术栈都部署在百度智能云上,使用“AI大底座”中的CCE云原生产品,在使用AIAK优化加速组件以及GPU资源共享调度下,资源利用率提升了2.5倍以上,在其自动驾驶业务研发方面发挥了重要作用。
另一个案例是国内一家头部汽车芯片公司,几年前该公司开始使用百度智能云设计的一套混合云架构,目前大部分核心训练任务都在百度智能云上完成。在“AI大底座”技术栈的赋能下,高效支持了该公司训练等相关任务,加速了产品研发迭代、芯片上车和SOP量产速度。
大模型虽好,但必须用数据来驱动。数据量不足,就会影响自动驾驶感知大模型的训练效果。凭借多年自动驾驶行业实践,特别是来自大量Apollo量产车在北京、上海、广州、武汉、重庆的道路数采自动驾驶数据,基于百度文心大模型的全流程数据训练,保障了其模型的精准性。“我们还将相关能力打磨成了产品和解决方案,可以为有数据采集、标注、训练需求的客户提供全套数据闭环解决方案,”张玮补充道。
“云智一体,深入产业”是百度智能云的战略,基于“AI大底座”和文心大模型,以及行业领先的全套自动驾驶工具链,百度智能云先后帮助传统车企、新势力、商用车和解决方案供应商等行业用户实现了自动驾驶业务落地。
张玮最后表示,AI技术赋能百度智能云正在加速自动驾驶由量变到质变的进程。未来,百度智能云将持续深耕包括“数据闭环-自动驾驶工具链-大模型-AI大底座”在内的自动驾驶研发解决方案,帮助汽车行业实现智能化升级。
【本文来自易车号作者焉知汽车,版权归作者所有,任何形式转载请联系作者。内容仅代表作者观点,与易车无关】