2022年,自動駕駛領(lǐng)域依舊無比熱鬧。
隨著智能化普及,后疫情時代的到來,車企紛紛提前搶占未來產(chǎn)業(yè)制高點(diǎn),加大對自動駕駛技術(shù)研發(fā)和投資。與此同時,激光雷達(dá)與大算力芯片的技術(shù)不斷成熟且成本不斷下降,正越發(fā)促進(jìn)高階智能駕駛的量產(chǎn)加速。
在高階智能駕駛量產(chǎn)之際,智能駕駛公司從算法、算力、數(shù)據(jù)上的積累,以及技術(shù)和成本維度考慮,在前進(jìn)的道路上走向了不同的賽道,L2升維與L4降維之戰(zhàn)也逐漸呈現(xiàn),不管是升維還是降維,量產(chǎn)之路依舊布滿荊棘。
智能駕駛公司需從需求與痛點(diǎn)深挖,以技術(shù)為核心、流程為保障、數(shù)據(jù)為驅(qū)動,多平臺拓展,才能在量產(chǎn)之路上走的更順更遠(yuǎn)。
那么,高階智能駕駛的量產(chǎn)有什么特點(diǎn)?量產(chǎn)路線如何選擇?落地進(jìn)程又到了哪一階段?
圍繞高階智能駕駛量產(chǎn)的路線、痛點(diǎn)、落地等,中汽創(chuàng)智智能駕駛首席技術(shù)官張振林在「量子位·視點(diǎn)」直播中分享了他的從業(yè)經(jīng)驗(yàn)和觀點(diǎn)。
以下根據(jù)分享內(nèi)容進(jìn)行整理:
感知路線及升維降維路線之爭的理解
根據(jù)國際認(rèn)可度相對較高的SAE美國汽車工程學(xué)會對自動駕駛進(jìn)行的L0到L5分級,“高階智能駕駛”主要是指L3及以上級別。
L3及以上和L2最主要的區(qū)別在于駕駛的主體:L3的駕駛主體是系統(tǒng)而非人類,在個別情況下可能需要人類接管;而L2駕駛主體還是人類,系統(tǒng)僅作為輔助。
談到高階自動駕駛的量產(chǎn),我們先探討下現(xiàn)在的L3,大家都是怎么做的?
自動駕駛的發(fā)展離不開整個產(chǎn)業(yè)鏈的發(fā)展和成熟,其中有兩個最核心的點(diǎn):一是感知,二是計(jì)算。
從感知側(cè)來看,800萬像素相機(jī)以及車載激光雷達(dá)已快速發(fā)展并進(jìn)入前裝量產(chǎn)時代,4D成像雷達(dá)也為自動駕駛提供了一些新的選擇。5年前,一款Velodyne 64線激光雷達(dá)價(jià)格是幾萬美金,但今天,一些車規(guī)量產(chǎn)的激光雷達(dá)成本都已控制在萬元以下。
從算力側(cè)看,幾年前的自動駕駛更多采用的是X86 CPU+GPU的架構(gòu),通過CPU+GPU的算力來為算法提供硬件上的支撐。但今天,大算力的車規(guī)SOC已紛紛上車,500Tops到1000Tops已不再遙不可及。除國際巨頭外,我們可以欣喜地看到許多中國自主研發(fā)的大算力平臺也已進(jìn)入上車搭載階段,比如華為的MDC系列,地平線的征程系列,黑芝麻的A1000等。
可以說,整個自動駕駛產(chǎn)業(yè)鏈已經(jīng)非常接近大規(guī)模量產(chǎn)的狀態(tài),但在實(shí)現(xiàn)量產(chǎn)的具體方式上,自動駕駛的發(fā)展路線也呈現(xiàn)出多樣化的特征。
谷歌旗下的自動駕駛公司W(wǎng)aymo采取以激光雷達(dá)為主的發(fā)展路線,特斯拉采用其代表性的純視覺自動駕駛方案,以百度為代表的一些國內(nèi)公司試圖推進(jìn)以路側(cè)智能與車端智能互為補(bǔ)充的車路協(xié)同技術(shù)路線。我們認(rèn)為無論是激光派還是視覺派,無論是單車智能還是車路協(xié)同,從技術(shù)本身而言,它們沒有矛盾也不沖突。
對于智能駕駛,尤其是高階自動駕駛來說,“安全第一,成本可控”是量產(chǎn)落地的最核心目標(biāo)。結(jié)合自動駕駛在算法、算力、數(shù)據(jù)上的積累,從技術(shù)和成本的維度綜合考慮,中汽創(chuàng)智提出以視覺感知為主、其他傳感器為輔的高階自動駕駛前裝量產(chǎn)方案,同時兼顧中國特色協(xié)同式自動駕駛的落地應(yīng)用,逐步實(shí)現(xiàn)安全、高效和平穩(wěn)的出行方式。
我們結(jié)合網(wǎng)上公開的渠道信息分析中國自動駕駛量產(chǎn)方面做得比較不錯的智能駕駛公司及主機(jī)廠,可以看到,這些量產(chǎn)車型中搭載的攝像頭數(shù)目前最高已達(dá)到12個,毫米波雷達(dá)最多達(dá)6個,激光雷達(dá)最多達(dá)3~4個。采用的算力平臺覆蓋英偉達(dá)的Xavier、Orin系列、Mobileye、華為mdc810等。在軟件功能上,這些車型已具備L2甚至L2+應(yīng)用場景實(shí)現(xiàn)能力,功能包括ADAS、城市及高速NOP等行車功能,并且搭載了從APA、HPP到RPA甚至AVP的泊車功能。
但目前主流車企的新車型大部分采用超前硬件預(yù)埋和軟件迭代的量產(chǎn)方式,也就是說,車輛已經(jīng)具備L2的軟件功能和成熟的L3的硬件。萬事具備,只待OTA,但是誰來提供一整套的解決方案和核心的算法?
其實(shí),業(yè)內(nèi)也呈現(xiàn)出“升維”和“降維”兩種不同的聲音。其中,傳統(tǒng)ADAS或者說L2級供應(yīng)商正采取的是升維的策略,而最近一些L4級供應(yīng)商更多采用了降維策略。供應(yīng)商之所以采取不同的路線,是因?yàn)槠渥陨淼膬?yōu)勢差異。ADAS供應(yīng)商的優(yōu)勢在于工程化能力,而L4供應(yīng)商優(yōu)勢更多在于算法能力。但實(shí)現(xiàn)量產(chǎn)其實(shí)要求我們既要有高階的算法能力,也要具備強(qiáng)大的工程能力,更重要的是具有大數(shù)據(jù)積累能力。
所以,不同的企業(yè)結(jié)合自身優(yōu)勢和發(fā)展路徑會采取不同的實(shí)現(xiàn)方式,但目前還沒有一家公司完成真正L3級別自動駕駛的方案量產(chǎn)。
高階智能駕駛量產(chǎn)痛點(diǎn)解析
在這里,我想套用蘋果CEO庫克的一句話:“自動駕駛是所有人工智能項(xiàng)目之母,它同時也是所有人工智能項(xiàng)目當(dāng)中最難的一個。”
我最早看到這句話是在2017年左右,我相信當(dāng)時聽聞庫克這句話的時候,蘋果應(yīng)該已經(jīng)開展了相應(yīng)的自動駕駛相關(guān)業(yè)務(wù)。但到幾年后的今天,蘋果的自動駕駛汽車還是遲遲沒有露出真容,這背后的原因到底是什么?
結(jié)合自身經(jīng)驗(yàn)與行業(yè)分析,要實(shí)現(xiàn)自動駕駛真正的量產(chǎn)落地,我們認(rèn)為要面對6大挑戰(zhàn)。
第一塊挑戰(zhàn)更多是從人工智能項(xiàng)目本身來看,包括了數(shù)據(jù)、算力和核心算法層面。其中的每一項(xiàng)都需要豐富的資源、優(yōu)秀的人才進(jìn)行持續(xù)投入和鉆研提升。
除了技術(shù)和算法問題本身,要真正達(dá)到量產(chǎn)性的落地,工程化能力、成熟的政策法規(guī)以及成本和市場接受度都是自動駕駛是否能夠?qū)崿F(xiàn)量產(chǎn)的核心挑戰(zhàn)。
高階智能駕駛量產(chǎn)落地思路
針對高階智能駕駛量產(chǎn)落地,中汽創(chuàng)智結(jié)合自身定位、業(yè)務(wù)以及過往的量產(chǎn)經(jīng)驗(yàn),總結(jié)出一些思路。
首先,注重開創(chuàng)未來汽車產(chǎn)業(yè)合作新格局。中汽創(chuàng)智團(tuán)隊(duì)不僅聚集了主機(jī)廠、零部件供應(yīng)商,同時還擁有大量從頭部自動駕駛公司、科技公司、互聯(lián)網(wǎng)公司來的優(yōu)秀人才。我們?nèi)翰呷毫?、頭腦風(fēng)暴,確立了公司定位和智能駕駛業(yè)務(wù)規(guī)劃。在此,我來分享下中汽創(chuàng)智團(tuán)隊(duì)如何看待未來的汽車行業(yè)格局。無論自動駕駛玩家多少,大家始終承認(rèn)主機(jī)廠仍是其中最重要的玩家之一,而傳統(tǒng)的Tier 1跟主機(jī)廠的合作模式在這個軟件定義汽車的新時代發(fā)生了一些變革。因此,中汽創(chuàng)智結(jié)合自身優(yōu)勢提出“Tier 0.5”的新角色,希望創(chuàng)造一種主機(jī)廠-供應(yīng)商和供應(yīng)商-供應(yīng)商之間的新型合作關(guān)系,并結(jié)合“產(chǎn)學(xué)研用”和國家戰(zhàn)略打造創(chuàng)新型企業(yè)。
此外,確保實(shí)現(xiàn)系統(tǒng)全棧自研。依托中國一汽、東風(fēng)、長安三大主機(jī)廠,并結(jié)合三家主機(jī)廠的平臺優(yōu)勢,我們深度挖掘股東方們的共性與前瞻性需求。從自研的工具鏈、車規(guī)級協(xié)議適配、RTOS適配、核心模塊的算法交付,以及前裝高階AD控制器研發(fā),中汽創(chuàng)智已擺脫對傳統(tǒng)Tier 1的依賴。中汽創(chuàng)智智能駕駛業(yè)務(wù)是基于全棧的系統(tǒng)自研能力,面向行業(yè)客戶提供多維度的智能駕駛量產(chǎn)解決方案以及技術(shù)服務(wù),從域控制器到系統(tǒng)設(shè)計(jì)、工具鏈到場景數(shù)據(jù)、核心自研算法及軟件,中汽創(chuàng)智提供一種完全解耦的、完全開放的、完全適配的Tier 0.5供應(yīng)商模式。這就是我們的業(yè)務(wù)邏輯,也是我們在后續(xù)量產(chǎn)過程中最強(qiáng)有力的保證。
算法、數(shù)據(jù)、工程化上的思考與實(shí)踐
要實(shí)現(xiàn)前裝量產(chǎn)以及量產(chǎn)中不同的車型搭載必然會受到產(chǎn)品的定位、成本以及價(jià)格的約束,需要考慮到車型的傳感器選型、數(shù)量、域控制器的算力大小和功能個性化等各種因素。
面對此類復(fù)雜場景,中汽創(chuàng)智開發(fā)了一套統(tǒng)一的算法框架——可按照原子化組件化的開發(fā)模式,滿足多場景可復(fù)用的特點(diǎn)。從底層的跨硬件平臺、跨操作系統(tǒng)、跨原子化組件、到算法及工程組件,再到上層的應(yīng)用軟件,這一框架兼容多個硬件平臺,可實(shí)現(xiàn)動態(tài)編排,提高部署效率。把算法模塊化部署到設(shè)備端進(jìn)行工作流的編排、算法布置、文件解析,通過中間件接口的抽象和信息接口的統(tǒng)一,可自動生成所面臨的硬件平臺和功能場景以及所需要的軟件系統(tǒng)。
在統(tǒng)一的自動駕駛系統(tǒng)框架下,核心的感知算法模塊也在進(jìn)行相應(yīng)創(chuàng)新,其中值得一提的是從經(jīng)典感知到下一代感知算法的迭代。經(jīng)典感知常基于二維的圖像感知算法,即數(shù)據(jù)端結(jié)合二維的單幀圖像做相應(yīng)識別,標(biāo)注端更多采用人工標(biāo)注方式。
為此,我們提出“下一代感知算法”,即從算法上結(jié)合視頻流感知、多相機(jī)BEV融合、相機(jī)-激光雷達(dá)前融合以及多模態(tài)感知,通過多種方式提供端到端更高精度的感知算法。在數(shù)據(jù)端,不僅依靠單幀數(shù)據(jù),還結(jié)合包括相機(jī)、激光雷達(dá)和定位等多傳感器的視頻數(shù)據(jù)。此外,我們研發(fā)出長尾數(shù)據(jù)挖掘系統(tǒng)以擴(kuò)展數(shù)據(jù)挖掘能力,還提出在標(biāo)注端采用4D標(biāo)注方式并提取豐富的時空序列信息。
端到端的感知模型設(shè)計(jì)方案的最大亮點(diǎn)是共享主干極大地降低了訓(xùn)練資源的開銷,并節(jié)省模型嵌入式部署算力。此外,通過引入自注意力機(jī)制及對全局特征和局部特征的深層融合,模型特征表征能力得以提高。結(jié)合相關(guān)的網(wǎng)絡(luò)設(shè)計(jì)和訓(xùn)練技巧,我們在YOLOP基礎(chǔ)之上提出融入YOLOPV2的概念,該方案的性能和精度在BDD100k公開數(shù)據(jù)集三項(xiàng)感知任務(wù)中均達(dá)到了SOTA級別。
另外,中汽創(chuàng)智3D端到端的感知方案能夠直接輸出目標(biāo)位置、大小和朝向,利用激光雷達(dá)的深度監(jiān)督訓(xùn)練提升遠(yuǎn)距離目標(biāo)檢測精度。這一方案結(jié)合視覺3D和激光3D,共用一體化目標(biāo)級后融合方案,實(shí)現(xiàn)多傳感器融合、感知輸出互補(bǔ),目前我們能感知的距離已達(dá)到最高200米的可用范圍。
我們采取的BEV前融合感知算法是以BEV特征編碼和特征融合模塊為核心,開發(fā)出多源異構(gòu)輸入下的大一統(tǒng)多模態(tài)前融合感知算法。它是一種松耦合算法,可以結(jié)合不同的傳感器配置,如Camera-Lidar、Camera-Radar以及Camera-Lidar-Radar等多種傳感器的融合方式。此套感知算法直接支持端到端的輸出,利用Transformer Decoder操作來直接預(yù)測目標(biāo)3D候選集,省略掉非常繁瑣的后處理過程。
除了感知側(cè)外,可能在實(shí)際行車中遇到的問題更多涉及的是決策側(cè)。經(jīng)過實(shí)踐,我們認(rèn)為不僅要結(jié)合傳統(tǒng)的基于規(guī)則的決策,即按照場景的分類器,還要結(jié)合最新的學(xué)習(xí)與強(qiáng)化學(xué)習(xí)算法,比如說POMDP等。將兩種決策方法和策略融合起來,一方面用傳統(tǒng)的方法來保證它的魯棒性,另一方面針對特殊的corner-case場景,用大量人類“老”司機(jī)的駕駛行為作為訓(xùn)練數(shù)據(jù),使得自車在不同路況下的決策更加智能,更加魯棒,最終大幅提高系統(tǒng)的行為決策能力。
在人工智能時代,如果將算法比喻成發(fā)動機(jī)的話,那數(shù)據(jù)就像燃料,其重要性不言而喻。數(shù)據(jù)方面的核心問題是數(shù)據(jù)量,針對此,中汽創(chuàng)智有著得天獨(dú)厚的優(yōu)勢——結(jié)合股東方一汽、長安、東風(fēng)和兄弟單位T3出行,我們具備一個數(shù)據(jù)生態(tài)聯(lián)盟來共同支撐數(shù)據(jù)的獲取。目前,大部分車企都具備大量的數(shù)據(jù),但如何利用好海量數(shù)據(jù)、提高數(shù)據(jù)的使用率是值得思考的問題。中汽創(chuàng)智結(jié)合標(biāo)注、采集、多模態(tài)融合、序列提取,用4種串行方式來實(shí)現(xiàn)1個融合的自動標(biāo)注,從而降低80%以上的人工標(biāo)注成本。
在技術(shù)工程學(xué)會的支持下,中汽創(chuàng)智也正在計(jì)劃和推動結(jié)合相關(guān)股東方以及核心合作伙伴建立一個數(shù)據(jù)共建、共享的生態(tài)聯(lián)盟,通過聯(lián)盟形成統(tǒng)一的開發(fā)流、統(tǒng)一的標(biāo)注標(biāo)準(zhǔn),以及合理合規(guī)的數(shù)據(jù)共享交易機(jī)制。為實(shí)現(xiàn)此生態(tài)聯(lián)盟,我們應(yīng)更好地推動數(shù)據(jù)建設(shè),特別是結(jié)合專用采集車和可能量產(chǎn)搭載的車輛,以及像T3出行這樣的網(wǎng)約車、Robotaxi。
中汽創(chuàng)智有一套非常成熟的數(shù)據(jù)采集方法——收集不同感知設(shè)備的原始數(shù)據(jù)(包括車輛行為的總線數(shù)據(jù)、環(huán)境信息數(shù)據(jù)等),通過開發(fā)分類器自動篩選自動觸發(fā)的方式,來采集Corner-case以及結(jié)構(gòu)化信息。同時,我們還利用數(shù)據(jù)壓縮的技術(shù)進(jìn)行抽幀裁剪等,通過物理方式實(shí)現(xiàn)數(shù)據(jù)的交換,最終實(shí)現(xiàn)數(shù)據(jù)閉環(huán)和平臺共享。數(shù)據(jù)會也同時反饋到量產(chǎn)車和T3出行的車輛上,通過OTA不斷升級自動駕駛算法,也不斷地對數(shù)據(jù)采集進(jìn)行針對性的重新思考和界定。
前面陳述了算法和數(shù)據(jù)的量產(chǎn)實(shí)踐,但規(guī)?;慨a(chǎn)這件事的難度不僅在于技術(shù)問題,更重要的還有工程化問題。
在此方面,以前我在做L4的創(chuàng)業(yè)公司時,發(fā)現(xiàn)我們的同事和團(tuán)隊(duì)對于車企V模式了解并不多。但在實(shí)際開發(fā)過程中,為了更好地跟結(jié)合車企現(xiàn)有流程并融入其體系,量產(chǎn)車規(guī)級的系統(tǒng)開發(fā)流程是必不可少的。以領(lǐng)航輔助功能為例,在需求挖掘、功能定義、需求分析、系統(tǒng)設(shè)計(jì)、軟件開發(fā)的不同階段,通過 V模式從需求到實(shí)踐到集成到反饋形成相應(yīng)的閉環(huán)。通過用這套方法可以更好地適應(yīng)現(xiàn)在整車廠頻繁發(fā)現(xiàn)的問題需求變更,來更好地實(shí)現(xiàn)對于車企自動駕駛量產(chǎn)需求。
另外,在包括前面提到的算法和感知等整體的開發(fā)過程當(dāng)中,功能安全應(yīng)該是貫穿到整個開發(fā)流程的體系當(dāng)中的。中汽創(chuàng)智也結(jié)合 ISO26262中功能安全模塊的要求,增加到現(xiàn)有的ASPICES開發(fā)流程當(dāng)中,從設(shè)計(jì)、從頂層的架構(gòu)到后期的具體的代碼、開發(fā)接口的設(shè)計(jì)等提出新的流程和體系,來確保開發(fā)質(zhì)量和產(chǎn)品可靠性。除了開發(fā)流程,我們也認(rèn)為在高階的自動駕駛中,既然系統(tǒng)要承擔(dān)駕駛的主體任務(wù),那么安全冗余的架構(gòu)也是必不可少的。
冗余方面也有不同的階段,第一代實(shí)踐之初是通過一個個相對來說較小較輕的智能前視的控制器再連接智能駕駛域控實(shí)現(xiàn)的,它是一個非對稱的安全冗余架構(gòu)。當(dāng)自動駕駛域控制器失效時,智能控制器應(yīng)具備獨(dú)立控制能力,可以讓車安全停下或者說避障等。但是,從成本的角度和實(shí)際的操作來看,這一架構(gòu)還有很大的提升空間。針對高階的系統(tǒng)、針對ASIL-D級的需求,我們提出物理級的安全冗余架構(gòu),即當(dāng)前研發(fā)的對稱表決邏輯架構(gòu),當(dāng)SOC1和MCU1失效的時候,SOC2和MCU2會進(jìn)行take over 安全冗余進(jìn)階,同時配合冗余的一個電源和傳感器方案,可以實(shí)現(xiàn)剛提到的物理級安全冗余和系統(tǒng)ASIL-D的等級。
在這方面,中汽創(chuàng)智可以比較自豪地說,目前整套的開發(fā)體系已經(jīng)在2021年獲得了相應(yīng)的ASIL-D級認(rèn)證。
最后,我給大家播放下中汽創(chuàng)智的實(shí)踐視頻,拍攝點(diǎn)是在南京江寧區(qū)的核心路段,時間是在7月底的晚高峰,是隨機(jī)抓拍了一段路測視頻。如視頻所見,這套算法目前已能在相對繁忙的公開城市道路上,自由地實(shí)現(xiàn)跟車變道,以及紅綠燈的識別等。畫面右上角是傳感器視角所看到的實(shí)時畫面。
訪談
更多做行業(yè)賦能者 HID迎接數(shù)字化浪潮新機(jī)遇 破解新挑戰(zhàn)
今年3月份,全球可信身份解決方案提供商HID發(fā)布了最新的《安防行業(yè)現(xiàn)狀報(bào)告》(以下簡稱“報(bào)告”),該報(bào)告…
數(shù)字化浪潮下,安防廠商如何滿足行業(yè)客戶的定制化需求?
回顧近兩年,受疫情因素影響,包括安防在內(nèi)的諸多行業(yè)領(lǐng)域都遭受了來自市場 “不確定性”因素的沖擊,市場…
博思高鄧紹昌:乘產(chǎn)品創(chuàng)新及客戶服務(wù)之舟,在市場變革中逆風(fēng)飛揚(yáng)
11月24日,由慧聰物聯(lián)網(wǎng)、慧聰安防網(wǎng)、慧聰電子網(wǎng)主辦的2022(第十九屆)中國物聯(lián)網(wǎng)產(chǎn)業(yè)大會暨品牌盛會,在深…