本文來(lái)源:智車(chē)科技
目前自動(dòng)駕駛在場(chǎng)景測(cè)試中,比如車(chē)道匯入場(chǎng)景,往往會(huì)預(yù)先設(shè)定好周?chē)?chē)輛與行人的速度以及軌跡等,比如前車(chē)以60公里每小時(shí)的速度沿車(chē)道線(xiàn)方向行駛。然而在真實(shí)場(chǎng)景中,場(chǎng)景環(huán)境的數(shù)據(jù)并不能被提前告知,自動(dòng)駕駛汽車(chē)往往還無(wú)法根據(jù)周?chē)h(huán)境中其他車(chē)輛和人的動(dòng)作或運(yùn)行軌跡,進(jìn)行自動(dòng)調(diào)整。
斯坦福大學(xué)的研究人員最近創(chuàng)建了一個(gè)名為 LUCIDGames 新項(xiàng)目,這是一種可以預(yù)測(cè)和規(guī)劃自動(dòng)駕駛車(chē)輛自適應(yīng)軌跡的計(jì)算技術(shù),它集成了一種基于博弈論的算法和一種估計(jì)方法,能夠預(yù)測(cè)周?chē)氖挛铮ù恚┰谖磥?lái)會(huì)做什么,并在他們周?chē)踩刈鰶Q策,即使在復(fù)雜的場(chǎng)景中也能應(yīng)對(duì)自如。
LUCIDGames 通過(guò)在遞歸參數(shù)估計(jì)框架中建模來(lái)解決最優(yōu)逆控制問(wèn)題。它使用卡爾曼濾波器(UKF)迭代更新其他代理的成本函數(shù)的貝葉斯估計(jì),隨著從其他代理商觀察到的軌跡收集到更多數(shù)據(jù),在線(xiàn)上改進(jìn)了該估計(jì)。然后,計(jì)劃車(chē)輛通過(guò)規(guī)劃受不確定性橢圓約束的機(jī)器人軌跡,來(lái)考慮其他代理車(chē)輛的貝葉斯參數(shù)估計(jì)中的不確定性。該算法假定機(jī)器人與環(huán)境中的其他主體之間沒(méi)有明確的通信或協(xié)調(diào)。
LUCIDGames的MPC實(shí)現(xiàn)以40 Hz的更新頻率演示了復(fù)雜自動(dòng)駕駛場(chǎng)景下的實(shí)時(shí)性能。實(shí)驗(yàn)結(jié)果表明,LUCIDGames相對(duì)于現(xiàn)有的游戲理論和傳統(tǒng)MPC規(guī)劃方法,可以提高機(jī)器人的性能。
這個(gè)系統(tǒng)是由一個(gè)“估計(jì)器”(一種確定駕駛員目標(biāo)的技術(shù))和一個(gè)“決策者”(一種決定自動(dòng)駕駛車(chē)輛轉(zhuǎn)向角和加速度的算法)組成。決策者根據(jù)估算器收集的信息確定最適合車(chē)輛的軌跡。首先對(duì)軌跡進(jìn)行預(yù)測(cè),然后將其與現(xiàn)實(shí)情況進(jìn)行比較。
經(jīng)過(guò)最初的訓(xùn)練后,它將對(duì)其他車(chē)輛代理的軌跡的新猜測(cè)進(jìn)行采樣,使其接近保留的猜測(cè)并評(píng)估其預(yù)測(cè)性能。每次重復(fù)此過(guò)程以完善其猜測(cè),最后得出有關(guān)其他周?chē)蛩厝绾我苿?dòng)的最終預(yù)測(cè)。
通過(guò)這種技術(shù),自動(dòng)駕駛汽車(chē)還可以知道何時(shí)可以對(duì)自己的猜測(cè)充滿(mǎn)信心,以及何時(shí)信心較低。在這種不確定的情況下,它將采取更加謹(jǐn)慎的措施,并與其他車(chē)輛保持更大的安全距離。
將來(lái),LUCIDGames有望增強(qiáng)自動(dòng)駕駛汽車(chē)的安全性和可靠性。他們可以通過(guò)預(yù)測(cè)周?chē)h(huán)境中車(chē)輛的移動(dòng)和動(dòng)作來(lái)以自適應(yīng)方式移動(dòng)。到目前為止,該團(tuán)隊(duì)僅在仿真中評(píng)估了該技術(shù)?,F(xiàn)在,他們還計(jì)劃在真正的自動(dòng)駕駛汽車(chē)上進(jìn)行測(cè)試。