人類天生就能夠根據(jù)周圍環(huán)境中其他人的行為來調(diào)整自己的行為。例如,由于人類駕駛員能感知在特定場(chǎng)景中哪些操作是危險(xiǎn)的,因此會(huì)根據(jù)其他駕駛員、行人或騎行者的動(dòng)作,選擇停車、減速、轉(zhuǎn)向或啟動(dòng)車輛。然而,目前,開發(fā)具備此種能力的自動(dòng)駕駛車輛面臨巨大的挑戰(zhàn)。
(圖片來源:https://techxplore.com)
據(jù)外媒報(bào)道,斯坦福大學(xué)(Stanford University)和豐田研究院(Toyota Research Institute)的研究人員開發(fā)了一個(gè)框架,可以防止此類事故的發(fā)生,從而提高自動(dòng)駕駛汽車和其他機(jī)器人系統(tǒng)在擁擠環(huán)境中運(yùn)行的安全性。該框架結(jié)合了兩種工具,一種機(jī)器學(xué)習(xí)算法,以及一種風(fēng)險(xiǎn)敏感控制的技術(shù)。
研究人員Haruki Nishimura和Boris Ivanovic表示,“我們的主要目的是通過預(yù)測(cè)人類駕駛員、行人和騎行者等道路使用者的意圖,使自動(dòng)駕駛汽車和其他機(jī)器能夠安全運(yùn)行?!盢ishimura, Ivanovic及其同事開發(fā)了一種機(jī)器學(xué)習(xí)模型,并訓(xùn)練其在機(jī)器人所處的環(huán)境中預(yù)測(cè)人類未來的行為。利用該模型,他們創(chuàng)建了一種算法,可以估算既定時(shí)間內(nèi)機(jī)器人每一次潛在行為所帶來的碰撞風(fēng)險(xiǎn)。該算法可以自動(dòng)為機(jī)器人選擇最優(yōu)行為,使其與他人或車輛相撞的風(fēng)險(xiǎn)降到最低,同時(shí)使機(jī)器人繼續(xù)前行。
研究人員還表示,“現(xiàn)有的導(dǎo)航方法通常存在兩個(gè)重要的過度簡化問題。首先,這些方法僅對(duì)人類未來的行為做出了簡單的假設(shè);其次,沒有考慮平衡碰撞風(fēng)險(xiǎn)和機(jī)器人的前行行為。而我們的方法使用豐富的、隨機(jī)的人體運(yùn)動(dòng)模型,該模型是從真實(shí)的人體運(yùn)動(dòng)數(shù)據(jù)中學(xué)來的?!?/p>
該框架所基于的隨機(jī)模型并不提供對(duì)未來人類行為的單一預(yù)測(cè),而是預(yù)測(cè)的分布。此外,該團(tuán)隊(duì)使用該模型的方式與此前開發(fā)的集成隨機(jī)模型的機(jī)器人導(dǎo)航技術(shù)的方式顯著不同。
Nishimura和Ivanovic explained解釋道,“我們考慮了未來人類移動(dòng)可能性的全部分布情況。然后,再選擇機(jī)器人的下一個(gè)動(dòng)作,以實(shí)現(xiàn)低碰撞風(fēng)險(xiǎn),同時(shí)仍然使機(jī)器人朝著目標(biāo)方向前行。這一過程稱作風(fēng)險(xiǎn)敏感最優(yōu)控制,本質(zhì)上允許實(shí)時(shí)確定機(jī)器人的下一步行動(dòng)。其所需的計(jì)算僅在幾分之一秒內(nèi)就能完成,并在機(jī)器人移動(dòng)時(shí)不斷重復(fù)?!?/p>
為了評(píng)估該框架,研究人員進(jìn)行了模擬研究和真實(shí)世界實(shí)驗(yàn)。在模擬研究中,他們比較了該框架與三種常用避碰算法在執(zhí)行一項(xiàng)任務(wù)時(shí)的性能。在這項(xiàng)任務(wù)中,機(jī)器人必須確定最佳行為,以在包含多達(dá)50名移動(dòng)人員的環(huán)境中安全航行。此外,在真實(shí)世界實(shí)驗(yàn)中,研究人員使用該框架指導(dǎo)機(jī)器人,在具有5名移動(dòng)人員的室內(nèi)環(huán)境中移動(dòng)。兩項(xiàng)測(cè)試結(jié)果均顯示,該框架計(jì)算出了最佳軌跡,將機(jī)器人與周圍人類碰撞的風(fēng)險(xiǎn)降至最低。而且,其性能也優(yōu)于與其他避碰算法。
研究人員表示,“我們的首要目標(biāo)是讓自動(dòng)駕駛汽車和其他機(jī)器人對(duì)人類更安全,為了確保機(jī)器人在人類周圍安全運(yùn)行,我們需要教會(huì)它們根據(jù)經(jīng)驗(yàn)預(yù)測(cè)人類的行為,并賦予其對(duì)風(fēng)險(xiǎn)的感知能力,從而避免做出可能導(dǎo)致碰撞的危險(xiǎn)行為?!?/p>
未來,此種導(dǎo)航框架有望使機(jī)器人和自動(dòng)駕駛汽車預(yù)測(cè)周圍人類或車輛的行為,并迅速做出反應(yīng),以防止碰撞,從而提高安全性。然而,在大規(guī)模部署之前,該框架還需要在大型數(shù)據(jù)庫中進(jìn)行訓(xùn)練,這些數(shù)據(jù)庫包含人類在擁擠環(huán)境中移動(dòng)的視頻,類似于機(jī)器所處的擁擠環(huán)境。為了簡化訓(xùn)練過程,研究人員計(jì)劃開發(fā)方法,讓機(jī)器人在運(yùn)行時(shí)在線收集訓(xùn)練數(shù)據(jù)。
Nishimura與Ivanovic表示,“我們還希望使機(jī)器人能判斷其所處環(huán)境中人類的特定行為。例如,在任何給定時(shí)刻對(duì)行為古怪的駕駛員或醉酒駕駛員進(jìn)行分類,并避免離此類駕駛員過近,從而減少碰撞風(fēng)險(xiǎn)。人類駕駛員能很自然地做到這一點(diǎn),但要將其編寫成機(jī)器人可以使用的算法非常困難?!?/p>