據(jù)外媒報(bào)道,來(lái)自拉德堡德大學(xué)(Radboud University)、奧斯丁大學(xué)(University of Austin)、加州大學(xué)伯克利分校(University of California, Berkeley)和埃因霍溫科技大學(xué)(Eindhoven University of Technology)的研究人員找到了一種應(yīng)對(duì)不確定性的新方法,可以幫助AI(如自動(dòng)駕駛汽車(chē))更快找到更安全的決策選項(xiàng)。
(圖片來(lái)源:https://techxplore.com)
研究人員將此種方法稱(chēng)作“不確定部分可觀察馬爾可夫決策過(guò)程”(uncertain partially observable Markov decision processes ,或uPOMDPs)。這些是真實(shí)世界模型,用于估算事件發(fā)生的概率。例如,自動(dòng)駕駛汽車(chē)在駕駛時(shí)會(huì)面臨許多未知的情況,為了驗(yàn)證自動(dòng)駕駛汽車(chē)的AI,需要進(jìn)行大量的計(jì)算,以分析AI如何應(yīng)對(duì)各種情況。研究人員認(rèn)為,利用他們的新方法,這些建模練習(xí)可以變得更加接近現(xiàn)實(shí),從而使AI更快地做出更好、更安全的決策。
此前,POMDPs已用于模擬和建模多種情形,可以幫助預(yù)測(cè)流行病傳播,以及計(jì)算航空和宇宙飛船如何避碰等。研究人員Nils Jansen表示,“我們知道,這些模型非常擅長(zhǎng)提供真實(shí)世界的真實(shí)捕捉。然而,由于使用它們需要極高的處理能力,因此在實(shí)際應(yīng)用中的應(yīng)用仍然有限。而我們的新方法能使我們考慮所有計(jì)算和理論信息,并能在現(xiàn)實(shí)世界中更加一致、定期地運(yùn)用。”
研究人員通過(guò)四個(gè)步驟來(lái)提供有效的解決方案。首先,將問(wèn)題描述為具有無(wú)窮多個(gè)約束的非凸優(yōu)化問(wèn)題。其次,通過(guò)專(zhuān)用對(duì)偶方案生成仍是非凸的,但具有有限多個(gè)約束的對(duì)偶問(wèn)題。然后,將這一對(duì)偶問(wèn)題線性化。最后,求解這一有限線性規(guī)劃,從而得到原有問(wèn)題的局部最優(yōu)解。與現(xiàn)有方法相比,這一求解問(wèn)題公式遠(yuǎn)遠(yuǎn)小于現(xiàn)有方法生成的公式。此外,研究人員還通過(guò)飛行器避碰場(chǎng)景和新型航天器運(yùn)動(dòng)規(guī)劃案例研究,來(lái)驗(yàn)證該算法的適用性。
研究團(tuán)隊(duì)的突破之處在于其模型考慮了現(xiàn)實(shí)世界的不確定性。Jansen表示,“例如,目前的模型可能只會(huì)告訴你,自動(dòng)駕駛汽車(chē)有80%的可能性是完全安全的,但還不清楚剩下的20%可能會(huì)發(fā)生什么,以及風(fēng)險(xiǎn)類(lèi)型。這可能是一種不清晰、模糊的風(fēng)險(xiǎn),而有了這種新方法,系統(tǒng)就可以對(duì)可能出現(xiàn)的問(wèn)題給出更詳細(xì)的解釋?zhuān)⒃谟?jì)算時(shí)考慮這些因素。對(duì)用戶而言,這意味著能知道更多可能出錯(cuò)的具體例子,并做出更好、更充分的調(diào)整,從而避免這些風(fēng)險(xiǎn)?!?/p>
雖然此前也有其他研究人員考慮過(guò)uPOMPDPs所采用的方法,但僅限于特定的有限情形和思維實(shí)驗(yàn)。Jansen解釋稱(chēng),“這是我們首次將先前的理論思維實(shí)驗(yàn)轉(zhuǎn)化為實(shí)際可行的方法。這是一個(gè)獨(dú)特、困難的問(wèn)題,但得益于跨學(xué)科方法,我們才能夠取得真正的突破?!?/p>