據(jù)外媒報道,為了自動從科學(xué)論文中獲取重要數(shù)據(jù),美國國家標(biāo)準(zhǔn)與技術(shù)研究所(NIST)的計算機(jī)科學(xué)家研發(fā)了一種方法,可以精確地檢測圖像數(shù)據(jù)中密集、低質(zhì)量的小幾何物體,如三角形。NIST的該款模型采用神經(jīng)網(wǎng)絡(luò)法來探測模式,也可用于現(xiàn)代生活的多種應(yīng)用中。
(圖片來源:NIST)
NIST的神經(jīng)網(wǎng)絡(luò)模型可在一組確定的測試圖像中捕獲97%的目標(biāo)物體,將物體的中心定位于人工選擇的幾個像素內(nèi)。
NIST計算機(jī)科學(xué)家Adele Peskin解釋表示:“該項目的目的是恢復(fù)期刊文章中丟失的數(shù)據(jù)。但是對小型、密集型物體進(jìn)行探測的研究還有很多其他應(yīng)用。目前,圖像分析、自動駕駛汽車、機(jī)器檢查等領(lǐng)域都會利用物體探測技術(shù),因為此種小型、密集型物體特別難以定位和分隔開。”
研究人員從20世紀(jì)初期的期刊文章中獲取數(shù)據(jù),通常結(jié)果會僅以圖形形式呈現(xiàn),而且有些是手工繪制的,掃描或復(fù)印會讓圖形分辨率變差。研究人員希望提取數(shù)據(jù)點(diǎn)的位置,以恢復(fù)原始數(shù)據(jù),以便進(jìn)行進(jìn)一步分析。到目前為止,此類數(shù)據(jù)都是人工提取的。
NIST研究人員采用了最初由德國研究人員研發(fā),用于分析生物醫(yī)學(xué)圖像的網(wǎng)絡(luò)架構(gòu)U-Net,首先將圖像的尺寸壓縮,減少空間信息,然后添加特征和上下文信息層,以獲取精確、高分辨率的結(jié)果。
該網(wǎng)絡(luò)的最佳性能可讓其定位目標(biāo)中心的準(zhǔn)確率達(dá)97%,使研究人員足以利用神經(jīng)網(wǎng)絡(luò)從更新版的期刊論文中恢復(fù)數(shù)據(jù)。
雖然目前NIST的研究人員沒有計劃進(jìn)行后續(xù)研究,但是表示,該神經(jīng)網(wǎng)絡(luò)絕對可以用于解決其他圖像分析問題。