主 題:大數(shù)據(jù)時代的視覺智能及自然基金申報指導(dǎo)
內(nèi)容簡介:圍繞視頻數(shù)據(jù)的爆炸性增長和計算能力的不斷提升,深度卷積神經(jīng)網(wǎng)絡(luò)推動了目標檢測與跟蹤、目標檢索和場景文字識別等技術(shù)的快速發(fā)展。我們深入分析當(dāng)前流行的目標檢測和識別的方法存在的問題,結(jié)合傳統(tǒng)的目標檢測與深度學(xué)習(xí)介紹了一種高效的協(xié)學(xué)習(xí)方法,在多個數(shù)據(jù)庫取得最好結(jié)果并且在高清視頻中能夠?qū)崟r處理;針對海量視頻中的目標檢索和挖掘問題,提出了跨模態(tài)四元組度量學(xué)習(xí)方法,可充分融合多類別和多部件等信息,形成了端對端深度多模態(tài)排序?qū)W習(xí)框架,顯著提高了檢索的性能。針對低功耗移動平臺,實現(xiàn)了面向場景文字識別輕型長短期卷積識別小網(wǎng)絡(luò),能夠?qū)崿F(xiàn)手機拍照的多種場景下的高精度身份證、快遞和發(fā)票識別。融合的研究組取得的最新的應(yīng)用成果在平安城市、智能交通、視頻偵查和移動互聯(lián)網(wǎng)等多種實際場景中的得到了產(chǎn)業(yè)化應(yīng)用。
報告人:王金橋 研究員
智能媒體計算聯(lián)合實驗主任
視頻大數(shù)據(jù)云識別聯(lián)合實驗主任
時 間:2017-02-12 15:00
地 點:致明樓516
舉辦單位:工學(xué)院 科研部