近日,第三十屆國(guó)際計(jì)算機(jī)視覺(jué)與模式識(shí)別會(huì)議(30th IEEE Conference on Computer Vision and Pattern Recognition, CVPR 2019)在美國(guó)加利福尼亞州長(zhǎng)灘召開(kāi)。本屆會(huì)議共收到5160 篇提交論文,其中1294篇論文最終被收錄,我校計(jì)算機(jī)學(xué)院媒體智能實(shí)驗(yàn)室俞俊教授團(tuán)隊(duì)的2篇論文被接收發(fā)表。
論文“Deep Modular Co-Attention Networks for Visual Question Answering”基于深度神經(jīng)網(wǎng)絡(luò)模型提出一種模塊化協(xié)同注意力機(jī)制,有效解決視覺(jué)問(wèn)答領(lǐng)域中的深度知識(shí)推理問(wèn)題。該論文第一作者為計(jì)算機(jī)學(xué)院副教授余宙。
論文“On Exploring Indeterminate Relationships for Visual Relationship Detection”提出一種自動(dòng)地關(guān)系生成模塊,將人工標(biāo)記的關(guān)系作為確定性關(guān)系,將人工未標(biāo)記的關(guān)系作為非確定性關(guān)系。通過(guò)深度神經(jīng)網(wǎng)絡(luò),在確定性關(guān)系的基礎(chǔ)上,以非確定性關(guān)系作為補(bǔ)充,有效地提高了視覺(jué)關(guān)系檢測(cè)的準(zhǔn)確率。該論文第一作者為計(jì)算機(jī)學(xué)院副研究員詹憶冰。
此外,由余宙、俞俊教授共同指導(dǎo),研究生崔宇豪、李敬為主力的算法團(tuán)隊(duì)還參加了CVPR2019舉辦的全球視覺(jué)問(wèn)答競(jìng)賽VQA Challenge 2019,與國(guó)內(nèi)外40多支參賽隊(duì)伍同場(chǎng)競(jìng)技,最終戰(zhàn)勝來(lái)自微軟、Facebook、卡耐基梅隆大學(xué)等國(guó)際頂尖研究團(tuán)隊(duì),獲得比賽冠軍,這也是截至目前國(guó)內(nèi)研究團(tuán)隊(duì)在該項(xiàng)競(jìng)賽中獲得過(guò)的最高榮譽(yù)。
CVPR 是計(jì)算機(jī)視覺(jué)及模式識(shí)別領(lǐng)域頂級(jí)國(guó)際學(xué)術(shù)會(huì)議,中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)人工智能方向的A類會(huì)議。CVPR于1983年首次舉行,涵蓋計(jì)算機(jī)視覺(jué)、人工智能和機(jī)器學(xué)習(xí)等領(lǐng)域,在學(xué)術(shù)界和工業(yè)界都具有極為重大的影響力。(科技處 計(jì)算機(jī)學(xué)院)