報 告 內(nèi) 容 簡 介 |
報告內(nèi)容簡介: 近年來跨模態(tài)圖像生成在圖像生成,、圖像編輯等任務(wù)中取得了廣泛應(yīng)用,。盡管現(xiàn)有研究在生成圖像的質(zhì)量方面取得了一定的進(jìn)步,但生成圖片的速度較慢,,且對硬件需求較高。這主要?dú)w因于當(dāng)前預(yù)訓(xùn)練生成模型具有龐大的參數(shù)規(guī)模,,生成過程高度復(fù)雜,每個生成步驟都需要進(jìn)行大量計算,,從而導(dǎo)致整個生成過程耗時相當(dāng)長。這一缺陷使得模型訓(xùn)練成本極高,,同時也提高了用戶的硬件和時間成本。本報告將首先介紹近期跨模態(tài)圖像生成任務(wù)的研究進(jìn)展,,從提高預(yù)訓(xùn)練GAN模型生成質(zhì)量且保證生成速度的角度出發(fā),介紹團(tuán)隊在文本生成圖像任務(wù)的研究思路和研究成果,,最后探討如何使用大規(guī)模預(yù)訓(xùn)練多模態(tài)模型優(yōu)化文本到圖像生成任務(wù)。 報告人簡介: 鮑秉坤,南京郵電大學(xué)計算機(jī)學(xué)院,、軟件學(xué)院、網(wǎng)絡(luò)空間安全學(xué)院副院長(主持工作),,教授、博士生導(dǎo)師,。國家杰出青年基金獲得者、江蘇省杰青,、江蘇省雙創(chuàng)人才。研究方向?yàn)槎嗝襟w計算,、社交多媒體、計算機(jī)視覺,、人工智能等,。先后主持多項(xiàng)國家和省部級項(xiàng)目,包括國家重點(diǎn)研發(fā)計劃:科技創(chuàng)新2030-人工智能重大專項(xiàng),、國家自然科學(xué)基金重點(diǎn)項(xiàng)目,、國防科技173計劃技術(shù)領(lǐng)域基金項(xiàng)目、江蘇省重點(diǎn)研發(fā)計劃等,。榮獲2018年度電子學(xué)會科學(xué)技術(shù)(自然科學(xué)類)一等獎。榮獲多媒體領(lǐng)域的ACM匯刊TOMM 2016年度最佳論文獎,、IEEE MM 2017年度最佳論文獎、Multimedia Modeling 2019年度最佳論文Runner Up獎,。榮獲ICME 2020 Outstanding Areas Chair,。 |