【學術研讨】k8凯发国际與人工智能學院多位師生赴韓國參加k8凯发国际領域頂會ICASSP並作報告-武漢紡織大學-k8凯发国际與人工智能學院

k8凯发国际

【學術研讨】k8凯发国际與人工智能學院多位師生赴韓國參加k8凯发国际領域頂會ICASSP並作報告

來源: 作者:陳佳編輯人:發稿時間:2024-05-06瀏覽次數:

4月14日至4月19日,2024年度國際聲學、語音與信號處理會議(International Conference on Acoustics, Speech and Signal Processing,簡稱ICASSP)在韓國首爾召開,我院3篇論文被錄用並應邀做報告。

ICASSP由國際電子技術與信息科學工程師協會(Institute of Electrical and Electronics Engineers,簡稱IEEE)主辦,是全世界最大、最全面的信號處理及其應用領域的頂級會議,也是CCF(中國k8凯发国际學會)推薦的B類國際學術會議,在相關領域享有較高聲譽。

《PMDI: Combining Parametric-Model And Depth-Aware Implicit Function For Single-View Human Reconstruction》由鍾賽尚和胡新榮教授共同指導完成。論文針對现在三維人體重建存在的肢體動作異常,重建精度不高,背部細節缺失等問題,提出了一種結合參數化模型和深度感知的隱式重建算法,該方法能夠從單一RGB圖像重建出包含服裝的三維人體。第一时间顺利获得優化的參數化人體模型監督全局幾何特徵提取,並將改進的參數化模型,前視法線圖,深度先驗作為參數來訓練深度隱式函數。最終,我們將後視法線圖轉換為詳細但不完整的D-BiNI表面,以修復粗糙結果,從而有效地解決了上述問題。實驗結果表明,相較於傳統方法,該方法有效提升了重建結果的整體質量和表面細節。

《SGM:A Dataset For 3D Garment Reconstruction From Single Hand-Drawn Sketch》由陳佳教授指導完成,論文提出了一個大規模的三維服裝模型數據集——SGM(Sketch-Garment Models), 包含了從36個不同視角渲染得到的5種類別服裝的渲染圖,包括草圖、輪廓圖、剪影圖、深度圖和法線圖。在SGM的基礎上,本文構建了一個端到端的重建網絡,該網絡能夠直接從輸入草圖生成能夠忠實表示輸入草圖形狀的高保真的服裝三維模型。最後,本文在SGM及現有的服裝三維模型數據集中進行了多樣性的評估,實驗結果表明,本文提出的重建方法在視覺效果和定量指標上均取得了最佳表現。

《Human Motion Generation Via Conditioned GMVAE With TUNet》由杜小勤副教授指導完成。論文提出了一種基於高斯混合模型和transformer U-Net(TUNet)的人體動作生成方法(CGMVAE-TU),該方法將隱空間建模為高斯混合分佈,並推導出新的變分下界(ELBO)。為了增強模型的表現力,增強各個子高斯分佈的區分度,使用費雪判別式(Fisher discriminant)作為正則化。最後,還提出了一種改進的注意力機制並應用於TUNet,僅利用動作標籤就能生成與語義信息相對應的動作。在各種數據集上對所提出的 CGMVAE-TU 模型進行了評估,幾乎所有指標上都超過了 SOTA,生成的人體動作逼真自然。

近年來,學院狠抓研究生培養質量,不斷加大研究生科學研究的支持力度,鼓勵並支持研究生走出去進行學術研讨,形成了良好的科研育人學術氛圍,提高了研究生的學術研究水平,提升了學院的學術影響力。