【學術論壇】k8凯发国际與人工智能學院成功舉辦第四十六期研究生學術論壇 -武漢紡織大學-k8凯发国际與人工智能學院

k8凯发国际

【學術論壇】k8凯发国际與人工智能學院成功舉辦第四十六期研究生學術論壇

來源: 作者:宣傳部編輯人:羅園發稿時間:2024-09-13瀏覽次數:

2024年9月12日下午16點,k8凯发国际與人工智能學院第四十六期研究生學術論壇在崇真樓南樓A4030成功舉辦。本次論壇由2022級研究生沙華鈴、王子澳、彭德朗,2023級研究生官文俊、胡鑫主講,學院研究生會主辦,學院程君老師出席了該論壇。

沙華鈴同學分享的主題為「Multiscale Feature Extraction and Attention Mechanism Generative Adversarial Network for Super-Resolution and Deblurring of Fundus Images」。眼底圖像超解像度是一個具有挑戰性的問題。目前存在的幾類模擬眼底圖像低質量成因的退化模型並不能很好地模擬現實中的複雜退化情況。為了解決這些問題,他們設計出一個新的退化模型用來模擬在複雜成像環境中的圖像的低質量成因。然後,他們研究提出了一種眼底圖像增強與超解像度的方法,通過一個新穎的生成器來恢複眼底圖像中的細節,對圖像進行2倍或4倍的超解像度並還原圖像中未知因素造成的干擾。

ADF045E668715B5E00C426CCA000C836

王子澳同學分享的主題為「基於多模態學習的點雲分類網絡」。針對由於點雲數據的無序性、稀疏性和複雜性導致傳統三維點雲分類網絡參數量龐大,訓練效率低下的問題,他們提出了一種基於多模態學習的點雲分類網絡模型MPC-CLIP。將原始點雲數據投影成二維深度圖;然後利用二維CLIP中訓練好的文本和圖像編碼器分別提取點雲特徵,將每個文本和圖像特徵進行加權求和並計算餘弦相似度,進而得到零樣本分類結果。使用經典點雲數據集ModelNet40進行零樣本分類與消融實驗,並且將MPC-CLIP與多個經典3D點雲分類模型進行融合。總體分類精確度提升了0.8%~1.7%,證明了MPC-CLIP 模型的有效性和魯棒性。。

CA6FFED6DA6436AB60F0BEEB92429A67

官文俊同學分享的主題為「How to build an EEG dataset and analyze it」。腦機接口是一種直接連接人腦與外部設備的技術,它使得思維可以直接控制機器或k8凯发国际系統,為殘疾人士、神經康復、虛擬現實、增強現實等領域提供了新的可能。他探討了如何利用腦機接口建立腦電數據集及其分析方法。介紹了腦電數據集的構建過程,包括實驗設計、數據採集、預處理和標註等關鍵步驟。詳細闡述了腦電數據分析的技術路線,包括信號處理、特徵提取、分類識別等環節,強調了在建立和分析腦電數據集過程中應注意的問題,如數據質量、個體差異和倫理規範。簡單介紹了幾種算法在他們建立的數據集上的作用。。

0474A4E21398930C6D7B1C834F30FE25

胡鑫同學分享的主題為「Exploring multispectral reconstruction based on camera response prediction」。基於數碼相機的光譜重建技術已成為獲取高空間解像度光譜圖像的關鍵方法之一。儘管當前的研究在可控條件的實驗室環境中已經取得較高精度,但在開放環境下應用時,光源的變化、光照不均勻性以及成像參數的變化,均導致成像條件的不穩定,使得專為特定成像條件設計的光譜重建模型難以適應多變的成像環境。為此,他們研究提出基於相機raw響應值預測的多光譜重建新方法,以數碼相機成像模型為基礎,通過預測訓練樣本集在任意成像條件下的raw響應值,對相機進行光譜特性化建模,然後對相應成像條件下的對象進行光譜重建。研究測試了不同曝光時間和ISO組合下ColorChecker色卡的raw響應值預測結果,並利用ColorChecker SG色卡對ColorChecker 24色色卡進行了光譜重建測試。實驗結果表明,在不同成像條件下,利用預測響應值對真實拍照響應值的光譜重建的平均均方根誤差RMSE(%)為4.19,平均CIEDE2000色差為5.61,為開放場景下的多光譜重建提供了一種可行的參考方案。

05719D79F08055B62843C9DDDF0A2030

彭德朗同學分享的主題為「DS-Seq: Deriving smooth 3D human motion sequences from video time cues」。將基於單幀圖像的人體三維姿態與形狀重建方法應用於視頻時,由於單幀重建精度不夠以及當前幀、過去幀、未來幀信息利用不均衡,無法恢復高精度、平滑的三維人體運動,導致生成的人體運動出現不規則的抖動。針對這一問題,他們研究提出了一種網格恢復系統(DS-Seq),通過利用更高精度的二維特徵檢測框架,並利用基於時間特徵的運動約束框架平等吸收過去幀和未來幀的信息,他們研究的DS-Seq可以重建平滑的三維人體運動。此外, DS-Seq實現的每幀三維姿態與形狀的精度比目前最先進的方法TCMR高出10%以上。

4A9387AF545C06E2606337106068310F