【學術論壇】k8凯发国际與人工智能學院成功舉辦第五十四期研究生學術論壇-武漢紡織大學-k8凯发国际與人工智能學院

k8凯发国际

【學術論壇】k8凯发国际與人工智能學院成功舉辦第五十四期研究生學術論壇

來源: k8凯发国际與人工智能學院 作者:姬翠澤編輯人:羅園發稿時間:2025-02-28瀏覽次數:

2025年2月26日下午14點,k8凯发国际與人工智能學院第五十四期研究生學術論壇在崇真樓南樓A4030成功舉辦,本次論壇由2023級研究生蘇壯壯、楊學周、吳楓,2022級研究生何如一、鄧雲龍主講,學院研究生會主辦,學院楊華利老師出席了該論壇。

蘇壯壯同學分享的主題是「Research on Ethnic Garment Detection Algorithm Based on lmproved YOLOv8」,主要圍繞少數民族服飾識別展開。如今,少數民族服飾在現代化進程中面臨逐漸消失的風險,如何藉助科技手段實現高效、準確識別成為關鍵問題。基於這一現狀,他提出基於改進 YOLOv8 模型的方法。他先是收集各民族服飾相關資料,製作新的目標檢測數據集,同時引入 CSPPC 結構和 MSDA 機制優化模型,實現了模型的輕量化和檢測精度的提升。實驗結果表明,改進後的 YOLOv8 模型在準確率、召回率和 F1 值上均優於基準 YOLOv8 模型,在參數量和精確率上也超過 YOLOv11 模型,能有效進行少數民族服飾圖像分類,為民族服飾的信息化處理和文化傳承保護提供有力支持。

楊學周同學分享的主題為「TSA-Net: A Spatio-Temporal Feature Enhanced Algorithm for Power Risk Behavior Recognition」,聚焦於電力作業現場的行為識別。電力作業現場環境高危,精準識別作業人員行為至關重要。針對目前存在的時空特徵融合不足、時空信息提取不足和全局特徵建模不足等問題,他提出基於時空特徵增強的電力風險行為識別算法,分別構建自適應時空特徵融合模塊、空間定位映射模塊和特徵優化預測頭。基於真實電力作業視頻構建的數據集實驗顯示,TSA-Net 在識別 11 類典型行為時,平均準確度和 Top1 Precision 分別達到 62.1% 和 92.5%,與現有算法相比,他的方法在精度和魯棒性上優勢顯著。

何如一同學分享的主題是 「Improving Adversarially Robust Sequential Recommendation through Generalizable Perturbations」,重點研究序列推薦模型的防禦算法。現有的序列推薦模型易受各種攻擊影響,且現有的對抗性防禦算法存在誤差傳播、泛化性難保持和噪聲特徵等問題。他針對這些問題,提出創新的防禦算法。該算法利用基於多層感知機的擾動生成模塊創建對抗性樣本,無需梯度估計;將生成模塊與編碼器映射模塊結合,使模型更好應對數據微小變動;還把級聯信息過濾融合擴散模型連接至信息瓶頸層,逐步去除非魯棒性項目和特徵,並提升模型泛化能力和魯棒性。

吳楓同學分享的主題為 「SSL-MlAD: A Self-Supervised Learning Network for Multimodal Industrial Anomaly Detection」,主要探討工業異常檢測問題。當前,基於 RGB 圖像和 3D 點雲的多模態異常檢測方法存在預訓練模型依賴、龐大內存記憶庫導致資源消耗和推理時間增加等問題。他提出一種自監督學習的多模態重建框架,該框架包含分層的 2D - 3D 嵌入模塊、聯合編碼器和帶有模態共享與特定組件的解碼器,用於 RGB 圖像和 3D 點雲的重建與特徵提取。實驗表明,他們的方法在 MVTec3D - AD 和 Eyescandies 數據集上優於以往最先進方法,並且能夠顯著降低計算資源消耗,提升實時性能。

鄧雲龍同學分享的主題是 「Scalable watermarking for identifying large language model outputs」,他介紹了一種新的水印方法。SynthID - Text 是一種可用於生產的水印方法,適用於大型語言模型(LLM)生成的文本。該方法在生成過程中微妙改變文本,能在不影響文本質量和LLM 性能的情況下高效檢測合成內容。與其他方法不同,SynthID - Text 檢測時無需訪問原始 LLM,還能與推測性採樣等現有生產技術無縫集成,支持大規模部署。經過廣泛測試,包括近 2000 萬條 Gemini 響應的實時實驗,證實了上述方法的有效性以及對質量的最低影響,這項技術旨在通過識別合成文本並減輕潛在誤用,促進負責任的LLM使用。