2025年電子工程系學術講座(三)

發布時間: 2025-04-16 來源: 太阳集团1088vip

  題  目:基于大模型的多媒體質量評價與取證

  内容簡介:近年來,随着大型多模态預訓練模型的迅猛發展,計算機視覺(CV)任務的研究範式正在經曆深刻變革。這類模型具備強大的生成能力和跨模态理解能力,但同時也引發了對其感知可靠性、細粒度理解能力以及可用性的質疑。在真實世界應用場景中,尤其是質量評價與内容取證等任務,對模型的穩定性與解釋能力提出了更高要求。本次報告将圍繞“圖像質量評價”與“多媒體内容取證”兩個方向,介紹本團隊在大模型背景下的最新研究進展與思考。在圖像質量評價方面,我們首先評估了通用視覺大模型在感知質量判斷方面與人類主觀評價的一緻性,随後探索了如何融合主觀感知機制與視覺基礎模型,構建兼具泛化能力與感知一緻性的質量預測模型。在多媒體取證方面,我們系統性分析了通用視覺大模型在檢測與推理 AI 生成圖像方面的能力,并進一步提出面向AI合成内容的專家模型。通過構建百萬級規模的視覺指令數據集,我們賦予大模型識别 AI 生成圖像與分析僞造痕迹的能力,并在可解釋性與可擴展性兩個方面展開深入研究。面向未來,我們期待推動多模态大模型在真實世界視覺任務中的泛化、可解釋與可控性協同提升,進一步縮短基礎模型研究與實際應用之間的距離。

報告人:王詩淇

報告人簡介:王詩淇,香港城市大學副教授。從事視頻編碼與處理、人工智能、計算機視覺等方面的研究。在國内外期刊和會議上發表/接收論文300餘篇,其中包括IEEE 彙刊論文150餘篇。目前擔任人工智能、視頻處理領域旗艦期刊IEEE-TIP, TMM, TCyber和TCSVT 編委,并獲得IEEE ICME, VCIP, MultiMedia等多個國際會議和期刊的最佳論文獎。

  間:2025年4月21日(周上午1000-1200

  點:石牌校區南海樓338會議室

熱烈歡迎廣大師生參加!

太阳集团1088vip

2025年4月15