近日,太阳集团1088vip數學系、廣東省數量金融大數據工程技術研究中心林義尊/王偉文/賴兆榮課題組撰寫的兩篇論文“Autonomous Sparse Mean-CVaR Portfolio Optimization”(論文一)和“Invariant Risk Minimization Is A Total Variation Model” (論文二)被機器學習領域的CCF A類國際頂級會議ICML2024錄用。兩篇論文均以太阳集团app首页為唯一單位。論文一:數學系教師林義尊為第一作者、暨伯學院2023屆本科畢業生張陽煜為第二作者、數學系教師賴兆榮為通訊作者兼第三作者、數學系2023級博士研究生李程為第四作者。論文二:賴兆榮為第一作者、數學系教師王偉文為通訊作者兼第二作者。
ICML的英文全稱是International Conference on Machine Learning,中文官方名稱為國際機器學習會議。它是機器學習領域兩大國際頂級會議之一、中國計算機學會(CCF)推薦的A類會議之一,對論文的質量要求非常高。本屆會議共收到9473篇投稿(不包括即時拒稿的論文),其中2609篇被錄用,錄用率約為27.5%。第41屆ICML會議将于2024年7月21日至7月27日在奧地利維也納舉行。
論文一:
L0約束均值-條件在險價值模型是一種被廣泛運用的既能精确控制選入資産數目、又能平衡收益與下行風險的資産組合優化模型。然而它的求解卻是一個NP難問題,目前主流的求解方法往往采用計算成本高昂的組合策略。為了解決這一難題,本文提出了一種創新的自主稀疏均值-條件在險價值模型,它能夠以任意所需的精度逼近原始的L0約束均值-條件在險價值模型。本文的方法核心在于将L0稀疏約束轉化為指示函數(Indicator Function),并借助精心設計的尾部逼近函數(Tailed Approximation Function)來逼近這一指示函數。這一轉變的巧妙之處在于,它将原本難以處理的單變量三項非凸優化模型轉化為了更易于處理的雙變量三項優化模型。進一步地,本文利用交替求解的策略,分别針對兩個變量對應的雙項非凸優化模型進行疊代求解,從而得到逼近模型的解。為了實現這一過程,本文開發了一個具有理論收斂性保證的近端交替線性化最小化算法(Proximal Alternating Linearized Minimization Algorithm)對自主稀疏均值-條件在險價值模型進行疊代求解。特别地,自主稀疏特性确保了在調整資産池大小時,大部分資産能夠保持在所選資産池中,這與本文方法的初衷高度契合。總的來說,本文的方法不僅以理論上的保證對L0約束均值-條件在險價值模型進行了有效的逼近求解,還顯著提高了計算效率,為資産配置問題提供了一個穩健且高效的解決方案。
圖一、L0約束的尾部逼近函數示意圖(資産數量N取10,稀疏度m取5):當資産組合策略w的L0範數大于m時,若γ趨于0,則尾部項(Tail)趨于正無窮,從而逼近原指示函數的取值。
論文二:
不變風險最小化準則是通用機器學習領域中的一種重要的分布外泛化手段。盡管關于該準則的很多不同設定以及不同應用場景被提出來,它的數學本質依然缺乏合理的解釋。本文證明了在較為溫和的條件下,該準則本質上是一個全變差-L2模型。在此基礎上,本文提出一種基于全變差-L1模型的新的不變風險最小化框架。它不僅擴大了可被用作學習風險的函數類,還可利用餘面積公式來保持不變特征,從而提高學習器對幹擾特征的穩健性。文中還給出并證明了使得該框架實現分布外泛化的必要條件。在幾種基準機器學習場景中的實驗結果表明該框架取得了有競争力的表現。
圖二、不同方法所訓練出來的特征權重占比。左邊為基于全變差-L2模型的不變風險最小化方法,右邊為基于全變差-L1模型的不變風險最小化方法。w1~w5對應不變特征,w6~w15對應幹擾特征。可以看出右邊的方法比左邊的方法保持了更大占比的不變特征權重。
上述兩篇論文成果依托于我校的廣東省數量金融大數據工程技術研究中心,得到了國家自然科學基金面上項目(62176103)、廣東省基礎與應用基礎研究基金項目(2021A1515110541)、廣州市科技計劃項目(2024A04J9896,2024A04J3940,2024A04J4225)、中央高校基本科研業務費(21623341)、廣東省數量金融大數據工程技術研究中心運行費等項目的資助。文章的發表也表明我校和該工程中心的科研水平和青年教師的培養在高水平大學建設戰略下得到顯著提升。