3月27日,我院雙周學術論壇在德經樓Z1-307舉行。本次學術論壇的主題為“Variational Inference for
Multiple Correlated Outcomes in Large Scale Genomics Data”,我院史興傑博士進行了報告。論壇由陳耀輝教授主持,該研究方向的全體教師及部分研究生參加了本次學術活動。
史興傑博士彙報了他最新的論文《多響應變量的變分推斷方法及其在大規模GWAS中的應用》。在簡單介紹大規模的GWAS數據結構後,他指出該工作的出發點是考慮大規模多元響應變量線性模型的變量選擇問題。史興傑博士與合作者基于變分推斷(Variational Inference)提出了一個新的貝葉斯變量選擇方法VIMCO,并給出了快速的變分EM算法。他指出,該算法的計算複雜度關于樣本容量和變量維數均為線型增長,因此在處理大規模數據集上十分高效。
最後,史興傑博士通過數值模拟表明,當被解釋變量内部相關性很高時,vimco在變量選擇的準确性上要顯著優于基準方法;當被解釋變量内部相關性較低時,vimco與基準方法具有同樣的準确性。兩個GWAS案例分析也顯示了該方法的有效性。最後,給出了實現該方法的R軟件包vimco。
報告結束後,與會教師就該論文的研究背景、假設條件,以及在金融大數據中的應用等相關問題進行了熱烈讨論,并提出了一些建議。此次報告使在場的老師和同學們對高維大數據的變量選擇前沿有了更為深入的了解,激發了研究靈感,拓展了研究思路。