2017年6月30日至7月3日,美国耶鲁大学公共卫生学院生物统计系马双鸽教授应邀在中国科学院大学雁栖湖校区开设了为期四天的暑期课程《高维生物统计数据分析》。来自国科大数学学院、基因组研究所等单位的统计学、生物等相关专业的同学参加了本次课程。
马双鸽教授首先介绍了高维统计研究的背景,重点介绍了以癌症基因数据为代表的高维数据的特点。然后介绍了以FDR(False Discovery Rate)方法为代表的Marginal Analysis;以Lasso、Bridge、SCAD、TGDR、Group Lasso Group Bridge、CTGDR、Supervised Screening等为核心的高维数据降维和变量选择方法,以及整合分析、基于网络结构的分析等前沿统计方法。马老师结合实际数据以及自己多年来的研究工作,对这些方法的原理及应用做了细致生动的讲解。最后,马老师展望了高维统计的研究前景,并对有志于从事相关领域研究的同学给出了合理建议。通过本次暑期课程,同学们对高维数据的特点及相关统计方法有了更深的认识,为未来科研开阔了视野。
马双鸽教授于1999年毕业于中国科学技术大学少年班,并于2004年获得威斯康星大学统计学博士学位,2006年任职于耶鲁大学,现为耶鲁大学公共卫生学院的Professor。马双鸽教授于2007年获得了ISI(International Statistical Institute)的Elected Member,2013年获得了ASA(American Statistical Association)的Fellow。马双鸽教授的研究主要集中于生物信息学、生物统计、遗传流行病学、癌症基因、生存分析、半参数统计、高维数据的降维等。目前已在Nature genetics, Journal of the American Statistical Association, The Annals of Statistics, Biometrika, BMC bioinformatics等国际权威期刊发表论文300余篇,引用总次数近5000次。