2019年7月7日至7月11日,美国耶鲁大学公共卫生学院生物统计系马双鸽教授应我院张三国教授的邀请,在中国科学院大学雁栖湖校区开设了为期五天的暑期课程《高维生物统计数据分析》。来自国科大数学科学学院、基因组研究所、自动化研究所、中国科学院脑科学与智能技术卓越创新中心等单位的统计学、生物学、运筹学等相关专业的同学参加了本次课程。
马双鸽教授首先介绍了高维数据分析的研究背景,重点介绍了以癌症基因数据为代表的高维数据特点。然后介绍以FDR(False Discovery Rate)方法为代表的Marginal Analysis;以Lasso、Bridge、SCAD、TGDR、Group Lasso、 Group Bridge、CTGDR、Supervised Screening等为核心的高维数据降维和变量选择方法,以及整合分析、基于网络结构的分析等前沿统计方法。马老师结合实际数据以及自己多年来的研究工作,对这些方法的原理及应用做了细致生动的讲解。最后,马老师展望了高维统计的研究前景,并对有志于从事相关领域研究的同学给出了合理建议。通过本次暑期课程,同学们对高维数据的特点及相关统计方法有了更深的认识,为未来科研开阔了视野。课后马老师与部分同学合影留念。
马双鸽教授1999年毕业于中国科学技术大学少年班,并于2004年获得威斯康星大学统计学博士学位,2006年任职于耶鲁大学,现为耶鲁大学公共卫生学院的Professor。马双鸽教授于2007年获得了ISI(International Statistical Institute)的Elected Member,2013年获得了ASA(American Statistical Association)的Fellow。马双鸽教授的研究主要集中于生物信息学、生物统计、遗传流行病学、癌症基因、生存分析、半参数统计、高维数据的降维等。现任JASA、BMC bioinformatics等多个国际期刊副主编。已在Nature genetics, Journal of the American Statistical Association, The Annals of Statistics, Biometrika, BMC bioinformatics等国际权威期刊发表论文400余篇,引用总次数7000余次。