彩云之南 数信飞翔
——记云南大学数学与统计学院院长唐年胜及其团队
2020-10-15杜月娇
杜月娇
唐年胜
“彩云之南,我心的方向……”一首《彩云之南》唱出了世人对这片净土的向往之心。伴随着悠扬的歌声,记者来到滇池脚下的巍巍学府——云南大学。
2015年1月,国家主席习近平在考察云南时,为云南的发展点明了新的定位:“云南要主动服务和融入国家发展战略,闯出一条跨越式发展的路子来。”
谆谆教诲犹如灯塔指明了云大人创新发展的航向。几年来,他们始终牢记习总书记的殷切嘱托,以脱胎换骨之勇气和自我革新之精神,主动融入国家和地方建设,闯出一条创新发展的路子。2017年9月,在国家“双一流”建设高校名单中,云南大学赫然在列。
“被列入‘双一流’是新机遇,也是新挑战,往后的发展任重道远。”云南大学数学与统计学院院长唐年胜如是总结“双一流”带来的影响。15年来,他和所带领的团队融入在云大跨越发展的浪潮中,奏响了一曲来自数学与统计学的现代创新之歌。
坚守初心——让数学与统计为民所用
运用统计学的方法,从某些人的生活特性和生活习惯所展现的数据中找出异常点和影响点,以此判断他有没有老年痴呆症的前兆;
建立数学模型,通过数据分析识别出一个人的甲状腺结节属于什么阶段;
…………
进入唐年胜及其团队构建的研究世界,你会发现数学和统计并不是枯燥难懂的数字和公式,而是人们生活中实实在在用到的灵巧工具。“将数学搬下高阁,带入寻常百姓家。”这其实是唐年胜最初投入统计研究的初心,也是他多年坚持其中的动力源泉。
时光倒回到20世纪90年代初,纯真朴实的四川伢子唐年胜还在重庆师范大学数学系攻读学士学位的时候,有一天在图书馆里看到统计学应用于天气预报的相关文献,瞬间联想到家乡农民“靠天吃饭”的疾苦。如果能将所学应用到天气预报上,提高天气预报的准确度,不就可以帮助家乡父老乃至全国农民早日摆脱“靠天吃饭”的困境吗?带着朴实的愿望,唐年胜从此投身其中,这一干就是近30年。
近30年间,他从一名普通的本科毕业生,一路攀爬象牙塔,先后成为云南大学统计系理学硕士、东南大学数学系工学博士,之后到香港中文大学心理学系担任副研究员并在统计系从事博士后研究工作。在此之后还先后成为美国哥伦比亚大学医学院博士后研究员、香港浸会大学数学系访问学者、美国北卡罗莱纳大学生物统计系访问教授……“读万卷书,不如行万里路。”多年积累,收获了居于学科前沿的观念技术,为他之后带领云南大学数学与统计学院奔涌在相关学科理论和应用研究浪潮前端奠定了坚实的基础。
当新世纪的钟声敲响,人类进入了一个信息化的时代。彼时经常流转在国内外统计学研究殿堂学习进步的唐年胜对国家在相关领域的大力举措和投入发展有着深刻的体会。师夷长技以自强,和众多海外华人及学子一样,他也愿意将自己所学所得带回祖国、报效祖国。
2005年,唐年胜开始全职回到母校——云南大学担任统计系主任,至此扎根彩云之南,将多年在数学与统计领域收获的居于前沿的思想和技术在云山之巅散发出其特有的光芒。
搬下高阁——研究成果润泽大地
随着现代科学技术尤其是计算机、网络信息和生物医学工程等的发展,大量的数据出现在诸如:生物医学、经济、金融、环境科学、医疗健康等学科领域,并以前所未有的速度产生和积累。
“从统计学的角度来看,这类大数据的主要特点是维数高,样本量大但通常小于变量的个数,并且具有复杂的相依结构。”如何把这些高维数据准确利用起来,是唐年胜及其团队这些年来一直关注的焦点。
传统的统计分析方法、统计计算和统计推断理论并不能胜任,立足国际前沿,他们通过大量的摸索和调整,创新地提出“惩罚指数倾斜似然方法”,并在传统假设不成立的情况下,利用“惩罚”函数方法将可能不重要的变量个数尽可能地压缩至可接受的范围,通过降低重要变量的个数从而巧妙地达到降维的目的。
为更好地提高效率,唐年胜还带领团队与香港中文大学合作对超高维齐性分类数据提出了独立于模型假设的筛选重要变量的分类自适应方法。这一方法的独特性在于适用响应选择(Responseselective)抽样数据分析,在1∶1还原数据原本属性情况下,既得到准确的统计推断,还可提高数据处理速度。
目前,部分研究成果已成功运用于医院甲状腺结节的病例筛查中。医生只需通过患者的临床观察,输入其年龄、性别、生活习惯、C T数据等,利用建立的模型,即可快速探测是否存在甲状腺结节的症状,不需要过度依赖医生的经验,探测准确率基本可达到90%左右。事实上,这只是唐年胜及其团队研究应用于医学研究领域的“冰山一角”。
针对生物医学研究中的有序分类数据、动态空间数据和缺失数据等复杂数据,唐年胜及其团队提出了分析处理这类复杂数据的新理论和新方法。特别是,在不假设不可忽略缺失数据机制模型的具体形式的情况下,找到了估计方程在给定观测数据和缺失数据示性函数下的条件期望的一个非常重要的、简洁的公式,该公式是推广和发展可忽略缺失数据估计方程的统计推断理论的一个至关重要的成果。
在日常生活中,我们常常遇见很多统计数据都不同程度的存在部分缺失。针对数据缺失的问题,唐年胜及其团队在假设缺失数据机制是不可忽略缺失的情况下,提出了查补缺失数据的一些新方法,如基于倾斜得分的非参数查补方法等。模拟研究表明:这些方法对查补缺失数据是非常有效的,可用于处理经济、金融、心理学、社会学等领域中的缺失数据。
“识别数据集中的强影响点或异常点以及评价模型微小扰动对统计推断的影响是统计学中一个重要的研究领域。”唐年胜对这一重要研究领域展现出极大的兴趣。“统计建模就是把可能对响应变量有影响的因素作为协变量建立一个简单的回归模型,但是存在一个自然的问题,这些模型假设是否合理?数据与假定的模型是否大致一致等”,对此唐年胜开展了统计诊断研究,而这正代表了他多年研究的独特性。
“贝叶斯方法应用其实广泛存在于我们的生活中,就像中医看病就是一个很好的例子,为什么大家都找老中医看病?原因就是老中医看的病人多、经验丰富,收集的历史数据多,做结论相对准确。这就是贝叶斯方法应用的一个例子,但它存在争议。”针对复杂数据模型的特点,唐年胜及其团队展开了长期深入探索研究,创新性地提出了刻画扰动的度量统计量,并发展了一些简便的计算方法。值得一提的是,在生存数据的贝叶斯统计诊断研究中,不仅考虑了随机效应方差的扰动,而且还考虑了危险函数的轨迹函数的扰动。
如今,部分成果已成功应用于社会实践,如受云南省食品药品监督管理局委托,唐年胜团队在昆明市、曲靖市开展了食品安全满意度调查,实地发放问卷6500余份,网络发放问卷2000余份,得到了云南省关于食品安全的第一手资料。
当一个又一个研究成果被搬下高阁,飞入寻常百姓家,唐年胜感受到了研究惠及于人的成就感,也实现了他最初的梦想。
壮大队伍——一个人的梦想变成团队的梦想
“太华巍巍,拔海千寻……努力求真,文明允臻……”对相识相伴近30年的云南大学,唐年胜怀有很深的感情。虽然地处偏远省份,但一年四季都是读书的好时光。
指导学生
自从进入这所巍巍学府以来,唐年胜就被它的气质深深吸引。而他所在的云南大学数学与统计学院,其前身是中国大学历史悠久的数学系和统计系之一,华罗庚、陈省身等数学泰斗都曾在此任教。站在前人的肩膀上,继承优良传统的同时致力创新,在唐年胜看来,是新一代学院人面临的重要课题。
带着这样的想法,他全职回母校任系主任的时候,恰逢云南大学数学与统计学院组建成立,天时地利人和,从此一步一个脚印,开启了利用现代科学技术注入传统古老学科的创新新征程。立足学科前沿,推进学科布局和建设,搭建创新平台和实验室,引进培养人才……可以说团队的孕育与每一步成长,都饱含了唐年胜的心血和情感。学院之于唐年胜,就像是他的家。
“人才兴则百事兴”,从组建团队以来,唐年胜就非常重视人才的引进和培养工作,为搭建学院人才体系建设竭尽全力。从加拿大、英国等引进一批专家学者加盟学院,加盟云南大学统计学科……随着一名又一名杰出人才的引进注入,为团队立足学科前沿跨越式发展注入了强大的血脉,居于国际先列的思想和技术得以在彩云之南落地、生根、发展。
引进人才的同时,学院先后搭建全国理科人才培养基地“数理基地”“中央与地方共建高校特色优势学科实验室(云南大学统计建模与数据集成实验室)”“云南省统计建模与数据分析重点实验室”等平台。实验室和创新团队的获批使得学科发展如虎添翼。学院现拥有数学、统计学2个一级学科博士学位授权点,数学、统计学2个一级学科硕士学位授权点,数学、统计学2个博士后科研流动站等,形成了完整的本-硕-博及博士后的人才培养体系。“统计学”专业入选国家首批一流本科专业建设点;“概率论基础”获云南大学校级研究生优质课程立项建设;“应用回归分析”入选云南大学2019年“线下精品课程”建设……
在过去的5年时间里,学院科研工作硕果累累,取得了一批在国内外都有较大影响的研究成果,包括8部专著和近800多篇科研论文;承担了国家杰出青年科学基金,国家自然科学基金重点项目面上、青年及专项项目等国家级项目34项,以及云南省统计局、昆明市统计局等横向项目10多项;获省部级二等奖2项、三等奖2项;唐年胜当选国际统计学会推选会员(I S I Elected Member)、国际泛华统计协会“Board of Directors”……
在唐年胜的带领下,学院这些年来以海纳百川的开放理念,加强与国内外的交流与合作。团队先后派出多名教师和学生到美国密苏里大学、密歇根大学、耶鲁大学等海外科研殿堂进修或访学或合作研究;多次派出青年教师、博士后和博士生参加国内外学术会议并作邀请报告;近年来,学院在全国大学生数学建模、美国大学生数学建模等比赛中屡获大奖。“走出去”的同时,他们也在积极地“引进来”,积极承办或主办各级各类学术会议,2016年、2017年、2018年、2019年连续4年承办了全国统计学研究生暑期学校,先后举办3次国际会议、2次国内学术会议……
围绕服务国家区域战略布局和落实新的发展定位,学院近年来的表现十分突出:为深圳市、开远市、石屏县等统计部门和中国移动云南公司培训统计人员200多人,并获好评;依托国家自然科学基金数学天元基金项目,培训西部地区高校统计青年教师和全国统计学研究生数百人,已成为一张名牌……
彩云之南,数信飞翔。伴随着学院的发展壮大,曾经唐年胜一个人的梦想,变成了团队所有人共同的梦想,越来越多的来自数学与统计研究的成果也乘着信息数据的“清风”得以飞过巍巍西山,越过茫茫滇池,飞向更远的地方……