当前位置:首页 > 科学新闻 > 正文

著名统计学家佘轶原全职加盟西湖大学

 作者: 来源:西湖大学微信公众号 发布时间:2025/7/1 15:18:03 字体大小:

西湖大学迎来一位新成员,其办公室吸引了多位老师前来交流探讨。这位新教授究竟拥有怎样的学术背景,能产生如此的“磁吸效应”?

答案在于统计学。

近期,国际知名统计学家佘轶原教授已正式加入西湖大学,担任理学院和理论科学研究院讲席教授。

统计学作为数据科学的核心基础,是机器学习与人工智能等领域不可或缺的支撑学科,广泛服务于自然科学、工程技术及社会科学等诸多领域。事实上,统计学无处不在,它不仅关乎我们对数据的理解和处理,更深刻地塑造着我们的科学理念与信念。

佘轶原教授

佘轶原的研究涵盖高维统计、机器学习、优化技术、大数据分析及稳健统计,综合了理论、计算及应用,属于统计学、数学和计算机科学的深度交叉领域。他的学术经历本就横跨多个学科,早年在北京大学接受了数学与计算机方向的系统训练,随后赴美攻读统计学。2008年,佘轶原在统计学顶尖学府斯坦福大学获得博士学位。此后任教于佛罗里达州立大学统计系,2018年晋升为正教授,现已全职加盟西湖大学。佘轶原教授是美国统计学会会士、数理统计学会会士及国际统计学会当选会员,曾荣获美国国家科学基金会职业生涯奖。佘轶原是西湖大学引进的首位统计学教授,他的加入将为学校在统计学科的布局增添了关键一环,并将致力于打造西湖大学在数据科学及其交叉领域的研究与人才培养新高地。

不定中的确定

说到统计,许多人往往误以为它只是数据的简单收集与整理,实际上,这只是统计学的起点。

统计学更关注如何通过数据推断总体规律,并为实际决策提供坚实的理论依据。作为国家一级学科,统计学不仅严谨且富有实践价值,早已深度融入社会生活和各类科学领域。

“统计学是一门以数据为核心、研究与应对不确定性的科学。”佘轶原说。

为什么要关注不确定性?测量误差、个体差异、抽样偏差,以及现实世界问题的高度复杂性和模型的不完备性等等,共同构成了不确定性的来源。统计学通过严谨的分析与建模,帮助我们理解并量化这些不确定性,提升科学推断和决策的可靠性。

这几年火热的人工智能,其实也离不开统计学的底层原理支持。马斯克前段时间略带醋意地说:“机器学习的本质就是统计学。”

的确,人们期待中的人工智能理想模型,不仅需要在给定数据上实现良好的拟合效果,更重要的是具备统计上的有效性——即模型能够适应更广泛、更一般的未知情境,这才是真正意义上的智能。

统计学和机器学习领域将这种能力称为“泛化能力”。反之,如果忽视这种考量,模型通常会出现过拟合的问题,也就是失去泛化能力。

当今复杂模型的参数量已达万亿级别,远超人类认知维度。佘轶原的研究重点之一——高维统计领域,其核心挑战在于样本量远低于变量维度,导致“维度灾难”(curse of dimensionality)尤为尖锐。这种以少测多的挑战在数学上曾一度被认为是“不适定问题”。

然而,现代统计学的研究发现,现实世界的数据并非毫无结构,而是常常蕴含着内在的简洁性,比如经过适当变换后呈现出的稀疏性或低秩性。利用这一洞察,我们依然能够从中获得精准的预测与稳健的推断。

现代统计学的核心挑战之一,便是在有限且不完美的样本中,如何精准地还原高维数据的内在结构——佘轶原教授如此概括。

他的研究致力于融合严谨的非渐进性理论分析、高效的优化算法与先进的正则化技术,如选择、投影、聚类等,深入挖掘数据背后的内在关联,旨在让看似混乱的高维信息变得清晰且可解释。

在高维统计、低秩建模、稳健推断,以及非凸与非光滑优化等前沿方向上,他的研究不仅为机器学习从复杂数据中发现规律提供了新方法,也为生物医学、经济学等诸多学科的数据分析提供了有效工具和崭新的思路。

异常中的寻常

现实中的数据往往并不“干净”:异常值、标记错误、高杠杆点(high-leverage points)等现象随处可见。这些异常数据的“破坏力”很大,有时即使只有一个极端的异常点,也可能导致传统估计和推断方法完全失效。

你可能会想,干脆找出来扔掉就行了。但在现代大数据应用中,人工直观地识别异常点几乎不可行,更何况参数估计、异常检测与统计推断本就是密切相关、难以割裂的联合优化问题,在监督学习场景下尤其复杂。

如何在异常中发现寻常?正如佘轶原教授所说,数据科学的兴起为稳健统计带来了新的机遇与挑战。

一些传统稳健估计方法常在模型假设下将异常数据视为“杂音”而专注于抑制其影响。但现实中,这些异常未必是轻微扰动,反而可能承载关键的信息与规律。正如在犯罪调查中,真正帮助找到线索的往往正是看似异常的信息。

因此,在建模、估计与推断过程中,同步量化评估每个数据点的异常风险尤为重要。针对这一挑战,佘轶原教授创新性地构建了稳健损失函数与高维统计正则化之间的理论桥梁,通过融合稀疏约束与非凸优化技术将异常检测与参数估计统一于同一框架。在此基础上,他提出了具备有限样本理论保证的新方法和高效算法应用于大数据分析。

在统计学家眼中,世界本身就充满着不确定性,人类所获取的数据也自然蕴含随机性与变异性。那么,到底是数据决定了我们的观念,还是观念主导了对数据的解读?如今一些复杂模型所涌现出的惊人能力,某种程度上正是数据驱动的成果。而要彻底理解这些复杂机制的背后本质,更离不开统计学的深入研究。

面对现实数据的复杂性,我们依然渴望确定,在偶然中捕捉必然。这正是统计与数据科学令人着迷之处,正如佘轶原教授在入职自我介绍中所言——

寻幽入微,知常达变。

(原标题:著名统计学家佘轶原全职加盟西湖大学|打造数据科学创新高地

信源地址:/html/shownews.aspx          
分享1
版权声明
?本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
? Copyright ? 2014 北京今日创见科技有限公司 All Rights Reserved.
关于我们 | 网站声明 | 服务条款 | 联系方式
京ICP备 14047472号-1   京公网安备 11010502030844号