顶级AI学者邢波：大学校长不是官，警惕对优秀成果和师资的逆淘汰|大学|学术|数学|清华大学

机器之心原创

采访：闻菲

机器之心日前发布了对全球顶级CS/AI学者邢波教授专访的上篇，下文是他作为全球首个AI大学的创始校长，对学术管理及领导力，对研究品位，以及对探索创造新的、更加符合当前时代的AI科研和教育环境的思考。

机器之心：谢谢您抽时间进行关于治校和治学部分访谈。首先想请教一下您出任MBZUAI校长的前后的经过是怎样的？您决定接受这个重要任职的原因是什么？

邢波教授：说来话长，前后经过并不重要，但是有一些想法还是值得分享的。我先从大环境以及业界状态背景开始讲起吧。这几年 AI 的发展相当快，挑战了当下大学的研发，教学，科研环境，乃至管理方法。比如学校和企业之间的人才的竞争，设备的竞争。还有一些政策制度上的问题。例如，现在由于社交媒体的发达，炫耀攀比之风流行，造成很多科研人员人心浮动。他们可以通过某种方式成为网红，或是选择很扎实地去做科研，毕竟两者回报机制是不太一样的。

再加上论文（publication）发表和出版模式方面的挑战，比如有些人可以大量地在 arXiv 里面灌水；可以动用自媒体或者其他手段为某一个工作造势；资源多、话语权高的甚至可以通过舆论影响匿名同行评议，比如打匿名送审规则的擦边球，在评审期间开新闻发布会或者在网络上甚至主流媒体上promote来影响评委判断和心理，造成既成事实；当公司或者学校也站在背后或者被捆绑时，这种情况就变得更为复杂。在conference 上发表文章出现像刷榜这种现象也屡见不鲜，甚至变成了主流。

这些现状使研发人员产生一种困惑：到底是加入这个大潮一起去做那种高产的、高光的、高姿态的学者，还是说去钻研一些比较难且花时间的问题？学生也面临这样的挑战。但是，目前学校的机制其实是有点跟不上这些新的形势。并且因为很多政治上的，或者是社会环境上的一些困惑，在学校的科研环境里面，现在很多学者有一些挫折感，学生也有一些迷茫，有逆淘汰的趋势。我想大家对此都是很清楚的。

再比如，现在各大互联网企业，甚至传统企业都积极加入了 AI 人才、研发的竞争。他们提供的环境、资源以及给予的待遇，对于无论是资深 AI 学者，还是年轻教师、学生，都是具有极大诱惑的。高校的人事制度、经费制度、知识产权政策等等如何面对这种新形势：是固守零和竞争姿态迫使教授选边，还是以灵活开放的新法让教授、学生、学校和企业共赢？

在当前环境下，如何保护师生的言论自由（包括沉默自由），学术自由，保护师生的合理权益，特别是在他们创新、创业、合作、交流中提供支持和咨询指导，这些都是当下高校必须面对的问题。

不得不承认，这些问题目前在绝大部分高校中并未得到解决，甚至引起重视。高校的服务功能、催化功能、文化功能没有走在当下日新月异的科研人文环境的挑战和机遇的前面。还经常可以看到墨守成规，居高临下，外行领导内行这些情况。对于这种状况，一味无奈叹息，于事无补。还是需要有担当者站出来，做点什么去改变。

从个人角度来讲，一直以来都有很多要求我去出任各种职位的邀请。因为手头的工作还是蛮多的，在卡内基梅隆还是工作得比较愉快的，我自己的公司 Petuum 也让我感到很充实，所以我一直不太愿意去考虑担任学术或者技术管理职务。但是基于上述背景，结合我多年科研经验、研发以及管理的积累与心得，以及长久以来的一些思考，我觉得有必要、也很有兴趣在一个好的平台上面来做一些新的尝试，即在学术、教育、研发、科研环境上面，试着去创造一个新的环境体系，来研讨及实践新的方法。这是值得一做的事情。

阿联酋国家环境相对来讲比较单纯，没有很多其他方面的干扰冲突，可以比较纯粹地去追求学术、教育、研发的卓越（in pursuit of excellence）。而 MBZUAI 又是一个全新的、完全从零开始的大学，所以我觉得可以去尝试创造一个新的学术、教育、技术转让和企业孵化的空间：比如在学术方面探讨如何获得基础研究和应用研究的平衡，在教育上如何能够去尝试新的理论和实践上的平衡？所以我的目标是能够通过这个机会，一方面探索如何去创造新的、更加适应当代要求的科研教育环境，以及新环境下的高等教育发展的思路；另一方面也通过这个新环境，对 AI 本身的突破前进做出我们该做出的贡献。同时，也对这个社会和 community 社区，能够做出一定的贡献和提供新的思路。比如培养当地人才，促进技术研发，如何能够运用知识通过创新来改革和推动社会（transform society with knowledge 和 innovation）。因为阿联酋或者中东地区，在现代科技上还处在发展初期的人才培养，知识积累和落地部署的适应过程中，它们反而有布局、打造、积累上的后发优势，来对社会产生一个更加良好更加积极的影响。所以我希望我们的大学产生这些功能和社会效应，甚至可以对这种开风气之先的文化提供新的思路或者是一些新的思想。

机器之心：我觉得刚才听您这么一说，如果能够建立这样的一个环境，再在这个环境里去推动 AI 的发展，真的是一件非常令人激动，非常有价值的事情。

邢波教授: 是的。守成体系中，哪怕小的外科手术式的改动其实也是很难做的，因为这种 establishment 既有的固定模式都有它的惯性，所以很难去改动。但是在一个全新的这个平台上面去做，不仅仅是科研创新，而且在管理创新、思想创新上，均有更多的机遇。

机器之心：您刚才提到了「纯粹」这个词，能够解释一下这种更纯粹地去追求 AI 或科技发展的卓越是指什么吗？

邢波教授：阿联酋这个国家还是一个非常年轻的国家，处在上升期，寻求积极融入国际社会，对世界经济政治科研发展起到更大作用。它不是守成的社会，是一个创新的、冉冉升起的社会。所以它的目标是具体的，不是什么都去做，会专注于优先发展一些重要事情。比如希望学校在基础研究领域能够在全世界有一席之地，也希望它能够对当地的经济产业的发展转型或者是社会需求产生一些影响，我觉得这就是纯粹的目标。

在国际舞台上，美国、欧洲、中国都是一个高度发展之后的社会，需要去面对比如说老龄化的问题，基础设施升级换代问题等等。但在阿联酋就不用面临这些问题。另外比如环保方面的问题、DEI（diversity, equity and inclusion）问题都很重要，但是跟研发结合在一起就会变得很复杂，牵一发而动全身，让领导者决策者有时难免顾此失彼，捉襟见肘。作为一个新学校，我们没有这些方面从历史上积累下来的问题和包袱，更可以轻装上阵，探索更健康合理的发展模式。

通常我们在做科学实验时候，是把参数能够界定下来，然后在某几个点来调动和调整。所以做社会实验也好，管理实验也好，也需要有一个可控的环境。在 MBZUAI 这样一个新大学里面，环境会比较单纯；目标也比较谦逊，不是大而全。我们学校本身就是一个专注 AI 的研究生大学。这样对于学科的整体布局，对于教育的不同阶段都是有具体目标的。虽然目标很高，但是目标的广度是有一定范围的，便于探索一些新的科研和教学的思路。

邢波教授在MBZUAI教学楼内。摄影：Khushnum Bhandari，图片来源：thenationalnews.com

一、关于办学：
更关注大学对学术、
社会和文化精神内涵的赋能

机器之心：MBZUAI 是全球首个人工智能研究型大学，您如何理解它的定位与办学理念？

邢波教授：我其实不喜欢「首个」这种冠名，第一和第二实际上并没有意义，有时这是夺取眼球的一种文字表达方法。它就是大学，是一所专注 AI 的大学，如此而已。这本身已经是一个不变的事实，至于是第一个还是第二个，我倒不是非常感兴趣。我更关注的是这个大学到底能不能达成学术上和推动社会发展的目的。

回到大学本身，作为一所以 AI，或者更广义一点，计算机与信息科学为重点的研究型大学，MBZUAI 抱有这样的愿景：（一）首先，它致力要成为一个引领 AI/CS 研究、应用、创新的学术中心，不仅在这个领域，也在相关科学、工程、人文领域拓展新前沿，创造新知识，提供新能力；（二）它要成为阿联酋未来科技、管理、工商、教育人才的摇篮，为国家和社会培养领军人才和思想领袖，同时输送各行各业的中坚力量和实干家，也就是说我们的毕业生中既要有 leader，thinker，更要有doer，worker；（三）要成为带动经济和生产力发展的引擎，成为孵化企业、技术、产品的摇篮，解决国家和社区发展中的问题，带动文化和思想的不断进步。

我希望 MBZUAI 不仅成为阿联酋乃至中东地区最优秀、最具创造力的理工大学，而且在全球的AI舞台上成为一个不容小觑的领先的科研机构，拥有全球影响力，吸引、培养、输出顶尖的学术精英。在这样的愿景下，我们再制定学校建设和发展的近期、中期、远期具体规划及目标。

机器之心：我看了一下学校的官网，有非常详细的课程表，CV、NLP 还有机器学习，不过没有看到项目或课题的介绍。现在学校有哪些重点课题或项目呢？

邢波教授：在学校职能层面上的话，课题的选择定义实际上是应该留有空间的。回归到办大学的理念。我们在提及北大、清华，或者哈佛、MIT，CMU，以及讲起剑桥、牛津，最后记住的是什么？不是它做了哪个课题，甚至也不是它解决了哪个问题——毋庸置疑这些学校多年以来肯定解决了很多问题，也做了很多课题。通常我们记住的东西也不是它的校园长什么样子，清华大学过去的梅贻琦校长曾经讲，大学是大师之谓，不是大楼之谓，其实也不是课题之谓。我觉得应该把诸如课题项目这些内容定位成一个具体的内部操作，而不是外部宣传的重点。

大学应该留下来的首先是要有大师，有人才。具体说，就是要有学术地位崇高、学术造诣精湛，同时还能够继续开拓、引领，具有前瞻性思想的领袖级人物坐镇，定义专业和学科的方向。这样的 Anchor 构成了名校一个最基本（basic）的基础（foundation）。另一方面，我认为在现代环境下仅有大师还不够，还需要能够留下来传统和精神。我们在提及很多著名大学时候，其实我们经常想到的都是比如说哈佛精神，或者是西南联大精神，是有一定的思想和文化内涵在其中的。这是大学更应该关注的事情，也是一个大学校长应该关注的事情。

课题以及具体的项目，其实只是一个手段，也是大学的功能之一，责任之一。但是大学的责任其实是非常非常多的，而且课题是动态的。我们现在的课题，比如和健康医疗、当地的石油工业，以及智慧城市上有关的方向都有很多的工作在做。这些都是天经地义、很自然的事情，任何大学在地方落地都会去做，但这不是大学职能的本质和核心。而且最后的结果也不是看做什么事，而是看是否把事情能做好，然后从做好的结果中还是否能够持续改进发展，推动学校自身核心职能——科研、教育、开发的持续进步。比如通过做这些课题，我们的教师学生得到了经验，或者是得到了荣誉，或者学校得到了经济利益或者是声誉上的回报。我们如何在此基础上去开创下一件事。

所以大学的课题和项目实际上是一个动态的过程。具体来说，基于当地的实际需要和我们目前 faculty 的优势方向，MBZUAI 力求在如下几个方向获得突破性进展，或者做出奠基性工作：
1）大型自然语言智能模型，特别是阿拉伯语言模型的可终生连续训练和高阶推理系统。和当前流行的几个超大规模 NLP 深度学习模型不同，我们的侧重点一是切实针对具体实际应用，比如阿拉伯语对于世界其他主要语种的应用型互译，而不是展示型或者刷榜型的文字生成系统；二是我们的重点是对于文本，甚至多媒数据（比如文字+图像）的自然高级推理，包括常识推理、符号推理、逻辑推理、反事实推理等等，而不止步于基于大数据的记忆型和联想型文本标注或文字生成。

2）乐高式的可组合、可自动优化、可扩展的机器学习后端平台和系统。我们的侧重点是通用化、标准化、模块化，可自由组合，可高度集成的后台系统，支持广泛的机器学习训练（training），元学习（meta-learning），合成（compositionality），资源调配，自动分布，以至打包部署等高级功能，而不仅限于一些单一功能的过度优化。

3）基于人工智能和泛数据形态的个性化医疗诊断和健康咨询系统。运用医疗影像、病历、基因组、可穿戴设备的生理测量等等数据来预测健康风险，了解疾病，管理饮食，优化生活方式。
4）继续深入前面所提的关于「机器学习标准模型」的研究，在此不再赘述了。

MBZUAI校园一隅。图片来源：wam.ae

机器之心：接下来我有两个问题，首先是您希望 MBZUAI 能够留下一种怎样的精神？其次是我们的研究，包括水资源问题，石油可再生能源这些，感觉上也是需要落地的，会不会有一些工程上的需求或者是考核指标？希望您能先讲一下大学精神，然后再讲一下如何衡量这个结果。

邢波教授：大学精神涵盖广阔深远，我现在还很难给它具体去定义到MBZUAI，我们还在探索。但是有几个大方向在《大学》这篇古文中开篇的几个字都说得很清楚：大学之道，在明明德，在亲民，在止于至善。「明德」指修炼自己，甚至可以扩大成为是认识自己和认识世界，这是认知上的需要。我们做学问，首先要认清楚自己，认清楚我们周遭的世界。「亲民」就是要影响社会，要去对社会产生积极的影响。「止于至善」则代表了对于教育研究的最终理想和使命的不断追求。我希望我们这个大学能够达到这样的一种追求。在明明德和亲民的具体的内涵里，当然要跟当地的文化和环境和需要来做一种结合，在这个层面上，我们还在继续的探索。总之在大框架上，我们追求知识，追求未知，也能够去积极的影响社会。在具体层面上如何去做或做什么，还需要再继续定义，比如前面提到的 MBZUAI 的办学定位和当前一些课题方向。

我们有一些具体的办学理念上的目标，总结下来就是希望大学在它达到了一定的规模和水准以后，至少能够实现如下的功能：一个是它作为一个知识和思想的灯塔，能够对我们社群甚至对整个的学界，有引领作用，有示范的灯塔效应，不仅在方向、水平上，也在风格、品味上。这是第一点。第二点它应该是一个提供知识的源泉，能够产生知识，能够做出更多的发现。特别是在AI这个领域里面。其实在AI的研究层面上现在有很多问题，也有很多机遇，我觉得这个大学可以提供一些具体的内容，也可以产生新的思想。第三点我们需要训练人才，这个是一个很重要的功能，不只是输出工具性的人才，还需要有思想的人才，他（她）们能够去创新，能够去继续发扬光大传承。而且能培养输出进入各个领域比如学界、政界、工业界、商界等全面性的人才。

需要指出的是，在现代社会，这样的人才必须有人工智能的足够的知识。原来我们讲 literacy 基础文化素养，通常 literacy 早期指的是识字，能够读写，后来能够懂一点数学。我觉得第三层的 literacy，应该是要懂得 AI，它是当代必修课（required），而不是选修课（elective）。因为 AI 是一个非常综合技术的结合体，它的边界、功能、未来潜力，甚至实现它的方法，其实是有一整套很复杂、也很深奥的体系。如果对这个完全不懂，就会犯一些可笑的错误。比如会觉得 AI 会不会超越人类，AI 会不会把人全杀死，我们能不能进入奇点，其实就是有点像是 AI-illiteracy（AI盲）状况下才会产生出来的思路或者妄想。要是全民或者领袖都 AI-illiteracy，在很多决策上会有错误的判断，就像不懂数学或者不懂文字会做出错误的判断一样。在这方面我觉得有必要在大学，在人才培养上，提供这样的知识与训练。

所谓「亲民」的一个重要含义就是要对文化作出深刻思考和加以赋能。Culture 文化不只是狭义的文化，比如说艺术之类。我觉得文化是一种思维方法，是一种心态、mindset、意识。通过教育，通过技术，通过创新，也让全民能够丰富它的文化内涵。所以我想这是大学的一个目标。一个大学留下的最重要财富应该是知识、传统和精神。我想在国家层面上，希望 MBZUAI 能够做出来有用的、独特的贡献。

谈到如何评估，说实话我不认为大学是承包商，其价值和好坏是通过承包了几个项目，这些项目做得如何来评估的。大学真正的声誉来自于人心和口碑。大学的口碑是所有人来共同孕育和传播的，在社区环境里无处不在，既存在于当地的世俗社区，也存在于科研的环境里面，所以最好评价就是同行的赞许，学生都愿意来求学，教师愿意来加入我们的团队，大师愿意来加盟，这本身就是很好评估。清华大学在早期创学的时候，并非经过了什么评估。只知道大家都愿意去，以去那里求学做事为荣。从政府到民间，都对大学的教师有足够的尊重，觉得这个学校的老师学生有水准——老师为人师表，立德立言；学生篤实勤勉，堪为栋梁。

而现在好像在很多场合底下「教授」这个词大概被污名化了。大学校长也常被大家来消费，偶尔还被公众嘲弄或者是取笑了，这本身就体现出整个社会，从官员，到传媒，到公众对大学缺乏尊重，这其实是一个灾难性的结果，比大学也许未能完成几个项目要可悲的多。这里当然有大学内外很多因素，甚至包含了大学领导教师本身修养水平的问题，还有社会整体气氛的问题。

我的目标是让公众能够对这个学校有一种期许或是赞许，公道自在人心，其实就够了。至于完成多少个项目，怎么完成，这些反而是从属产品。况且仅靠硬性指标是远远不够的。即便定了指标，如果把它定义的太教条死板，反而会异化或者是狭窄化人们的工作。因为完全可以通过捷径来灌水，达到一些文章的数目，或者是去集中精力做几个项目，招几个标变成承包商，这些所谓的 low hanging fruit，捷径，或者是一种很廉价的掌声获取，对大学的整体的声誉和质量价值影响并不大。办大学是长跑，没有什么弯道超车的窍门，还是堂堂正正竞争与做事，把事情做扎实为要。我觉得大学校长其实都应该思考的是什么叫一个好的大学。

二、关于治校：
希望奠定一个框架，
让后人在此基础上不断前行

机器之心：作为校长，您给自己制定了哪些目标呢？

邢波教授：首先，你刚提到的给自己制定目标，是我针对学校制定的工作目标，还是我为我自己制定的个人目标？从工作的角度讲，我需要去实现我刚才所讲的那些目的任务，这是职业上的目标。学校的工作是靠一个团队实现的，所以我会给团队设置目标，我是团队里面一份子。作为个人的话，我有对自己的一些自我要求。

机器之心：您给自己制定的就好。

邢波教授：个人的话，我给自己制定的目标是要具体务实。首先我要做好服务，就像清华老校长梅贻琦教授讲的，校长的作用就是给大家端端茶、倒倒水，给教授们搬椅子的。我觉得他体会得非常好，表述的非常好。原来田长霖教授在伯克利的时候，他每天都要去实验室，经常在校园上走动，跟学生交谈，他不是一个官，就是一个学校的员工而已。现在看到的是很多人把校长当官来做，或者是当成权力，是一个权力的象征。我给自己定的目标应该是给全校的师生员工做最好的服务，让大家觉得我给他们做实事，解决他们的问题，这是第一点。

第二点我希望能够做一个 role model，能够做一个好的教师，然后也做一个好的科研工作者，让大家 remember 我就是一个教授、一个教师而已，还在做研究同时还在教课。比如说我前两天就在学校里面给了一个普通的 seminar 讲座，完全是技术性的。过去几个月我已经在学术场合做了近10个不同的学术报告，交流最新成果。所以我给自己定下的目标，就是作为业务表率，和同事互相勉励，能够发挥出教育工作者，或者是科研工作者的功能，这是第二点。

第三点，所谓十年树木百年树人，大学是树人，真是要很长时间，甚至会比百年还要长才能做成的。所以我能做什么？如果自己能够铺一点路，能够留下一个体系或者蓝图，能够留下一个框架和基础，使之产生持久的长远的 impact 影响力。这个很宏大的目标如果能实现哪怕一点点，我也会很开心的。

机器之心：是留下 legacy 吗？中文翻译成遗产。

邢波教授：不是遗产，我觉得更准确的词是「framer」，就是框架制定者。一个创始校长最重要的是要定下、留下未来的框架。因为框架有了以后，接下来的工作就会是很有序的，有全局性，然后再添加具体内容完善细节。我觉得全局性很重要，一开始有了框架，以后的工作其实都是围绕着一个完整的思路去进行的，而不是修修补补，不是头痛医头，脚痛医脚。这和国家创建其实也很像。美国的创建，华盛顿、弗兰克林、杰弗森并没有被称作 founder，他们被称为 framer，framer 就是框架制定者，其实他们并没有把后来的具体细节全部完成，200 多年前的宪法的具体环境跟现在肯定是有区别的，如今还能用是因为它并没有规定很多，而是做好了一个 frame 框架，后面可以有修正案，可以有更多东西去完善，但是它的思想没有变。

学校也需要这样一个 framework，作为创始校长，我也许能够帮助学校产生这么一个 framework。以后一定有比我更能干的校长，也有更能干的老师，在技术环节各方面可能都会更加优秀，他们肯定可以做得更好，这也是应该的，因为我们的目标就是让它能够一代比一代更好。但一开始的这些开拓者，不见得是最聪明最能干的人。但如果有足够大的胸怀，有足够广的视野去把框架搭好，我觉得就已经达成了一个目的。

机器之心：您认为一个好的校长，要给学生和教师提供最好的服务，要做一些开创性并且奠定基础框架的东西，同时，我可以这样理解吗——您永远都不会离开教学的第一线？

邢波教授：可以这么理解，我希望能一直留在教育第一线，能够始终做科研，能够始终有机会去交流科研，这是我自己的一个小小的愿望。当然，前提是我自己的精力和水平能够使我胜任这样的角色，而不是赖在位子上不走，挡能者的道。这就需要我自己能够持续在科研和教学上保持业务能力，继续进步，继续取得新成果，做一个让全校师生信服的带头人。科研是很有意思的。俗话说曲不离口，拳不离手。一旦放弃了，或者是有一段时间搁置了，会变得生疏迟钝，是很难再恢复的。这对于科研工作者是一个很可怕的局面。所以这的确对每一位从事教育管理的 administrator、校长或者系主任提出了一个挑战，就是如何来 balance 平衡科研和管理行政这两方面工作。我给自己提出的要求是在行政功能上和科研功能上达到一个平衡，而不是去放弃科研只从事管理工作。

对于 academic administration 工作，我的理解是：这是资深的科研工作者对于学术界的一种服务和回报，对个人既是一种荣誉也是一种牺牲，后者特别体现在对于科研业务能力的可能的负影响。我指的是自身实际独立科研动手能力的影响，而不是由于权利而可能得到的所谓学术「提升」，比如常见的来自于「领导自动署名」的 H-index 的窜升，各种学术场合的高光待遇等等。这些东西往往进一步侵蚀学术能力，会造成学术领导知识退化和判断力下降。所以我现在还继续写文章，指导研究生和博士后，也继续做具体的学术报告，也会讲课，希望能够持续做出前沿的有价值的研究成果，进行有专业深度的学术研讨，获得同行的尊重与认可。

机器之心：接下来想问一下您对领导力的理解——在各种功能职责外，「校长」关键是一个leader，您刚才也提到要培养出一批具有 AI 领导力，能够进入各领域发挥支柱作用的年轻人。您是如何理解领导力，如何去培养这样的人才的？

邢波教授：领导力不是一个能够定向培养训练出来的东西。不是说一个学生，招进来了以后目标就是要培养成为领导，教你领导力，我觉得这个是做不到的，也不应该做。同时它也不是与生俱来，然后就无需培植的。比如说也许有些教授，他突然就变成了院长，或者因为某种原因获得了这个位置，或者是愿意去承担这个责任，就自动变成了一个合格的院长或校长，这都是不成立的。领导力是一个通过经验、学习，以及实验，逐渐积累的结果，所以不断学习积累很重要。

清华大学的老校歌有这样一句：器识为先，文艺其从，出自《新唐书·裴行俭传》：士之致远，先器识而后文艺。意思是先要修炼品格、见识、境界、情操，然后才是才艺。这是中国古代知识分子为学修身的步骤。我想领导力的培养更应如此。领导力里包含了一些比较独特的素养或者精神，一方面有先天因素，有外在环境因素，也有很大一部分后天培养。

我觉得领导力首先是敢为人先，卓尔不群。因为你是领导，要为大家领路。在古代的时候，将军是冲在最前的。经常会看到某次军事战役，唯一阵亡的或者受伤的就是他们的指挥官，或者他们的司令。在以色列、在欧洲很多战例中都能看到这样的情况。领导者的思想和行为都体现出敢为人先，卓尔不群。但是另一部分，我们不常见到的，就是领导力还体现出来虚怀若谷、海纳百川。他能够承载很多意见，甚至能够去集纳（aggregate）或者是去综合（combine）不同的意见，不是调和不同的意见，和稀泥，而是从多个不同甚至相对立的意见中能寻求一个最佳的解决方案。然后还能够去说服大家一起来做，所以团结能力也很重要。总之我想领导力表现为敢为人先、卓尔不群、虚怀若谷、海纳百川，同时也有这种团结的精神在内核。

最后领导力还体现出来一种行为方式或者是一种理念，就是它体现出来一种独立精神，一种自由思想。这个很重要，是教科书里找不到的。尤其是进入无人之境，进入未知领域以后，其实是很难有 play book 现成手册或者锦囊妙计来供你照本宣科。那时就需要有创造力。创造力的产生需要有自由思想和独立的精神，它让你能够在一个没有边界的自由空间里面去探索，去找寻解决方案。对于学校的领袖，学术领袖或者学术行政领袖，尤其是大学的校长，至关重要。因为创新和探索基础和应用研究，尤其是基础研究，就是在探索未知。探索未知实际上是一种思维习惯，一种生活方式，它必须植根于某种土壤，有其独立和自由的生长环境。如果大学是这么一种环境，学生也好老师也好，就会自然而然的把课题，把目标往这方面牵引。古话说：思不出其位，是自弃于浅陋之学也。如果我们每次都会质疑是不是触到了某个边界，或者是不是做了不太被接受的题目，结果是没有开始想就夭折了，所以那种思想肯定是无法走出边界去创新的。我觉得领导力也体现在领导要敢 advocate 提倡去发扬这种理念和做法。

机器之心：听起来您好像是不会给团队设限的那种感觉。我还是想请教一下您对教职人员的考核要求是什么？

邢波教授: 教职人员是需要考核的，这个是有必要的。但是考核不是简单的一种量化的 tick box 表格填选项的考核。现在 MBZUAI 的考核是从大体方向上说，跟其他大学没什么两样，一个是科研，一个是教学，一个是服务，这三项。但是考核的功能和效果主要是看具体的规则和执行，否则再好的规则到了错误的人手上也会走样或做不到位。

科研里面会有一些比较细致的具体的指标。比如在这个刊物或者是会议里面发表优秀的成果，能够有能力获得经费，写出来好的课题报告，获奖情况等等。但最重要的一条是获得同行的认可，而且同行认可的定义也要严谨。不是指去找几个认识熟人去写 reference letters。同行认可定义要具体，一是首先必须是内行，有能力对被评估人的工作作出具体和准确评估，其次是和被评估人没有利益关联，能客观公正。比如他要获得若干封推荐信，通常15封或者20封，一部分是可以自己去提名的，让有些比较了解他的工作人来写。但另一部分是考核委员会自己独立去收集，而且是请没有跟教师合作过的写过文章的人写评估推荐信。当然，我们不能完全发现所有关系，学术界的联络是很紧密，大家都会认识。但是还是有一定远近的，我们希望尽可能判断是独立的、没有关联的。这是对学术上的这么一个要求。

第二点在教学上的要求。需要指出，教学上的要求跟学术是同等重要，不是第二重要，是一样的重要。这其中包含了课堂课程准备，开了哪些课程，授课质量如何。一般我们的授课录像、讲义和其他课件都会放在公开主页上，不仅是学校的学生上完课以后可以继续复习、评估，整个的公众都可以使用和评估。包括是否喜欢这门课，其他学校老师是不是选用了这门课等等。比如说我在 CMU 主讲的的 Graphical Models 的课件，已经有十多年了，每年更新，成为一个公共资源。大概现在美国有很多学校的老师都在使用，基本上要么是改动一下，或者是再丰富一下去使用。这就表示了一定的接受度，这也是一个重要的考核标准。然后包括老师在会议上、在各种学术活动中的 tutorial、seminar的活跃程度和积极参与程度，这是在教学这个领域上面要达到一定的要求。

服务也很重要，在校内和校外如何去推动学术社区的发展，例如去做 conference 或者是 journal 的评审人，这是一个很 demanding 繁重吃力的服务，因为花很多时间，有时候是很辛苦的，而且做这些不能出名，是无名英雄。但是我们还是要把它计入在教师的工作里面。然后组织会议，或者组织 workshop，组织工作本身其实也很辛苦。在学校里参加招生，参加面试教师候选人，甚至是负责设备，校内校外的各种杂务都要有人去做的。我们还是希望教授能够有主人翁的感觉，把这学校当成是家，你会发觉没有一件事是不重要的。不能只挑重要的事干，把别的推给他人，这些都是你自己的事。

所以我们在教师的评估里面会有这么一个综合的指标，去鼓励教师健全而不是畸形的发展。这就是为什么现有的旧体系现在可能需要一些调整，怎么能够促进培养打造一个健全的教师或者是科研工作者，而不是畸形的工作者。当然，学校是一个包容的 diverse 的环境，肯定会有各种各样的风格可以存在的，但是这里面需要有一个平衡，不能是一边倒的。除非他这一边做的特别特别优秀，以至于他在加权平均的时候，把其他东西给抵掉了。有些人高考也许语文是 0 分，但他数学是极高极高，也许他也可以被录取，这是可能存在的，但这不是常态。我们在考试的时候毕竟还是数学、语文、物理、化学都得要考。所以这个是我对教师评估的一个设想，现在正在跟我们的 faculty 在做沟通和贯彻执行。

机器之心：根据您刚才所说，研究和教学这两项能力都需要达到一个起码的标准，在此基础上才能算有所作为吗，就是说教授必须是综合性型的人才？

邢波教授：对，这个是理想状态。当然我们也有 Research Track和 Teaching Track，以后会有这样，尤其增加不同需求了以后，甚至现在我们已经有一些教授是研究型的。但是这个不能作为是主流的思路，而只是一种选项（option）。如果教授更加倾向于主动去做 teaching track，或者做 research track，这是可以的。但是他的要求会有一点不同的侧重，比如说如果 research track，是否就可以完全不 teaching教课了？也许是可以的，但是在美国 research track 和 teaching track 不是 tenure，也就是没有终身教职。这里面有不同的 tier 层次和不同的 expectation 预期。事先讲的比较透明，这样双方的理解预期都是一样的。

学校在 employment 形式上需要有这种多样性和灵活性。你刚才问的问题，我只是回答了一个比较 mainstream 的常见方式，但是还包含了其他各种各样的方式，比如各种形式的兼职教授、远程教授等等。我们的重点不在机械规定教研人员的合同种类及工作形式，而是在如何产生出最佳的科研教学结果，最大程度释放教授们的能量，获益于他们的服务，同时也顾及他们的客观实际及需要，力求学校、教师和学生共赢。

机器之心：2014 年您在微软亚研院采访的一篇文章里提到您在招收学生的时候，不仅仅作为研究者，更看重他作为一个普通人的价值。比如说有独立的精神和独立思考能力，知书达理，要诚实、要豁达。您现在作为校长，在遴选和组建教师和研究团队方面有怎样的考量呢？

邢波教授: 其实老师跟学生没有什么两样，同样都是人，而老师应该有同样甚至更高的关于人格、修养、品德上的要求。这不仅仅是我自己的一个期许，也应该是老师们对自己必须的一个要求，这就是所谓「先修身」。我的学生毕业的时候，他们去找工作，尤其是面试 faculty，常会问我怎么参加面试。我会让他们不妨换位思考一下，你作为学校的老师来招一个新的同事，你会是什么样一个心态？新的同事有可能以后要跟你共事 30 年，你是希望招一个怪物（monster），一个会行走的超级计算机，还是希望招一个活生生的人，能够合作、交流，能够互相成长，有 friendship 这些重要的东西。所以我觉得作为对教师的要求，就更应该注重人文、修养方面的素养。他必须是一个活生生的、健康的人，在性格上人品上更应该有表率作用，比学生还重要。这是我对教师的这么一种期许。学生是进来的时候样子，毕业出去的时候，开始工作执教了，应该在这方面应该更有 enhancement 精进才行。

对教师来说，诚实，懂得 respect，包括对自己的学生、对他人、对工作、与大家 mutual respect 相互尊重，是非常重要的素养，因为这样才能产生对等，才可能健康教育。我们在学术里面，会经常 disagree，因为学术是追求真理的，真理有时候只有一个 fact 或者 truth，其他东西都是 wrong，所以必然有竞争有辩论。这个时候如果要是没有 respect，再 take personal 带个人感情，那就完全没法工作交流。所以人本身的修养和 manner 举止是非常重要的。诚实就更不用说了，直接决定了成果的质量和可信度，和同事之间在工作合作中的信任度。

我欣赏一种称之为「humbition」的素养，一方面谦虚（humble），一方面又有抱负（ambition），这些素养我觉得在教师身上是很重要的。研究的出色和教研教学的出色，对教师是一个必要条件，这是最起码的要求。只有在研究和教学的能力达到了一定的水准，才能进入一个好大学。但是我认为这还不够。这就是为什么我们在每个学校，在 CMU 也好，在 Berkeley 也好，面试的时候不仅仅是看一堂 PPT 的 presentation，还要看他跟每一个面试的人，包括老师和学生，面对面的这个会，谈各种各样的学术话题，甚至各种各样的非学术话题，看他的待人处事和举止做派。这都是面试的一部分。有些人可能会很郁闷，说我的 paper 这么多，压倒对方数倍，为什么我没得到 offer，是不是被黑。其实他是没明白，因为我们招的不是一台论文机器，我们要招的是一个人，是一个同事。把这点想明白了以后，其实一切的疑问都是迎刃而解，都变得很简单。

三、关于治学：
好的研究能提供一种长远的视角，
题目、风格、手段都达到一定境界
才能算有品位的研究

机器之心：从您刚才和过往的采访中，都提到了研究是对未知和完美的追求。首先请您定义一下什么是好的研究，如何才能做出好的研究呢？

邢波教授：什么是好的研究？这个问题我稍微把它具体化一点，研究稍微界定一下可以分成基础研究和应用研究，当然还有中间的。至少从我个人的理解，基础研究应该有这样的一些特征：有一种穷其究竟的欲望，或者一种目标是要去抓住核心本质和规律去做研究的，而不是为了去炫耀我的数学有多么强，我有多么聪明。在音乐演奏里边我们经常会看到炫技派，还有更加难能可贵的是一种叫原教旨派或作曲家派的，后者会尽可能按照或还原作曲家的原本思想来弹，而不是为了自己的技术的展示发挥来弹。我觉得基础研究还是要把问题的本身搞透，才是一个好的研究，而不是堆了多少公式、术语、推导。事实上，历史上最有价值的基础研究，比如量子力学力学的测不准原理，DNA 双螺旋的发现，只有几页论文，有些还不是在著名期刊上发表的。在应用研究上面可能有些不同，我觉得应该更加去注重解决实际的需要，能够直面用户，能够跟内行交流，而不只是去刷榜。

做科研最忌讳一种所谓非对称的一种玩法：在做理论的和做基础的人面前去展示实验应用成果，在做应用的人面前去刷几个公式，展示所谓的理论成果，利用受众对于对岸领域的本质层面的生疏，获得这种非对称的喝彩。我觉得这是最不可取的一种品位。这种品味现在还是蛮常见的，特别是在一些年轻的教授和学生中。我曾经对学生们建议，如果你真觉得你做了一项特别高深的理论工作，那就投到《数学年鉴》或者《统计年鉴》去，不用投到 ML 或者 CV 的会议 proceeding，拿自己的推导作业纸唬人。如果你认为自己是做应用的，那就踏踏实实把代码写好，把原型做完整，落实到真实场景中，不用只在几个不真实的标准数据集上刷榜糊弄。对于我自己，我一直定位我是一个工程师，不是数学家，虽然我一直在几个核心数学杂志担任编委发表文章，但是在那些工作中，我就老老实实把基础的问题回答好，不去掺入数学家们不熟悉的题目去故弄玄虚。反之亦然，在应用工作中，我们力求直观、严谨、透明，在实验设计和展示上力求详尽充分，不去掺入那些令人莫名其妙又 reluctant to challenge 的各种定理去故弄玄虚。总之，要真觉得自己做了一份好的研究，理论也好应用也好，应该尽可能向内行专家去展示。在社交网络上赚吆喝是在浪费自己和大家时间。

刚才我讲的只是一种风格，但好的研究其实有好的风格还是不够的，好的研究最重要的是题目得定对，去问 right question，正确的题目，这是目标上的东西。因为题目很多，而且题目绝对是有好坏之分的，有些题目是想象出来的题目，你可以自己在那竖个靶，说它是靶，我去打，这是可以的，但是并不真正体现出价值和能力。另一种靶就是自然的靶，它是现实存在的，这是世界上的一些 open 的问题。你愿意不愿意去尝试这种问题。

刚才我讲了风格，选题。然后还有就是手段，其实现在我们也看到了不同的研究手段的起落冷热。现在比较受关注的是一种所谓强调暴力计算的资源堆砌，军备竞赛。比如我选一个题，做「大模型」，我的题目就是要做一个 trillion parameter 的模型，要先做到 trillion 参数，至于为什么 trillion 量级是其次。这本身就把赛道给换了，因为别人玩不了，我能玩，因为我（我厂）有玩具，有钱，有数据。当然这种题目还是有价值的，有工程上的价值，也有其他价值，但是我不觉得是一个好的品位。因为这种暴力性的东西，首先就排斥了良性竞争，或者是排斥了头脑的竞争，它是一个资源资金的竞争。

所以为什么很多大学会说很悲观或者有挫折感没法做研究，因为没这么多计算机，然后也没这么多数据，只能做别的。那这种「科研」结果怎样呢？这方面其实在原来国际政治或者军事竞争的时候有些例子，我们看到过有些超级武器，比如说巨大的5000万吨TNT当量的沙皇氢弹，还有前苏联造过一个叫里海怪物的地效飞行器，上面有十台发动机，甚至可以携带大型反舰导弹，这种东西都只造了一架，就再也没有人造了。我实在是无法来评价它的品位。同样是武器装备，像 B52 轰炸机，问世快 70 年至今还在服役，这就是一个品味好的产品，经得起各种考验，大家愿意去重复使用，不断更新改造。所以我觉得手段上面要有好的品味，不能胜之不武，应该是真正的去一个公平的平台，高手之间可以较量。总之，题目、风格、手段，都需要达到一定的水准，才能够得到一个好的，有品位的研究。

再举几个有品位的好的研究工作例子。我最近听了非常好的一个前辈研究者 Judea Pearl 的 talk，他就很好的提出了对这些机器推理的局限的研究课题。现在基于超大数据的工作，不论是 GPT-3，或者是以后的其他超大模型，大体上都是 data driven 的一个 factual reasoning。记忆了很多东西，把它作为一个表达形式储存，然后可以很快检索了，这样是很有用，但是它能够达到的也只是一个 factual reasoning，事实推理。那 what about common sense reasoning常识推理？比如问太阳有眼睛吗？或者直接问太阳有几只眼睛？或者是我能在水里面煎蛋吗？这就是 common sense reasoning，这种问题你会发觉 GPT-3 这些大模型是很难回答的。因为这些常识性的内容在文献里面没有出现过，甚至是它的转变体也没有出现。但人的头脑还是很容易做这种的推理。此外，对于模型中有记忆的部分，我们能不能用counterfactual reasoning，反事实推理？比如如果奥斯瓦尔德没有去刺杀肯尼迪总统的话，肯尼迪总统现在是否还健在？然后 Judea Pearl 指出，这是我们现在流行模型的缺陷，跟大小没有关系，是跟架构（Architecture）有关系，而我们是不是可以设计引入新的架构，引入新的参数或者变量的表达，然后用一种新的目标方程来定义？所以我觉得这是一个非常好的有品位的题目，因为首先他提出了一个深刻的问题，没有解决问题，但也提出了一些解决的思路，有很多人可以去继续往下做。而且很公平，大家都可以做，并不需要配有一万台计算机才可以做，而只有一台计算机就不能做。同时它本身对数学工具，对思维方式的拓展，也有很好的回报。

另外一个题目，我觉得也体现出非常好的品味，那就是在过去的 20 年里有很多成果的 variational inference，变分推理。这个是Michael Jordan 和 Martin Wainwright，还有很多他的组里的学生，包括我本人，都参与过并起到一定作用的一个工作。它是将原来的几个概率推理的 heuristics，包括 Belief Propagation，Mean Field 去进行不断地进化的数学描述，最后搞清楚了它的数学的本质是什么。通过了解了数学本质以后，又可以引入下一步的近似，比如说现在 variational model，本来在初始原理中是对后验分布的一个逼近，后来变成一个 variational network，自身变成了一个训练对象，然后就把整个 neural network 的工具也可以包含进来，以至于像现在的 autoencoder 或者其他 transformer，都可以通过类似的这种数学框架来训练。但是在本质上（因为有了原先的VI理论框架）我们可以知道它在做什么，同时又能够结合了不同的数学工具来丰富具体的实现。当然，这种睁着眼睛做研究的人现在在减少。其实 variational inference 的早期工作是较早把优化论和整个的凸优化以及泛优化理论的工具引入到machine learning 的一个工作，相当的优美。那篇文章本身虽然有近 300 页，篇幅很长，但是讲得非常透，让人能够看懂，并不难读，又让人可以继续有启发式地去工作。这里我不得不指出，近年来很多研究人员，特别是从事深度学习的不少人，文献读的很不够，甚至故意忽略前人成果，re-invent the wheel，热衷于二次包装、命名、创造新名词，结果造成了科研上很多不必要的困惑和神秘感，造成很多年轻学生知识上的狭窄和断层。我不认同这些人是科研工作者，他们所做的不是科研，更像是在创造流量，是网红和公众人物的打造方式。但是这种风格现在大行其道，对于严肃科研工作者这个群体伤害不小。

不只理论，在应用上也有很好的高品位工作。比如说大概十年前出现了参数服务器（Parameter Server）的研究。这是目前的大规模并行模型和计算的一个源泉。在 Hadoop 那时还是基于数据库的思路来设计的一个分布式的开源框架系统。到了参数服务器，就真正开始针对机器学习的要求进行了一套重新的设计。它使用一个虚拟的大型记忆中枢来存储和更新所有模型参数，中枢通过「主仆」网络架构连接于大量分站，每个分站掌握部分数据承担部分计算任务。原则上，虚拟记忆中枢的具体实现可以通过 key value store，支持物理上的中心或者分布实现，继承的是对于大型数据库操作行之有效的 Hadoop 逻辑概念和架构设计。但是当用到机器学习训练中，中枢和分站的关系不是简单的数据调动和映射，而是中枢对于来自所有分站的知识上的集中，包括集成、去噪音、压缩等等。所以就提出了对于通讯里同步和异步的要求，参数增量 delta 的计算、编码、输送、集成方法的各种创新，甚至理论上的各种分析工作，比如证明如果异步的话是否也可以达到收敛，需要多少步。其实我们 Petuum 的起点就是从这份工作开始的。我们在早期的参数服务器里面做了一些理论上和一些框架上的创新，带动了很多在系统领域，在理论领域，甚至是在算法领域里面的工作，到目前还在持续。

所以我觉得有品位的工作，它是有隽永的，长期的 impact，然后又能引发很多不同学科的融合，更重要的是它能够带动一代研究者去得到良好的全方位的训练。比如它可以在数学技术上，在编程技术上面，甚至在研究风格上面，能够通过做这样的题目得到训练，这些我觉得是好的。

有些题目也有广泛的应用，但未必是好的品位或者是好的题目，研究人员反而越研究越愚钝。比如抓了一个工具，然后就直接试错，或者是靠几个算法直接堆砌越来越大的模型，然后就出了一篇篇刷榜的所谓领先的东西，现在有很多研究是这样产生的。所以我们有时候会说，机器学习研究这个领域里面的很多学者，现在整体的理论水平和技术水平不如十年前，因为他们的功底不足了。就好像总弹电子琴了以后，弹奏技术实际上会下降，会变得不会弹钢琴了。钢琴里面还有很多不同的 touch，color，有很多表现力，是电子琴实现不了的。至少在我看来这样的研究不是一个好品位的研究，虽然它也许很有用，也很有空间，也需要，但是我不得不承认它在教育人才，在形成更广泛的 long lasting的学术沉淀上还是有很多不足。

在一个好的大学里，我们需要防止对于优秀品位、成果、师资的逆淘汰，不能只看文章，甚至引用的数量。一篇凝聚多年心血的 Annals，JMLR，或者 OSDI，SOSP，和一篇两三个月炼丹炉里出来的所谓「顶会」论文是不一样的。特别是现在这些「顶会」动辄每年每会两三千篇论文，何「顶」之有？

机器之心：根据您刚才的描述，好的研究势必就是少的，甚至一个人一生可能就做出一两个。

邢波教授：是。比如说像在物理里有一个研究，我觉得是极为出色的，就是杨振宁的杨-米尔斯（Yang-Mills）规范场理论。这份工作没有得到诺贝尔奖，但是到后来孕育了多个诺贝尔奖，而且未来还会有更多，因为一直在继续往下做。它对弱电统一规范理论，以及可能的 gravitation 引力规范理论提供了基础的框架，而且其中数学上的问题，非阿贝尔规范场和标准方程下的 Mass Gap 存在性，有人解决了以后可以获得数学菲尔兹奖或者 Millennium Prize，还推动了数学发展。我认为这个是一个好的有品位的题目。他提出了问题，提出了一开始的思路，然后让很多 future generations 可以一代一代地去研究下去，产生更多的新成果，还能发展数学工具和物理工具。AI 里面也有这样的题目，但是有志于做这样题目的人还是不多的。MBZUAI 作为大学，希望能够提供一个环境，让做这样研究的人得到认可，得到荣誉以及相应回报。

机器之心：您刚才谈了什么是好的研究品味，但是如何培养这种研究品味呢？

邢波教授：培养品味比用好的品味其实更难。它是一个更加上游的问题。我其实没有完全答案，但是我可以分享一些观察。不得不承认我们现在所处的社会环境，或者是整体的技术环境，不如古代或者是近代容易培养好的品味，这个是我的个人观察。因为品位或者是眼光或者是视野培养，不能急功近利，然后还需要有足够的独立性。现在的社交网络其实是把不急功近利和不受影响变得更难了。所以「慎独」很重要，这不是指孤僻，是要有一定的能力能够让自己去独立在喧嚣的世俗的世界之外。

在自然社会里面你可以想象两个场景：一种就是山高水长，与人既相连又隔离的风景区，像张家界，优山美地（Yosemite National Park）或者阿尔卑斯，云霞明灭，落叶寒泉，你会觉得很有趣，然后你有一种inspiration，愿意去往高处走，去到山上去看风景，也愿意下到河流里面去看个究竟。因为自然的非联通，会激发你去探索去欣赏的欲望；你也可以选择坐在那冥想（meditate），和自己相处，去思考。但是你又可以想象另外一个地方景象，就是一马平川，赤地千里，甚至是泥沙俱下，这很难让人有之前同样的感受。

现在的社交网，有点像是在人的社交生活中面对的一种泥沙俱下和一马平川，因为任何东西都给连在一起了，隔离起来很难，各种信息甚至会主动扑向你。水库要是不关闸，水全部联通了是无法积累势能发电的。现在戒网是很难的，大部分人网关了半小时就受不了，不要说过两天了。这很难让人静下心来去培养一种品位，或培养一种比较深的思考，甚至是很难做到连续思考同一个问题超过48小时或72小时。但是在古代，释迦摩尼会坐在菩提树下冥想，阿基米德在敌兵靠近时还在埋头演算不予理会，或者是很多贤人、僧人会有这么一个过程，高度专注去面对自己，或者是面对自然，或者面对上帝，才会有一种反省或者是一种内省。

曾子曰「吾日三省吾身」，我很难想象现在环境下如何三省吾身，一省都做不到了。所以我不知道在现在如何培养品味，如果想找个简单方式，也许给自己一点这种空间去面对自己，然后面对自己的问题去好好思考。当然多读好书也很重要，是一些比较启发式的，不见得完全是论文，可以是人文型的，可以是历史传记型的，去丰富自己的内心世界，丰富自己的精神世界。这样品位也许可以慢慢地去酝酿起来，这是我的一个感觉。当然勤奋也很重要，要尽量去多接触问题，让自己保持思维上的灵敏，有能力去获取灵感或者是去探索。

机器之心：您会固定抽时间进行冥想，或者是使自己处于一个像刚才那样比较安静的环境吗？

邢波教授：我在努力，这很难做到，因为这个不完全是由自己能控制的，一关网或者关机了以后，也会让想跟你去联络的人因为联络不上而得不到你的反馈指令而焦虑。尽管不太容易做到，但我还是尽量让自己能够有时间，甚至是有决心去关几天或者是关几个小时。这越来越难做到，但是也发觉越来越有必要，它实际上是很 rewarding 的 experience。不论多么忙碌，还是应该给自己留下这样的时间来思考。