马腾宇AI学界一颗冉冉升起的新星

本科毕业于清华姚班,博士毕业于普林斯顿大学,如今年仅31岁的马腾宇,作为 AI 学界的一颗新星正冉冉升起。

马腾宇目前担任斯坦福大学助理教授,其主要研究兴趣为机器学习和算法方面的研究,课题包括非凸优化、深度学习及其理论、强化学习、表示学习、分布式优化、凸松弛、高维统计等。

当然,导师的影响只是成功的一个方面,马腾宇自身的天分和勤奋让他在普林斯顿的五年时间里收获良多。

顾晓园表示,自上岗以来,志愿者们每天穿着防护服、戴着N95口罩和护目镜在集散点忙活,每晚回去,脸上都被口罩勒出“天使印记”。他们主要为外籍旅客提供多语种翻译服务,同时配合完成物资发放、数据统计和文案处理等工作,平均日工作时长10小时。起初几天人手不足,有的同学接连上了3天夜班,每天工作时长超过12个小时,最晚的一次,直到凌晨一点半才下班。

2月24日,全国人大常委会通过了关于全面禁止非法野生动物交易、革除滥食野生动物陋习、切实保障人民群众生命健康安全的决定。

“做科研,很重要的一点是去理解其他技术为什么本质上不可行。很多时候,科研之所以思路比较慢,原因在于你有许多选择,你不知道哪个选择是好的,也不知道哪个选择是坏的。这很糟糕。一旦你知道哪个选择是坏的,剩下可选的好的就不多了。所以做科研,很重要的一步是排除是坏的选择;其次是,要知道它为什么是坏的,这也比较重要,因为你如果不知道它为什么是坏的话,就很难把它变成好的。一个想法,如果你能知道它行不通的根本原因,一般情况下就不会很难通过针对性地修改这个想法得到一个更好的方案。所以我们这项工作模式上就是:我们发现一个想法没有效果,然后理解了这个想法失败的的原因,修正并提出一个新的想法;如果新的想法还解决不了问题,就找到问题,修正,循环往复,就是这样。”

天眼查显示,美柚成立于2013年11月19日,隶属于厦门美柚信息科技有限公司,是一个面向女性的经期服务工具,后逐渐发展成为女性健康、孕育科普、女性社区及电商购物等服务的互联网平台。目前,公司旗下有美柚、柚宝宝、柚子街等APP矩阵,据官方宣称,其拥有超过2亿女性用户。

在科研的实践当中,关注长期影响力是一个研究者能否成为真正科学家的关键一步。以如何看待失败的尝试为例,关注长期影响力的人会更积极地看待失败,因为从短期来看是失败了,但从长期来看这是有益的,失败了没有关系,如果你能够知道它为什么失败,在很多情况下你会改变它,让它变成一个成功的情况。

美柚上线初期,就因自身工具类App属性,吸引了不少流量,上线仅一周便流量过万,但同时,工具类属性也成为其最大的局限,工具并不能实现增值。如何留存用户,将流量变现,并形成商业闭环成为美柚的难题。

这支队伍中男生10人、女生20人,平均年龄21岁,全部都是“95后”,其中“00后”8人,大二、大三年级学生占77%。

从用户粘性和满意度来看,根据易观千帆发布的《2019年美柚APP产品分析报告》,数据显示,美柚位居行业第二名,人均单日启动次数为2.3次,排名第一的大姨妈为3.1次;美柚的人均单日使用时长为5.2分钟,大姨妈为6.1分钟。值得一提的是,这个赛道的玩家并不多。

马腾宇是清华姚班 2008 级毕业生

综上所述,美柚能否跨越重重考验,成功登陆科创板还要打一个问号。而如何找准市场定位,打破现有业务困境,构建自身品牌的护城河,成为陈方毅无法回避的命题。

马腾宇的博士论文,获2018 ACM 博士论文荣誉奖

实际上,这并非是美柚第一次被曝裁员,早在2019年6月18日,在脉脉上就有网友曝出杭州美柚裁员的消息,有美柚员工在该帖下称消息属实,就连应届生也被裁了。

“在学界的,我们有好几个做人工智能的学生,已经在大学任教的有两个,一个是在美国的杜克大学,一个是在美国的斯坦福大学做教授,他们都从事人工智能理论基础方面的工作。他们在过去的四五年,在人工智能理论方面已经非常非常出色,不然他们也不会被雇到这么有名的大学去,尤其是马腾宇,他刚刚毕业,能够被雇到斯坦福去,不管是中国学生还是外国学生都是非常少的。……他们确实可以说在人工智能领域是先驱,将来一定会在该领域留下非常深刻的痕迹。”

服务91名住校留学生

对已经回到自己国家的留学生,二外按照中外学生趋同管理的原则,根据时差,实施同步或专门在线教学,开展每日联络和健康打卡,个人健康防疫和心理调适的宣传教育,加强关心慰问,动态了解他们的学习和身心状况,及时通报中国和北京疫情防控的政策要求,加强防疫战疫“中国经验”的共享。

马腾宇开始读博的时间恰逢其时。2012年,Hinton和他的学生在ImageNet比赛中凭借AlexNet远超第二名10个百分点,由此人类进入了人工智能的新时代 —— 以神经网络为代表的深度学习时代。Sanjeev作为算法领域的领军人物,具有极为敏锐的嗅觉,意识到机器学习(特别是深度学习)将成为一个具有潜力的领域,因此从2012起便开始布局机器学习算法的研究。马腾宇进入普林斯顿后,选择了机器学习算法,与鬲融等人一起进行非凸优化的研究。

在普林斯顿期间,导师Sanjeev对马腾宇的影响也是极大的。马腾宇对他的评价是“Sanjeev是一个‘true scientist’”:

2014年,马腾宇获得了西蒙斯研究生奖(理论计算机科学方向),随后2015年获得了IBM博士奖学金,2016年获得了NIPS 最佳学生论文奖,2018年获得了COLT 最佳论文奖,其博士毕业论文也获得了ACM 博士论文荣誉奖,并在当年夏季收到了来自全球计算机Top 5中的四所高校(MIT、CMU、斯坦福、华盛顿大学)的 Offer 并最终选择去了斯坦福。

像之前以及之后的学长和学弟以及身边的同学一样,从姚班毕业的马腾宇在本科期间醉心于计算机算法的研究。2012年本科毕业后,他选择了在普林斯顿读博, 师从的Sanjeev Arora教授。

当前人工智能面临诸多困境,马腾宇以十年为期,他认为人工智能的理论基础仍然是一个非常大的困难,我们目前还很难理解算法到底做了什么,因此如何理解算法,如何更好地设计算法成了马腾宇最为关注的问题。正如他的导师Sanjeev,面对这样一个宏大的问题,他试图从各种角度(包括最优化、泛化、正则化等)进行逼近。如何通过理论思考来帮助机器学习,正是马腾宇的“long-term”问题。

“我觉得做科研的困难主要有三个:1)找到一个重要的方向;2)找到一个可以解决的问题;3)同时有足够的技术储备和技术创新。”

美柚也因此做了很多尝试,向内容、社区和电商业务发力,但并未形成自己的核心优势。

他表示,尽管当前的机器学习研究过程中,实验指导往往重于理论思考的指导。但长远来看,在随后的几年中,理论思考的指导价值将越来越凸显。正如在博士初期选择布局无人问津的非凸优化研究一样,马腾宇作为斯坦福的助理教授,现在也在布局机器学习理论的研究,一个更大的布局。

2018年,马腾宇与Yuanzhi Li 、Hongyang Zhang三人合作的论文《Algorithmic Regularization in Over-parameterized Matrix Sensing and Neural Networks with Quadratic Activations》发表在COLT上,并获得了最佳论文奖。而这篇论文与NIPS‘16的最佳学生论文类似,从开始做到投稿,前后仍然只用两个月的时间。在这篇主题为“正则化”的工作中,马腾宇他们直接follow了之前的一篇工作,但那先前的工作只能解决一个特殊问题,而马腾宇意识到如果沿着他们的思路做,可能会变得越来越复杂。意识到这一点本身非常重要。他说:

对于这部分学生,二外成立工作专班,点对点、一对一联系提醒,及时把北京市最新疫情防控政策、要求和关心关爱传递到每一位同学,提示认真做好个人防护。学校严格执行信息日报和零报告制度,每天与他们保持联系,掌握他们的身心状态。同时积极与国外合作高校联系,协调学生在疫情期间的学习安排,在做好健康防护的前提下顺利完成学业。

打开美柚APP,主要有推荐、记录、发现、柚子街和我五个功能板块。记录板块保持了美柚的工具属性,用户主要用于记录经期、备孕、怀孕和育儿。推荐功能是根据用户选择爱好推荐相应的内容咨询,发现则作为女性话题社区,除了安利好物穿搭之外,也给医美机构导流。

“Sanjeev是真的为了科学在做科研。对他关心的问题,他会细扣所有的细节,从证明,到实验,到写文章不容许一丁点的错误存在。另外,Sanjeev也非常的积极,非常的有耐心,在一个新问题上,他常常会锲而不舍,从各种可能的角度去尝试,即使最初所有的尝试都失败了,他也仍然会一遍又一遍地去尝试新的想法,直到最终成功。这是我从他那里学到的非常重要的一件事情。”

马腾宇表示:“在很多情况下,如果我能够真正地知道我为什么失败,很多情况下我都能够把它变成一个成功的情况。不过更多的情况是,我只能理解一点点为什么我会失败,然后从中汲取一点点的经验,但长期积累,我会理解为什么整个过程都不work。这样的话,我就能够摸索出另外一套思路。”

“其实没有太大的感觉。首先这是大家对我的工作的一个肯定,可能的原因是我的博士论文是比较早的一系列试图理解为什么non-convex optimization 可以解决机器学习的问题的工作;在此之前几乎没有这方面的研究。……但做科研,你的reward(受益或回报) 往往是非常滞后的。博士论文是五年工作的总结, 包括COLT’18 的最佳论文,其实是我们在2017年做出来的。做科研要考虑长期的reward,而不要考虑短期的reward。”

此外,北京二外20个语种的教师还用20种语言录制了两版《防疫小贴士》微视频,在机场、酒店、涉外商业楼宇播放。

NIPS’16最佳学生论文,2018年修订版

而2周后,又有网友在脉脉上发帖称,厦门美柚北京分公司3月11日裁员,据被裁者群里透露,将拉横幅向媒体传播此事,“事情搞这么大?美柚真的能上市吗?”该用户问。

“二外是一所国际化特色非常鲜明的高校。”顾晓园指出,目前,共有670名各国留学生,疫情期间,有113名留学生留在了中国,其中91名住在校内,他们分别来自56个国家。

今年2月29日,在陌陌平台上,一位网友发帖爆料称,“美柚北京分公司裁员,据说只留算法和运营,组建北京团队一年不到,年底奖金减半不说,疫情期间裁员,三小时不到全部谈完,有的还远程办公呢就被裁了,提前一点不透露,交接时间都不给,直接让走人。”该帖引发了网友围观与议论,一位ID认证为美柚员工的用户评论称“杭州的表示不要太羡慕,年终奖减半不假。”

此外,尽管美柚自称是“一家移动互联网行业的高新科技企业”,但是其业务是否符合科创板的定位还有待后续申报受理时的进一步问询。《上海证券交易所科创板企业上市推荐指引》要求保荐机构重点推荐的六大领域包括:新一代信息技术领域、高端装备领域、新材料领域、新能源领域、节能环保领域、生物医药领域。

如有外籍人士对北京防疫政策不了解,打12345咨询电话,来电将立即转接到二外进行三方通话,教师们进行在线翻译,对外籍人士普遍关心的“如何隔离”等政策、规定进行规范性表达,帮助外籍人士透彻理解防疫政策。所有教师上岗前对北京市防疫各项政策都进行了系统学习,他们相互配合实现无休息日值班,为疫情防控尽个人之力。

此刻的美柚显然已经为上市展开了行动,但摆在其面前的是裁员负面,业务、用户增长乏力和变现难题 。

在2012年的时候,大多数人还在用传统方法来做优化问题,这些基本上都是凸优化问题。而在深度学习的时代,算法通常需要通过解决一些非凸优化问题来找到最优的神经网络参数。理论上非凸优化是一个NP-hard问题,但实际中即使非常简单的算法也能表现很好。其中原因却少有人了解。马腾宇与鬲融等人是最早一批专注于解决这一问题的研究者。随后正是凭借对非凸优化问题的系统研究,马腾宇在 2018 年获得了ACM博士论文奖荣誉奖(Honorable Mentions),而鬲融也在2019年获得了斯隆研究奖。

然而,毋论马腾宇是否淡然,科研早期的荣誉对于一个科学家的成长却是必不可少的,这可以让年轻学者在攀岩科研高峰中充满信心。

多语种服务12345市民热线

2017 年,清华 “姚班” 创立者、中国科学院院士、中国首位图灵奖得主姚期智先生在谈及姚班教育的时候,曾提到:

据厦门市证监局披露,美柚与华泰联合于2019年11月28日签署了辅导协议,接受委托开始对美柚首次公开发行股票并上市进行辅导工作。美柚拟登陆科创板。

缺乏核心竞争力 能否上市打问号

而裁员之外,美柚正在遭受业务增长和用户增长的瓶颈。

而另一方面,“long-term”,正是马腾宇做科学研究的关键词。当谈到他的方法论时,马腾宇说,

疫情下被曝裁员 美柚业务、用户增长乏力

华泰联合证券有限责任公司关于《厦门美柚股份有限公司辅导工作备案报告(第一期)》 显示,2019年,美柚营业收入为6.17亿元,净利润为1.24亿元。而早前,陈方毅在内部年会上宣布,美柚2017年营收规模为4亿元,实现净利润1亿元。由此来看,两年内,美柚的净利润并没有得到显著提升。

雷锋网原创文章,。详情见转载须知。

2018年对29岁的马腾宇来讲是一个丰收年,COLT最佳论文、ACM博士论文荣誉奖、多所顶尖高校发出的橄榄枝……然而,受Sanjeev的影响,马腾宇对于这些荣誉表现的极为淡然。他表示

“从科研的style来讲,我比较在乎的是long term impact,我的课题选择也会受到这方面的影响。”

雷锋网(公众号:雷锋网)报道。雷锋网雷锋网

一个好的导师,对一个学者的研究生涯至关重要,因为导师的学术价值观和方法论会深刻影响其弟子在以后研究生涯中的态度。Sanjeev无疑是一位好的导师,他所带的学生毕业后大多都去到了美国顶尖大学任教,例如鬲融毕业后去到了杜克大学。

对于这些学生,二外成立工作专班,全力做好学习生活需求保障,安排专人24小时应急响应和服务管理,统一配发疫情防控物资,截止目前先后发放口罩4000个、洗手液121瓶、消毒纸巾110包。同时加大关心关爱力度,为他们过生日、赠送生日蛋糕,开展中国文化网络知识竞赛、太极健身等网络文体活动。还为滞留在武汉的赤道几内亚学生拨付困难补助,及时解决该生旅居疫区生活上的后顾之忧。

为让世界尽早听到中国政府和中国人民抗“疫”的决定和决心,二外公共政策翻译专家用时2天,高强度、高质量完成了全文翻译。译文最终提交给全国人大法律工作委员会,这也是全国人大英文官网第一次刊登非人大组织翻译的重要文件译文版本。(完)

目前,二外仍在国外留学的中国学生有775名,分布在43个国家。

马腾宇对算法理论的兴趣始于姚班。据马腾宇介绍,让他印象最深的是当时姚期智先生为当时姚班大一新生所开设的一门课程《mathematics for computer science》,姚期智在这门课程中,每个章节都会用一两个最为经典的案例让学生非常快速地意识到,为什么在计算机领域数学非常有用。姚期智在这门课程中并没有按部就班系统地介绍计算机理论领域的细节问题,最重要的则是激发起学生对计算机理论问题的兴趣。这就相当于在计算机理论研究这场寻宝游戏中,激发起学生们对“宝藏”的渴望,至于如何寻找这些宝藏,学生们则自会摸索。这对姚班学生的兴趣培养非常重要,马腾宇也深受影响。

顾晓园表示,在中共北京市委统战部的支持指导下,学校第一时间承接12345市民热线外语服务工作,迅速组建了一支涵盖20个语种、由27名中青年教师参与的抗疫语言服务工作团队,与12345市民服务热线外语服务部门对接。

一次的成功或许只是巧合,系列的成功则是实力和潜力的证明。

天眼查显示,美柚自成立以来,共经历了8轮融资。其中,2016年8月由普华资本、经纬中国、险峰长青等投资方领投的E轮融资,总共融资近10亿人民币。而这笔融资也给美柚戴上了独角兽的帽子。最近的一次融资发生在2018年12月19日,投资方为好未来,但具体金额并未披露。此后一直没有新的融资进来。

马腾宇等人首先在这篇工作中回答了这一问题。而事实上,马腾宇与鬲融、Jason D. Lee三人从开始做这项工作到提交论文,前后只用两个月不到的时间。虽然如此,这却是长久的积累,马腾宇差不多在一年前便意识到这个理解non-convex optimizatio的重要性,并偶尔尝试从不同的角度去解决它,但一直没有大的收获,直到2月份他看到一篇文章中的一个小技巧,突然灵感而至,很快便将这个问题解决了。对于这份经历,马腾宇总结到

事实上,这并非美柚首次传出上市声音。公开资料显示,早在2016年,美柚就曾计划赴美IPO,但随后考虑到其业务和用户主要集中在国内,便在E轮融资完成时宣布放弃赴美IPO,拆除VIE架构,回国上市。而在2018年2月份,美柚明确提出了要在国内上市的计划。美柚创始人陈方毅表示,要在三到五年内,把美柚打造成为一个“从小到大,每个人都知道”的国民品牌。

柚子街则是美柚的电商业务,主要为淘宝和天猫导流。翻看其页面展示的商品均来自阿里系,用户点击购买后,页面会跳转至淘宝网,最终用户在淘宝上完成下单和交易。类似模式和此前的蘑菇街非常相似,但这条路没能走通,而蘑菇街也因用户群体单一,产品种类有限,一直未找到适合自己的发展方向而陷入尴尬境地。尽管其选择了流血上市,但还是无可避免上市当天便遭破发的境遇,之后股价更是跌跌不休。

二外还开通了在线心理咨询平台,为在疫情期间有心理焦虑、恐慌或者其他问题的国内外学生提供心理咨询。目前同学们状态都很稳定。

当然,long-term并不意味着“空中楼阁”,十年写一篇文章。为了长期的计划,马腾宇在实验指导vs理论思考中取得一个平衡, 把这个long-term 分为了一系列非常小的问题,表现在成果方面便是一个个的topics,一篇篇的论文。目前马腾宇在斯坦福带着 5 名博士生以及数名硕士生,正每年发表十几篇论文的速度一步步迈向这个目标。

截至今日,二外志愿服务队累计服务时长2703小时,共为来自42个国家和地区的438名外籍旅客提供了多语种翻译。