TL;DR:
作为享誉全球的“AI教母”,李飞飞在巅峰时期选择从学术界转向创业,创立World Labs,致力于攻克被她称为“AGI缺失拼图”的空间智能。她将个人无畏的成长历程与对AI未来的深邃洞察融为一体,鼓励探索产业无法企及的基础问题,以强烈的求知欲和“从零开始”的创业精神,引领AI走向更广阔的现实世界。
午后的阳光透过巨大的落地窗,洒落在简洁而现代的演播室里,映照出李飞飞那双沉静而充满力量的眼睛。她语调温和,却字字珠玑,每一次停顿都仿佛在深思熟虑着AI这门学科的下一个里程碑。对于许多人而言,从斯坦福大学人工智能实验室的掌舵者,到如今初创公司World Labs的创始人兼CEO,这一转身显得突然。然而,对于李飞飞而言,这不过是她漫长而无畏的探索征途上,又一次“从零开始”的实践。她正在全速冲向她所认定的AI下一个“北极星”问题:空间智能。
“如果它很容易,那早就有人解决了。”1 她用这句话概括了投身AI前沿的决心。这并非空谈,她的整个职业生涯,从ImageNet的横空出世,到如今直面三维世界的复杂性,无不践行着这份对“疯狂”难题的执着。
像素铸梦:从ImageNet到世界的故事
回溯到18年前,人工智能和机器学习尚处于“寒冬”之中,数据匮乏,算法步履维艰,公众对“人工智能”的概念一无所知。那时的普林斯顿大学助理教授李飞飞,却怀揣着一个大胆的梦想:“让机器能够‘看见’。”她深知,视觉不仅是感知,更是理解世界并采取行动的基础。于是,一个后来载入AI史册的项目——ImageNet,开始在她脑海中孕育。
ImageNet的意义远不止于一个大规模图像数据库。它不仅开源了海量数据,更开创性地通过全球挑战赛,汇聚了全世界最聪明的头脑。“最初几年,比赛的主要目的是设定基准线,当时最低的错误率大约在30%,远谈不上令人满意。”1 但李飞飞和她的团队坚信数据驱动的力量。直到2012年的一个深夜,ImageNet挑战赛迎来了“AlexNet时刻”:Hinton团队的卷积神经网络,首次将数据、GPU和神经网络三者联结,以惊人的低错误率震惊了整个领域。那三年,她和团队的坚守,终于看到了数据播下的种子,开出了足以改变AI轨迹的花朵。
ImageNet解决了物体识别,但李飞飞的梦想远不止于此。在她读研时,便萌生了一个“百年难圆”的梦想——为世界“讲故事”。她曾以为,要让机器像人类一样,不仅识别物体,更能理解并描述完整的场景,将耗尽她一生的精力。然而,深度学习的飞速发展远超想象,随着Andrej Karpathy等学生的加入,视觉与自然语言的融合成为可能。到2015年,她与团队发表的论文,让计算机首次能够为图像生成文字说明。“我就在想:我一生的目标就这么实现了吗?对我们来说,这是一个难以置信的时刻。”1 仅仅几年后,Andrej Kaparthy随口一句“算了吧,这个世界还没准备好”的玩笑——关于让机器从一句话生成图像的设想,如今已通过生成式AI变为现实。
“AI的发展速度令人难以置信。”1 李飞飞深感幸运,她的整个职业生涯都参与并推动了这一变革。但她的视野并未止步于此,她看到计算的发展历程已从“对象”走向“场景”,如今更上升到“世界”这一概念。
攻克“世界”:空间智能的硬核挑战
去年11月ChatGPT的问世,为生成式模型打开了新纪元,也促使李飞飞这位资深研究者大胆思考下一步。“作为计算机视觉科学家,我的灵感很多时候来自于进化和脑科学。”1 她开始寻找下一个“北极星”问题。人类语言的进化不足百万年,但处理三维世界的视觉智能却历经5.4亿年的漫长演化。三叶虫水下视觉的形成,拉开了动物智能角逐的序幕。这让她坚信:“解决‘空间智能’——理解三维世界、生成三维世界、在三维世界中推理和行动——是AI的根本问题。若没有空间智能,通用人工智能(AGI)就不完整。”1
她口中的“空间智能”,意味着超越平面像素和纯语言的“世界模型”,真正捕捉三维结构和空间理解力。为此,她选择在AI巅峰之际,从学术界走出来,创立了World Labs,并集结了一支“梦之队”:Chris Lester(Pulsar创建者)、Justin Johnson(系统工程天才)和Ben Mildenhall(NeRF论文作者)。这是一场真正的硬仗。
“语言在本质上是一维的,纯粹是生成性的。”1 她解释道,而现实世界则复杂得多:首先,它是三维的,组合爆炸的程度远超一维序列;其次,感知视觉世界是一个将三维压缩到二维的“病态”投影过程,需要多模态传感;最后,现实世界不仅限于“生成”,它还必须遵守物理规律,存在各种真实的交互和限制。更棘手的是,语言数据在互联网上随处可见,但空间智能的数据却“存在于我们脑海中”,难以获取。
然而,正是这种“近乎疯狂”的难题,让她感到兴奋。World Labs的目标是构建一套新的基础模型,其输出是三维“世界”。其应用场景同样广阔,从设计师、建筑师、3D艺术家等创作领域,到机器人学习、营销、娱乐乃至元宇宙。“我认为硬件是目前元宇宙障碍的一部分,在元宇宙中需要内容生成,而内容生成需要世界模型。”1 她笃信,只有攻克空间智能,元宇宙才能真正“运行”起来。
无畏者说:那些“从零开始”的勇气
对李飞飞而言,从学术界到创业者的转型并非一时兴起,而是她人生轨迹的自然延续。她的经历,是“从零开始”的生动注脚。
19岁那年,为了支持家人并负担普林斯顿大学物理专业的学费,她开了一家干洗店。“用硅谷的说法,就是我‘创办并运营’了一个洗衣店,同时担任CEO、出纳……七年后我把它卖了。”1 这段看似与AI无关的经历,却锻造了她骨子里的创业精神和解决实际问题的能力。她曾多次选择到没有计算机视觉教授的院系任职,因为“从不害怕开辟道路”。后来,她在Google学习业务和云服务,又在斯坦福内部创办了“以人为中心的AI研究院”(Human-Centered AI Institute),当了五年“校园创业者”。这些看似离经叛道的选择,让她更加清晰地认识到:“我就是个创业者。我喜爱‘从零开始’的感觉:忘掉过去的成就,也别在意他人评价,潜下心来,脚踏实地去做,这是我的‘舒适区’,我乐此不疲。”1
这种无畏的探索精神,不仅塑造了她自己,也成为她识人育人的核心标准。
伯乐识马:培养与筛选“思想无畏者”
在AI领域,李飞飞被尊称为“教母”,不仅因为她的学术成就,更因为她培养了一批批杰出的AI领袖,如Andrej Karpathy、Jim Fan(现任英伟达)、ImageNet的合著者邓嘉。“他们不仅成就了自己,也让我成为更好的导师和研究者。”1 她谦逊地将此归结为自己的幸运,但无疑,她独特的育才之道功不可没。
当被问及如何看出这些学生会改变AI领域时,李飞飞坦言:“我认为他们有一个共同点,我也鼓励在座每一位以及那些正在招聘的创业者们思考这一点。我的标准之一就是思想上无所畏惧。”1 她不在乎背景和具体问题,只看重是否“勇于面对艰难课题,全身心投入并用自己认为合适的方式去解决”。这是成功者的重要特质,也是World Labs招聘的核心准则。他们正在大量招聘工程、产品、3D和生成式模型人才,寻找的正是那些“无所畏惧、热衷于攻克空间智能”的人才。
边界之外:对AI未来与教育的深思
面对读博学生的提问,李飞飞的回答并非一句简单的“追随兴趣”。她洞悉AI研究环境的变化:“学术界已经不再拥有大部分AI资源。现在算力、芯片和数据更多集中在产业界。”因此,她给博士生的建议是:“去寻找那些‘北极星’问题,即那些产业界即便投入更多资源也难以触及的基础性问题。在学术界,你无需依赖巨量芯片,就能取得突破性进展。”1
她指出了几个充满巨大可能性的方向:“跨学科AI”(尤其在科学发现领域)、理论层面的“可解释性”和“因果关系”(AI的能力已超越现有理论)、“表示学习”以及“小样本学习”。这些都是在算力竞赛之外,学术界可以大展拳脚的领域。
至于AGI(通用人工智能)的定义,李飞飞保持着一份难得的谦逊与清醒。“我不知道AGI与AI的边界在哪里。”1 她认为,行业里常将AGI视为超越AI的概念,但对她而言,AI的终极目标一直是创造能够像人类甚至超越人类的智能机器。她更倾向于以大脑为例,将其视为一个整体,但也包含布罗卡区、视觉皮层等不同区域,避免在定义上过早设限。
对于开源,她的立场是包容的多元共存。“我认为,生态系统在多种策略同存时会更健康。我并不坚持一定要开源或闭源,这取决于公司的商业策略。”1 她以Meta为例,其大规模开源是为了繁荣生态系统,而非直接销售模型。但她强调,无论是学术界还是私营部门,对开源的投入都“至关重要,应当被鼓励和保护”。
而针对空间智能所需的数据,她透露World Labs将采取“混合方法”。她强调:“大量数据很重要,但高质量数据也同样关键。毕竟,如果数据质量不高,还是‘垃圾进,垃圾出’。”1
身份与韧性:在不同中铸就力量
在著作《我所看见的世界》中,李飞飞曾坦陈作为移民女孩和STEM女性所面临的挑战。当被问及是否曾在职场上因少数群体身份而感到压力时,她选择了一个富有哲理的回答:“其实,重要的并不是你归属于哪种大类,而是在某些时刻,你都会觉得自己是唯一不同的人。我也有这样的经历。”1
但她将这段经历化为一种力量:“从小移民到美国,我学会了接受一点,那就是:这就是我。”她鼓励大家:“无论你们即将或正在踏上什么样的旅程,都会有软弱和迷茫的时刻,尤其是在创业阶段。有时我也会想‘天哪,我到底在做什么’,但只要专注行动,就会像梯度下降一样,一步步逼近最优解。”1 这种将个人奋斗与科学原理相结合的思维方式,展现了她独特的智慧和韧性。
结语:永不停歇的“北极星”追寻
李飞飞的故事,不仅仅是一位顶尖科学家如何推动AI技术发展的历程,更是一个关于勇气、好奇心和不懈追求的故事。从解决图像识别的“小”问题,到挑战三维世界的“大”难题;从一个异乡的洗衣店老板,到引领全球AI浪潮的“教母”,她始终保持着对未知领域的热情和对基础科学的敬畏。她的“无畏精神”不仅仅是她个人的特质,更是她赋予学生、合作伙伴乃至整个AI社区的宝贵财富。
在AI即将触及“世界模型”的今天,李飞飞正以她那份对“疯狂难题”的执着,和“从零开始”的创业激情,再次站在了时代的前沿,引领着AI这艘巨轮驶向一片更为广阔而充满挑战的深蓝。