2024年3月初,英伟达CEO黄仁勋( Huang)参加了斯坦福商学院SIEPR经济峰会以及View From The Top 系列活动。
两场公开的回放视频中,黄仁勋详细谈到英伟达的市场价值定位、AGI(通用人工智能)发展、AI算力的增长,以及如何通过人类反馈将AI 根植于人类价值观话题,而且他也回应了对于“皮衣黄”来历等。
以下是部分重要信息的整理摘录(如需全文、完整视频的请私信领取):
【1.英伟达的基因:创造技术、开拓市场】
30年前,我们创立了「加速计算」()公司。问题是,它用来做什么?它的杀手级应用是什么?这就是我们做出的第一个重大决定,也是红杉投资的项目,就是开发3D图形,技术将是3D图形,而具体应用程序将是电子游戏。当时,廉价的3D图形技术是不可能做到的。硅谷图形芯片产品要上百万美元,做廉价版本很难。而电子游戏市场当时的价值是零美元、不存在。你有一项难以商品化的技术,瞄准了一个尚未存在的市场。这个交集就是我们公司的创立点。
不过尽管如此,我们还是创造了点东西。接下来几年我们着手去开拓市场,为PC创造游戏市场。这花了很多时间,我们直到今天还在耕耘这块领域。我们意识到,为了把百万美元的计算机图形技术商品化,使其适配进入售价300美元、400美元、500美元范围的电脑,你不仅要创造新技术,还得发明新的计算图形处理方式,同时你还需要去开拓全新的市场。因此,我们必须不断创造新技术、新市场。
这种「创造技术、开拓市场」的理念定义了我们公司。我们做的几乎每件事情都是创造技术、创造市场。这就是人们说的「生态链」的本质。过去30年里,的核心领悟就在于:为了让别人购买我们的产品,我们必须亲手开拓这个新市场。这就是为何我们很早就开始布局自动驾驶、深度学习,以及在很多领域都处于前沿,包括计算药物设计和发现。我们在创造技术的同时致力于开拓所有这些不同领域的市场。
【2.未来成功早期指标:如何创造不存在的市场】
有十年的时间在投资未来,但市场并不存在。当时只存在一个市场:计算机图形。十几年的时间,推动我们今天发展壮大的市场根本不存在。那么,你该如何继续带领身边的所有人:公司、管理团队、优秀的工程师、股东、董事会、合作伙伴?你带着所有人上路,但根本没有市场存在的证据。这是真的非常非常的具有挑战性。
我们有个短语叫EIOFS「未来成功早期指标」的缩写,这就是解决问题的办法:你投资某个非常遥远的事情,还得有信念坚持下去。办法就是尽早找出你做的事情是否正确的那些指标。最开始得有一个核心信念,除非有什么改变了你的想法,否则你就要继续相信它,并且寻找未来成功的早期指标。
工作的重要性是未来市场存在的早期指标。这是我们公司的伟大能力之一。我们会问自己,这项工作是否有价值?它是否能在某个重要的领域推动科学的发展?注意,这是我从一开始就在强调的事情。从创立之初,我们就一直是注重工作的重要性而非市场规模。没有人需要做商业分析报告,没有人需要给我看损益表、或财务预测。唯一的问题是,这项工作重要吗?如果我们不来做的话,这些事还会不会发生?如果我们不做、事情也会自然发展,我其实特别高兴。因为你想想,你什么都不用做,世界却变得更好了。这是终极「懒人」的定义。从很多方面来说,你需要养成这种习惯。公司应该对别人总能做好的事情保持「懒惰」态度。如果别人能做,那就让他们去做吧。我们应该去做那些「如果我们不做就会出问题」的事情。你必须说服自己:如果我不做,这件事就做不成。这是一项艰巨而重要的工作,它会赋予你使命感。
我们公司一直在选择这样的项目,深度学习只是其中之一。其早期成功的迹象是吴恩达的人工智能识别猫。Alex检测出了猫,虽然不是每次都能成功,但至少能证明这条道路可能有所发展。我们分析了深度学习的结构,我们是计算机科学家,我们理解事物运行的原理。我们说服自己这个技术能改变一切。
【3.加速计算的本质:计算成本降到0】
我们在过去30年致力于一种新的计算形式,称为加速计算。通用计算并不适合每一个工作领域,所以为什么不发明一种新的计算方式,解决通用计算不擅长的问题,并且有效地将计算机的计算成本降低到接近零。当你能够将计算的边际成本降低到接近零时,我们就能以一种新的方式做软件,过去是人类编写,现在计算机编写,因为计算成本接近零。所以你可以让计算机去找到代表人类知识的关系和模式。这个奇迹大约在十年前发生了,我们看到了这一点,推动了这一点,将计算的边际成本降低到零。在过去的10年里,我们将计算成本降低了100万倍。
很多人说,,如果你将计算成本降低了100万倍,人们就会买得更少。但事实恰恰相反。我们看到,如果我们能够将计算的边际成本降低到接近零,我们可能会用它来做一些疯狂的事情。大语言模型,从互联网上提取所有的数字人类知识,放入一台计算机中,让计算机找出知识是什么,这是一个疯狂的概念,但如果没有将计算的边际成本降低到零,你永远不会考虑去做它。
H100芯片重70磅,它由35,000个部分组成。其中8个部分来自台积电。这个芯片取代了一个数据中心的旧CPU,变成了一台计算机。然而,它是世界上最昂贵的计算机。我们卖出了世界上第一个价值25万美元的芯片,但它所取代的,仅仅是连接所有这些旧计算机的电缆就比这芯片贵。这就是我们所做的。我们重新发明了计算,结果,计算的边际成本降到了零。这就是你刚刚解释的。我们将整个数据中心压缩成了这一个芯片。它非常擅长于尝试这种计算形式,我们称之为深度学习,它非常擅长于这个叫做人工智能的东西。
【4.未来大模型训练、推理一体化】
在未来的10年里,我们将深度学习的计算能力再提高100万倍。当你这样做时,会发生什么?现在我们训练模型然后应用模型,再训练、再推理;而在未来,我们将有持续的训练,甚至我们可以选择是否把训练的结果部署到应用中斯坦福商学院,甚至AI通过观看视频和文本,从所有的互动中,不断地自我改进学习过程和训练过程。
训练过程、推理过程、部署过程、应用过程将变得一体,这就是我们正在做的。你会发现一直在训练、推理和应用,这种循环将是持续的。强化学习将基于真实世界数据,这些数据是通过互动以及我们实时创造的合成数据获得的,计算机会一直在想,这是否有道理?就像当人类学习时,通过信息片段,然后从第一性原理出发,就开始在大脑中进行模拟和想象,那个未来的想象状态以现实的形式呈现给我们。所以,未来的AI计算机也会做类似的事情,它会合成数据,再进行强化学习,再继续以真实世界的经验为基础,它会想象一些事情,然后用真实世界的经验来测试,整个循环就是一个巨大的循环。这就是当你能够将计算成本降低到接近零时,会发生的事情。这和我愿意去更远的地方没有什么不同,因为交通的边际成本已经降到了零。我可以相对便宜地从这里飞到纽约。如果它需要一个月,我可能永远不会去。这和我们所做的每件事都是一样的,我们将计算的边际成本降低到接近零。
【5.英伟达推理芯片的竞争优势】
今天无论你使用,还是Co-pilot,都在进行推理,背后100%几乎都是用的的GPU,且大多数英伟达被使用的场景也已经变成推理,今天世界上几乎所有的推理都是(备注:云端推理)。
现在大家讨论,推理难还是容易?当你看训练时,你会觉得那看起来太难了,我不会去做,我只是一个芯片公司,但这个系统它看起来根本就不像芯片。只是为了证明新东西是否有效,你就要先投入20亿美元,然后你启动了它,发现可能并不能工作。你投入了20亿美元和两年时间,就为了证明它不work。探索新事物的风险对客户来说太高了。所以很多竞争对手倾向于说,那我们不做训练芯片,我们做推理芯片。
那我现在告诉你,推理芯片非常难。你以为,推理的响应时间必须非常快,但这还算简单的,因为这是计算机科学部分,算是容易的部分。难得部分是,推理的难点在于,部署推理的人的目标,是吸引更多的用户,将该软件应用于庞大的安装用户基础。因此,推理是一个关于安装基础的问题,这与在上开发APP是一样的,他们选择开发APP的原因是有一个如此庞大的安装基础,几乎每个人都有一部,所以如果你为那部手机编写了一个应用程序,将受益于它的用户量,能够惠及每个人。换成,我们的加速计算平台CUDA是唯一一个真正无处不在的加速计算平台,因为我们已经在这方面工作了很长时间。如果你为推理编写了一个应用程序,并且你将模型部署在架构上,它可以在任何地方运行,所以你能够触及每个人,模型能够产生更大的影响力。所以推理的问题实际上是安装基础问题,这需要巨大的耐心和多年的成功、以及对架构兼容性的持续贡献。
【6.关于ASIC的竞争】
我们不仅有来自竞争对手的竞争,我们还有来自客户的竞争。而且我们明明知道客户即将设计一款芯片来取代我们,我还要继续向他们展示我目前的芯片、下一代的芯片,以及之后的芯片。这样做的原因是,你要让他们相信你在这个领域是最好,他们才会不得不选择你。所以我们在与行业里的几乎每个人合作时都是完全开放的。
虽然你可以为特定的算法定制一款优秀的芯片(ASIC),但记住,计算不仅仅是关于,更何况我们正在不断地发明新的变种,除此之外,软件的种类非常丰富,软件工程师喜欢创造新玩意儿。擅长的是加速计算,我们的架构不仅能加速算法,而且是可编程的,这意味着我们可以加速量子物理、加速所有的流体和粒子代码等等广泛领域,数据中心生成式AI只是其中之一。对于那些希望拥有大量客户的数据中心来说,无论是金融服务还是制造业等,我们都是一个最棒的标准。我们存在于每一个云服务中,存在于每一个计算机公司中。因此,我们公司的架构经过大约30年成为了一种标准。这就是我们的优势。
如果客户能够有更具成本效益的替代方案,我甚至会为此感到惊讶。原因是,当你看到现在的计算机时,它不像笔记本电脑,它是一个数据中心,你需要运营它。因此,购买和销售芯片的人仅仅考虑的是芯片的价格,而运营数据中心的人考虑的是整个运营成本、部署时间、性能、利用率以及在所有这些不同应用中的灵活性。总的来说,我们的总运营成本(TCO)非常好,即使竞争对手的芯片是免费的,最终算下来它也不够便宜!我们的目标是增加如此多的价值,以至于替代品不仅仅是关于成本的问题。当然,这需要大量的努力,我们必须不断创新,我们不能对任何事掉以轻心。
【7.英伟达愿意做定制ASIC吗】
我们是否愿意定制化?是的,我们愿意。为什么现在的门槛相对较高?因为我们平台的每一代产品首先有GPU,有CPU,有网络处理器,还有两种类型的交换机,包含五个芯片。人们以为只有GPU一个芯片,但实际上是五个不同的芯片,每个芯片的研发成本都是数亿美元,仅仅是为了达到我们所说的“发布”标准。然后你必须将它们集成到一个系统中,然后你还需要网络设备、收发送器、光纤设备,以及大量的软件。运行一个像这个房间这么大的计算机,需要大量的软件,所以这一切都很复杂。
如果定制化的需求差异太大,那么你必须重复整个研发过程。然而,如果定制化能够利用现有的一切,并在此基础上增加一些东西,那么这就非常有意义了。也许是一个专有的安全系统,也许是一个加密计算系统,也许是一个新的数值处理方式,还有更多,我们对这些非常开放。我们的客户知道我愿意做所有这些事情,并认识到,如果你改变得太多,你基本上就全部重置了,浪费了近百亿美元。所以他们希望在我们的生态系统中尽可能地利用这些。
【8.什么时候能实现AGI?】
我会给出一个非常具体的答案,但首先让我告诉你一些正在发生的非常令人兴奋的事情。首先,多模态。我们正在训练的这些模型是多模态的,这意味着我们将从声音中学习,从文字中学习,从视觉中学习。这很重要,因为人工智能需要与人类价值观对齐。我记得我们之前有大型语言模型,真正创新的地方是强化学习、RLHF,将AI锚定在我们认为好的人类价值观上。现在,你能想象,你生成图像和视频,AI知道手不会穿透讲台,踩在水上时你会掉进去,所以现在AI开始锚定在物理上。目前,人工智能必须通过观察大量不同的例子,理想情况下主要是视频,来学习世界中的某些属性。它必须创建一个所谓的世界模型。我们必须理解多模态,还有许多其他模态,如我之前提到的基因和氨基酸、蛋白质和细胞等等。
其次,AI会具有更强的推理能力。我们人类所做的很多推理,都编码在常识中。常识是我们所有人类认为理所当然的能力。互联网上有很多我们已经编码好的推理和知识,模型可以学习。但还有更高层次的推理能力,例如现在你问我问题,大部分的问题,我的确像生成式模型一样快速生成,我不需要太多的,但有些问题,我需要想想,也就是规划,我可能是在脑海中循环它,提出多个计划,遍历我的知识树,修剪我的树,“这个没有意义,但这个我可以去做”,我会在脑海中模拟仿真运行它,也许我会做一些计算等等。我的意思是,今天的很多“long ”,AI并不擅长。你输入到的一切,它都会立即回应。我们希望输入到的某个问题,给它一个目标,给它一个使命,它能思考一会儿。这种系统,计算机科学称之为长思考或规划。我认为我们正在研究这些事情,你将看到一些突破。所以在未来,你与人工智能的互动方式将会非常不同。有些只是给针对一个问题直接给出答案;有些是说,这里有一个问题,AI去工作一会儿,明天告诉我答案。它会做尽可能多的计算。你也可以说,我给你这个问题,你可以花费1000美元,但不要超过这个数额,然后它会在明天给出最好的答案。
所以,回到AGI的问题,AGI的定义是什么?事实上,这现在是最先需要回答的问题。如果你说AGI是一系列测试的列表,如果我给你一个AI很多数学测试、推理测试、历史测试、生物学测试、医学考试,以及律师考试,甚至包括SAT、MCAT等等,你把这些测试列出来,摆在计算机科学行业面前,我猜在5年内就会在每一个测试上都做得很好。所以,如果你对AGI的定义是通过人类的测试,那么我会告诉你斯坦福商学院,五年我们会通过所有的测试。但如果你稍微换一种方式问我,AGI是拥有人类的智能,那么我不确定如何具体定义人类的所有智能,没有人真正知道,因此这很难实现,但我们都在努力让它变得更好。
【9.为了AGI还需要多少额外的芯片产能?】
关于预测,实际上我很糟糕,但我非常擅长基于第一性原理推理。我不知道需要多少晶圆厂,但我知道的是,我们今天做的计算,信息是别人写的、或者由某人创造的,基本上是预先记录下来的。我说的是每件事,每个字、语音、视频,都是检索式的,有人写好了它并存储在某个地方,然后你去检索它,你知道的每一种模态过去都是这样。在未来,因为我们的AI可以接入世界上所有的最新新闻等,也就是可以检索,它理解你的上下文,意味着它理解你问什么,关键是,大部分计算将是生成式的。今天的100%内容是预先录制的。如果在未来,100%的内容将是生成式的,问题是这将如何改变计算的形态。
所以,这就是我推理的方式,比如我们需要更多的网络吗?我们需要更多的内存吗?简单说,我们是需要更多的晶圆厂。然而,我们也在不断改进算法和处理过程,效率有了巨大的提升。并不是说计算的效率就是今天这样,因此需求也就是这么多。实际上,我每10年都在把计算能力提高一百万倍,而需求却增长一万亿倍,这两者必须相互抵消。然后还有技术扩散等等,这只是时间问题,但这并不改变这样一个事实:总有一天,世界上所有的计算机都将100%地改变,每一个数据中心,价值数万亿美元的基础设施,将完全改变,然后在这之上还会建造新的基础设施。
【10.关于地缘政治风险】
地缘政治风险?我们几乎是地缘政治风险的典型例子。原因是我们制造了一种非常重要的人工智能工具,而人工智能是这个时代的界定技术。所以美国完全有权决定这种工具应该限制在它认为应该限制的国家。美国有这个权利,他们行使了这个权利。
那么,这与我们有什么影响?首先,我们必须理解这些政策,我们必须保持敏捷,以便我们能够遵守这些政策。一方面,它限制了我们在某些地方的机会,另一方面,它在其他地方打开了机会。
在过去的6到9个月里发生的一件事是,每个国家、每个社会都在觉醒,他们必须控制自己的数字智能,印度不能外包它的数据,让某个国家将其转化为印度智能,然后将这种智能进口回印度,这种觉醒,即主权AI,你必须致力于控制你的主权AI,保护你的语言,保护你的文化,为你自己的行业。
【11.如何面对市值蒸发80%?】
当股价下跌80%,我在那段时间的反应和过去一周的反应完全一样。之前你问我本周的事我的反应没有任何变化。本周与上周、或前一周毫无不同。当然,股价跌了80%确实有点难堪。你只想穿一件「不是我的错」的 T 恤出门。更糟的是你不想起床,不想出门。这些都很真实,但随后你还是得投入工作。
我在同一时间醒来,用同样的方式规划我的一天。我回归初心:我相信什么?你必须始终牢记核心,你相信什么?最重要的事情是什么?一项项确认。这样做有帮助。家人爱我吗?是的,很好。你就得逐条确认。再回到你的工作核心,继续工作。然后每一次对话都回到工作核心,让公司的注意力集中在核心上。你坚信吗?有什么东西改变了吗?股价变了但还有其他东西变了吗?物理定律变了?万有引力变了?那些促使我们做出决定的事情,那些假设、那些信念有变化吗?因为如果这些东西变了,那一切都得变。但如果它们不变,你也什么都不需要改变。继续走下去,这就是坚持的办法。
【12.扁平化组织结构,有50 个直接下属】
CEO应该拥有最多的直接下属,因为能直接汇报给CEO的人需要的管理最少。若CEO的下属很少,在我看来毫无道理,除非说,CEO知道的信息最有价值、最机密。他只能告诉给两三个人,这些人也只能告诉另外几个人。我不认同这种「你掌握的信息就是权力」的文化或环境。
我希望我们都能为公司做贡献,我们在公司中的地位应该取决于我们解决复杂问题的能力、带领他人取得卓越成就的能力、激发他人灵感的能力、赋能他人和支持他人的能力。这才是管理团队存在的目的——服务其他员工,创造有利条件让优秀人才愿意来为你工作,而不是去其他令人赞叹的高科技公司。他们选择、自愿来为你工作。因此,你应该创造出能让他们从事毕生工作的条件,这就是我的使命。
这种条件会带来很大的自主性。只有当你了解环境时你才会获得这种自主性,对吗?你必须了解所处状况的背景才能想出好点子。我必须创造让你知晓背景情况的环境,你得有知情权。得到知情权的最佳方式是减少信息扭曲的层次。这就是为什么我很经常在这样的场合下进行推理。我会说,这是最初的事实,这是我们拥有的数据。我要这样进行推理,以下是一些假设。以下是一些未知因素,以下是一些已知因素。所以你就进行推理了。现在,你已经建立了一个高度自主的组织。
有3万人。我们是世界上最小的超级公司。但每位员工都有很大自主权,每天帮我做明智决定。原因是他们理解我的状态。他们理解我的状态。我对人很透明,我相信我可以把信息托付给你。信息可能难理解、情况很复杂但我相信你可以应付。我对很多人说过「你们是成年人、可以应付这个的。」。我想这样做。我想为人们创造能够做到这一点的条件。
【13.关于皮衣】
这是我妻子给我买的。她从我17岁起就认识我,她认为一切都会让我皮肤痒。因为我不做任何购物,一旦她找到不会让我痒的东西,就会买很多。如果我看我的衣柜,整个衣柜都是衬衫,所以这就是她给我买的。如果我不满意,我可以自己去购物,但对我来说足够好了。