分类目录归档:Technology

何清涟:台积电美国建厂阻滞竟是因为DEI

Reading Time: < 1 minute

何清涟

台积电于2020年5月宣布在美国亚利桑那州设厂,2021年11月宣布在日本设厂,但日本厂后发先至,于今年2月24日正式落成,成了台积电海外扩厂的第一家。而几年前成呼啸之势的美国亚利桑那建厂,不仅第一家再度推迟,第二家更是纸上谈兵。美国媒体纷纷报导这家全球最大晶片制造商及其在拜登提振美国制造业中所扮演的角色再次遭遇挫折,进一步打击了拜登政府推动在美国本土生产关键零部件的计画,对于合作迟滞的原因,仍然是重复数年以来的老调,如果不是今年3月7日The Hill登载的那篇《DEI废除了CHIPS法案》(DEI killed the CHIPS Act),美国朝野连什么是真正的阻滞原因都不敢面对。

美媒重复唠叨台积电美国建厂阻滞表层原因

先简单解释一下何谓,Diversity-多样性;equity-公平;inclusion-包容性,缩写为DEI,这是美国如今新身份政治的核心理论,但不能按照字面简单理解,以为是针对所有种族与人群的公平包容,而是针对所谓「受害者」曾经的「受迫害」经历,在政府、军队及学术部门甚至企业的升职竞争中甚至司法中优先考虑。概言之,美国左派的新身份政治,是按照受害者理论构建的一个按身份赋权的等级金字塔,谁是最大的受害者,谁就居于顶端,从2020年以来,这个身份金字塔的成员从BLM、穆斯林、女权增加到lgbtqi+,等级处于不断调整之中,女权现调整至最后。

关于台积电在美国投资不顺,美媒翻来覆去说了好多原因,2023年10月,英国《金融时报》综合各种资讯,发表一篇长文梳理了各种原因之大全,比如台积电赴美国设厂在施工和劳动力方面遭遇「文化上的水土不服」,导致项目受阻;在工程发包方式上,美国和台湾岛内的方式明显不同,引发了许多摩擦;此外,台积电在美国一直难以找到足够多的熟练工来安装关键的精密设备,还一度从台湾增派了500名专家赴美协助这一阶段的工作,这曾引发亚利桑那州工会不满,指责台积电只想借此引进廉价外国劳工。媒体因此发挥说:美国工人无法象台积电工人那样辛苦高强度工作,台积电得考虑一下美国工人的习惯。

最新的消息是《华尔街日报》今年3月18日报导,除了重复此前强调的部分原因,只多了一条:美国官员和分析师称,台积电强调专案面临诸多问题并推迟量产时间,可能是一种谈判策略,目的是最大限度地扩大其能够获得的《晶片法案》资金的份额。

如果不是早于WSJ报导之前的11天,The Hill那篇《DEI废除了CHIPS法案》,恐怕外界还被媒体蒙在鼓里,对台积电、英特尔、三星等晶片公司纷纷弃美不明就里—— BTW,这The Hill不是右媒,是左媒,但比《纽约时报》更关注现实,因此,这家媒体刊登这篇文章不是否定DEI的推行,仅仅只是指出在此事上推行DEI影响了专案的成功。

DEI与资本主义的市场竞争完全不相容

《DEI废除了CHIPS法案》的作者是迈特·科勒(Matt Cole),他是Strive Asset Management (总部位于俄亥俄州)的首席执行官兼首席投资官。他在文章的开头就指出:尽管拜登政府最近承诺将最终放松对390亿美元CHIPS法案拨款的资金限制,以鼓励美国的半导体制造,但不到一周后,英特尔、台积电、三星都推迟了它们在美国各地晶片工厂的建设。原因是什么?迈特·科勒指出,就是晶片法案硬生生地嵌入了DEI的就业内容,作者指出,DEI是一种痴迷于身份的教条,以「多样性、公平和包容性」为核心,前一向谷歌按照DEI设计的AI大模型Gemini拒绝将「美国开国元勋」的肖像画成白人,成了美国著名的闹剧;但更令人担忧的是,DEI还感染了为从人工智慧到导弹等一切产品提供动力的晶片供应链,危及国家安全。以下是该文谈到的几条:「如何解释晶片制造商明显的忘恩负义(指不领政府承诺数亿巨额补贴的情)呢?在很大程度上,是对CHIPS法案中嵌入的DEI要求感到失望。《CHIPS》和《科学法案》的资金一直停滞不前。他们没有注意到的是,这是因为《CHIPS法案》中充斥着DEI内容(原文称DEI Pork以表示作者的嘲讽之意),以至于它无法推动」。

企业经营者都知道,人力资本最基本的要求是资质合格,这是保证企业生存与赢利的基本条件,但「《CHIPS》法案包含19个旨在帮助少数群体的条款,其中包括在国家科学基金会设立首席多样性官,以及优先考虑与所谓的『少数群体服务机构』进行科学合作的条款。名为『机会与包容』的条款指示商务部与少数族裔企业合作,并确保晶片制造商『增加经济上处于不利地位的个人对半导体劳动力的参与』。该部门将此解释为多元化的许可。其情况说明书声称,多样性『对于加强美国半导体生态系统至关重要』,并补充道,『至关重要的是,这必须包括大量投资,为历史上服务不足的社区的美国人创造机会』」——简言之,企业雇佣的劳动力是否合规,不是美国拜登政府考虑的首要问题,让企业按照DEI原则照顾不合规的少数族裔优先就业是第一要务。

迈特·科勒指出,左派有很多要求,要求晶片制造商提交详细的计画,以教育、雇用和培训大量女性和有色人种,以及「参与正义的个人」(通常是法律上的「前科犯」)。他以亚利桑那州为例,在该州,「《晶片法案》中的DEI专案比实际晶片部分进展得更好。台积电沮丧地发现,由于公平是如此重要,人类最复杂技术的制造商必须依赖来自所有这些代表性不足群体的当地劳动力和学徒」,例如:晶片制造商必须确保雇用大量女性建筑工人,尽管美国建筑工人中女性的比例不到10%。他们还必须确保尚不存在的女性建筑工人和工程师的托儿服务。他们必须取消学位要求并制定「多样化的招聘名单政策」。对这个劳动配额制度,厂商必须制定计划,通过「与实地利益相关者密切、持续的协调」来完成这一切。在DEI理念的折磨下,台积电这些世界上最好的晶片制造商(包括英特尔在内)厌倦了成为《晶片法案》政治游戏中的棋子,只好「悄悄放弃了美国」。他们最后终于明白,政府的补贴只会在这些DEI项目一项项合规之后才一点一点地发放,企业的效率、速度根本不在DEI方案考虑之内。

这些问题只要去找厂商就会了解,但美国媒体不会报导,因为这会触怒当政的美国民主党,更何况美国大多数主流媒体就是DEI的鼓吹者与执行者。

台积电在美日两国建厂的遭遇说明什么?

台积电在美国亚历桑那州的建厂遭遇,实因《CHIPS》法案附带的雇佣条件完全不符合企业人力资本的要求。台积电在日本熊谷建厂成功的原因,无论是日本还是台湾媒体,都归功于日本政府几乎从零开始一路开绿灯,让中央到地方都以最快效率开始进展作业,比如,日本政府与企业紧密合作、资金补助到位及劳工品质出色,且日本在半导体设备、材料等领域上也具有优势,环环相扣让日本厂能够超车美国厂,提前到位。台湾中时评论干脆还加上一条,日本的成功模式突显亚洲在制造业的优势,欧美国家想要在短时间复制的难度相当高。所有评论未曾想到竟然是拜登政府的DEI政策成了最大的阻滞因素。

半导体工厂制造1块晶片需要400~600道工序,从材料、设备到代工生产,都建立在全球分工的基础上。对于厂家来说,必须使用技术熟练的技工,否则就会象郭台铭在印度遇到的情况:产品不合格率大大增高。The Hill这篇文章揭露出来的真相又简单又残酷:美国拜登政府强调要强化民主(国家)集团供应链,以与中国对抗竞争;但其戮力推行的新身份政治DEI理念却在拆自己的台:晶片制造技术进步很快,厂商竞争求胜的秘诀就是速度与效率,DEI理念考虑了新身份政治的特权人群众就业优先与权益保障,独独不考虑企业的死活。

工作肯定会消失,但原因不在于技术

Reading Time: < 1 minute

上月围绕“萝卜快跑”引发的热议,折射了AI技术进步导致的社会矛盾,特别是催生了新一轮的对技术取代人的恐惧。

害怕被新技术取代并不是最近才出现的现象

公元前3500年左右,美索不达米亚引入了制陶轮,这让工匠们感到担忧。

大约1455年,谷登堡印刷机问世后,抄写员的技能变得无关紧要。

工业革命结束了数百万人的农业生活方式,一个名为“卢德派”(Luddites)的秘密誓言组织试图摧毁纺织机,这样织工的技能就不会白白浪费。

如今,“卢德分子”这个词被用来侮辱任何抵制技术创新的人;它意味着墨守成规者、无知的人、进步的障碍。但记者兼作家布赖恩·莫森特(Brian Merchant)的新书《机器中的鲜血》(Blood in the Machine,2023)认为,卢德主义并不反对技术本身,而是要在自动化面前维护工人的权利。

《机器中的鲜血》的出版正值我们面临以人工智能为核心的新一轮技术自动化浪潮——一些人将其称为“工业4.0”。当今的“省力技术”威胁着新的工作类别:

客户服务由聊天机器人完成;

亚马逊正在销售由ChatGPT撰写的电子书;

设计师和插图画家的工作正被图像生成器抢走;

翻译人员被要求“整理”人工智能生成的文字稿。

莫森特使用了“初创企业”和“科技巨头”等不合时宜的术语来描述早期的工厂和企业家,试图与现在的情况相提并论。当然这种类比并不完全成立。

比如,卢德分子眼睁睁地看着一幢幢厂房在他们的乡村小镇上拔地而起,将传统上由家庭或小作坊独立完成的劳动集中起来。这些工厂的工人通常是儿童,其工作条件令人发指;肢体残缺不全的恐怖故事最终推动了工厂的改革。

而今天,自动化的受害者并不那么显而易见。ChatGPT用户看不到肯尼亚等国的低薪内容审核员,他们支撑着程序的输出,执行着繁重的心理任务,而研究表明,这种任务会诱发P.T.S.D.。更重要的是,人工智能的基础是人类辛辛苦苦生产出来的原材料:成堆的文本和图像,程序将其处理成模式,然后重新混合成新鲜的“内容”。与第一次工业革命的机器不同,人工智能并不一定需要更多的投入,它可以自我维持

OpenAI的首席执行官山姆·阿尔特曼(Sam Altman)对《大西洋月刊》说:“工作肯定会消失,就是这样。”

01

警惕技术沙文主义

阿尔特曼的态度典型地反映了一种可以被称为“技术沙文主义”的现象,它围绕着这样一种信念而发生:技术始终是任何问题的最佳解决方案,并且本质上优于传统或非技术方法。然而,这种观点可能会导致人们忽视非技术替代方案,或用以蔑视对技术进步的合理批评。

技术导致社会不平等的最重要方式之一是技术本身的不均衡获取。即使技术是可以获得的,缺乏有效利用技术基本技能和培训的个人也可能会处于不利地位。这可能导致数字鸿沟的出现,技术获取方面的不平等进一步扩大了现有的社会不平等。

此外,技术可以延续社会普遍存在的偏见和歧视,也可能对个人隐私和公民自由构成威胁,尤其是对可能受到更多审查和监视的边缘群体。这些问题有可能加强和巩固现有的社会不平等。

因此,深入研究技术进步的意外后果(通常称为外部性)如何影响社会福祉至关重要。必须确定这些变化在社会和政治层面上的影响,并思考当代社会制度如何适应和发展以应对这样的挑战。科技解决方案可能会引起不同社会利益和目标之间的冲突,所有这一切都在塑造创新的发展和实施方面发挥着作用。这些冲突可能表现为社会争端,源于对所感知的社会威胁的不同解释。从政治哲学和社会学领域角度进行的分析可以在这方面做出宝贵的贡献。

一些理论家认为,这类发展体现了一种技术决定论,强调技术在一定程度上具有自主性。然而,更乐观的观点认为,负责任的技术使用、伦理考量和教育可以使个人能够有效地驾驭这种复杂的技术格局。

02

反对技术中立论

技术被理解为社会关系的反映,因此不能以中立的眼光看待它。从这个角度来看,技术不能在社会背景之外进行设计。权力关系的不对称被纳入技术的实际设计中。

因此,选择一个介于技术与社会之间的技术批判理论框架至关重要。

技术批判理论将注意力引向技术的社会条件建构和技术对社会的影响。批判理论探索物质和现象的辩证法,并关注体现人类特定历史活动的社会现实,寻求解释个人在技术背景下的地位、技术的权力关系、人与技术之间的中介,乃至技术的意识形态。

技术批判理论的主要代表人物之一赫伯特·马尔库塞(Herbert Marcuse)指出:

技术的一个问题是,不断扩大的工业基础和技术主义社会秩序所强加的条件正在压制人类的个性,而有利于标准化的效率。

人们对新的现代理性的出现也采取了同样的批评态度,这种理性伴随着工业化时代技术的发展,代表着大规模生产的基础,并影响着其他社会关系。

技术批判方法基于这样一种假设,即经济和社会增长是由科技进步决定的,而科技进步归根结底是一个政治问题,不能把政治问题简化为技术问题,将其解决交给专家而非政治家。

虽然批判理论本质上是有价值重负的,但在我看来,它应该以中立的方式进行分析:技术既不应被崇拜,也不应被妖魔化;我们需要能够识别技术的好坏两方面。只有这样,我们才能拥有改造技术的工具,令其潜在功能民主化。

这些问题很复杂,需要科技公司、政府、学术机构和整个社会的合作。我们很可能会在很长一段时间内继续努力解决这些问题,并有必要寻求永久的解决方案。

03

计算主导世界之弊

最近两年里,关于技术进步与社会发展之间关系的讨论多了起来,一些人不无悲观地认为,未来社会可能会朝着“高技术,低生活”的赛博朋克方向发展。现实中,以外卖平台为例,平台、骑手和顾客三方对于最佳效率的追求,确实导致了“算法决定一切”的霸权问题。

要认清背后原因,需要理解当今社会的本质。现代技术已经扩展到研究、开发和制造之外,渗透到公共和私人生活中,以至于它似乎正在创造一个以技术、人和大数据互联为中心的社会。

技术、人工智能、人和数据的这种融合在实施过程中带来了新的伦理和政治挑战和困境。

一方面,技术和人工智能正在彻底改变我们的环境,另一方面,在我们没有意识到的情况下,它们也在重塑我们;它们决定了我们的生活。这种“数字化转型”目前正在挑战现代社会中既定的二分法,例如主体/客体、公共/私人、消费/生产、思想/身体、工作/休闲、文化/自然等等。现在,我们可以谈论一个需要新的阐释和反思的数字公民社会。

在数字资本主义背景下,晚期资本主义的传统物质生产和服务将重点转向数据生产。经济格局的这种变化非常重视用户生成的数据,将经济从物理领域转移到虚拟领域,影响了个人在技术中的定位。

虚拟世界已成为宇宙“数据化”过程的舞台。首先我们看到的是一般的信息、知识与经验的数据化,其次出现了将数据进行商品化的平台,数据经过分析,利用算法、人工智能、神经网络和深度学习,来引入新的服务和商业模式。

从政治经济学和批判理论的角度来看,这代表了一种新现象。在这种新的数字经济格局中,中心焦点是数据及其生成,这标志着一种通过公开共享数据进行资本积累的独特策略。当下炙手可热的人工智能其实也不过是这个进程的一部分。

在此背景下,认识到算法和新技术在塑造我们日常现实中的作用非常重要。我们经常使用这些技术,却不了解它们的工作原理或背后的算法。结果,我们的社会现实变得简单,导致计算主导世界。这种主导关系可能引发政治和社会冲突。冲突发生在市场经济与数据共享之间,收集信息可能导致歧视、道德困境和认知偏见。个人权利与公共福祉之间也存在冲突,因为监控和影响个人行为可能会破坏他们的自由。

04

工作变迁是社会选择

除了技术与权利的关系,在“萝卜快跑”相关新闻爆发后,大众对人工智能最为关心的,还是集中在职业替代上。一直以来,外卖、快递和出租车司机这三项工作,都被戏称为中年失业者的最佳去处,有所谓的“铁人三项”的说法。AI无人驾驶不是完全的增量市场,而是对现有模式的迭代,对劳动力市场可能形成的冲击很大。

然而实际上,扰乱我们工作的不是技术,工作不安全的本质是企业和政策制定者决策的结果。

当我们学习工业革命时,我们听到了很多关于工厂、蒸汽机乃至动力织机的知识。我们被教导说,技术创新推动了社会变革,彻底改变了工作世界。

同样,当我们谈论当今的经济时,我们关注的是智能手机、人工智能和应用程序。在这里,人们也认为,技术的不可阻挡的进步颠覆了传统的工作方式,逐步淘汰了有固定工资或薪水的员工,引入了独立承包商、顾问、临时工和自由职业者——即所谓的零工经济。

其实这类说法都是错误的。劳动的历史表明,技术通常不会推动社会变革。相反,社会变革通常是由我们如何组织世界的决定所驱动。只是后来技术才突飞猛进,加速和巩固这些变化。

对于任何担心零工经济的不安全性和其他缺陷的人来说,这一见解至关重要。因为它提醒我们,工作的性质远非技术进步不可避免的结果,而始终是一个社会选择的问题。它不是算法的结果;它是企业和政策制定者决策的集合。

以工业革命为例。早在19 世纪工业革命发生之前,18 世纪就发生了另一场劳动革命,历史学家称之为“勤劳革命”。在这场革命之前,人们在自己居住的地方工作。例如,纺织品的生产依赖于独立农民网络,他们纺纱织布,独立工作,并非工厂雇员。

然而,在工业革命中,制造商将工人聚集在一个屋檐下,在那里可以分工和监督劳动。这是第一次大规模地将家庭生活和工作生活分开。人们不再控制自己的工作方式,他们获得工资,而不是直接分享他们劳动的利润。

这是工业革命的必要前提。虽然工厂技术会巩固这一发展,但工厂技术的创造之所以可能,只是因为人们与工作的关系已经发生了变化。动力织布机对在家织布的农民网络毫无用处。

今天的数字革命也是如此。虽然它经常被描述为“第二机器时代”,但当前的历史时刻最好被理解为“第二次工业革命”。这场革命已经进行了40余年,包括自20世纪70年代以来战后时代相对稳定的雇佣劳动经济的崩溃,以及后工业主义和服务经济的兴起。

在过去数十年中,我们看到零工的数量不断增加。他们的工作涵盖了各个收入阶层,但都具有20世纪70年代后经济中所有工作的共同点:临时性和不稳定性。来自美国的数据显示,在过去10年中,94%的新增净就业岗位出现在传统就业之外。目前已有约三分之一的工人和一半的年轻工人参与到替代性工作中,将其作为主要或补充收入来源。

互联网技术无疑加剧了这一发展。但Uber等服务和TaskRabbit等在线自由职业市场是为了利用已经独立的劳动力而创建的;他们并没有创造这种劳动力。他们的技术正在解决本已不安全的工作环境中的商业和消费者问题。简而言之,Uber是一种症状,而不是原因。

我既不支持也不反对零工(或自由职业)。这种新兴的灵活经济不可能全然是好或全然是坏。对一些人来说,零工经济的兴起代表着从企业压抑的世界中解放出来。但对于绝大多数工人来说,零工经济的“自由”只是恐惧的自由。这是企业和雇员之间义务的割裂。这是现代社会曾经在我们的法律和习俗中努力争取的保护的崩溃。

我们不能让时光倒流,但工作不安全感也不是不可避免的。正如战后时期成功让工业化造福产业工人一样,我们需要制定新的规范、制度和政策,让数字化造福当今的工人。专家们提出了许多前进的道路——“可携带”福利、全民基本收入、工人重新分类——但无论选择哪种方式,重要的是要记住我们确实有选择权。

不安全感并不是技术进步不可避免的代价。只有理解了这一事实,我们才能采取行动。

黄仁勋最新对话全文:10内年算力将提高100万倍

Reading Time: 3 minutes

文章来源: 钛媒体APP

英伟达CEO黄仁勋(图片来源:斯坦福大学SIEPR)
英伟达CEO黄仁勋(图片来源:斯坦福大学SIEPR)

2024年3月初,NVIDIA英伟达CEO黄仁勋(Jensen Huang)回到了他的母校美国斯坦福大学,参加了斯坦福商学院SIEPR经济峰会以及View From The Top 系列活动。

在两场已公开的对话视频中,黄仁勋详细谈到英伟达的市场价值定位、AGI(通用人工智能)发展、AI 算力的增长,以及如何通过人类反馈将 AI 根植于人类价值观话题,而且他也回应对于“皮衣黄”来历等。

黄仁勋坦言,AI 技术缩小了人类的技术差距。

他称,目前大约有1000万人因为知道如何编程而有工作,这让其他80亿人“落后”,而接下来,如果生成式 AI 逐渐取代编程的话,编程技术将可能变得不那么有价值了。

“未来,我们都可以编程计算机。你只需要看看YouTube,看看所有使用提示工程(prompt)的人,所有孩子正在用它(AI)做出惊人的事情。他们不知道如何编程,但只是和ChatGPT交谈就反馈到正确的编程手段做这个、做那个。所以,AI 和未来与人交流没有什么不同。这是计算机科学行业对世界的伟大贡献。我们缩小了技术差距。”黄仁勋表示。

黄仁勋强调,未来五年内,AGI将通过人类测试。包括律师考试、胃肠病学等专业测试中,AGI都可以发挥关键作用。不过他也承认,AGI可能还很遥远,因为目前专家们对于描述人类思维如何运作方面仍然存在分歧。

谈及 AI 算力,黄仁勋强调,在未来的10年里,英伟达将会把深度学习的计算能力再提高100万倍,从而让 AI 计算机不断训练、推理、学习、应用,并持续改进,未来不断将超级 AI 转变为现实。

“因此,我们会做更多的计算。我们会将计算的边际成本降低到接近零。”黄仁勋表示。

谈到地缘政治风险,黄仁勋回应称,英伟达几乎就是地缘政治风险的典型例子,原因在于公司制造了一种非常重要的 AI 工具。

他认为,AI 将是这个时代的“界定技术”。过去6-9个月时间里,他已经发现,未来 AI 将成为一个国家的“主权”,即一个国家必须控制自己的数字智能,必须致力于控制你的 AI 主权。

“美国完全有权决定这种工具在它认为应该限制的国家。美国有这个权利,并且行使了这个权利。对于我们来说,首先,我们必须理解这些政策,我们必须保持敏捷,以便我们能够遵守这些政策。一方面,它限制了我们在某些地方的机会,另一方面,它在其他地方打开了机会。”黄仁勋称。

黄仁勋也回应了“皮衣黄”来历。他坦言,这套皮衣是妻子给他买的,他自己几乎不购物。黄仁勋笑着说,这件皮衣已经足够好了,如果不喜欢这件可以去再买一件,不然他可以一直穿皮衣。

“我储备了一大堆黑色皮夹克。”黄仁勋表示。

而在另一场斯坦福对话当中,黄仁勋谈及创办英伟达并获得资金的前后过程,并指出“我们正处于计算的世界”。他认为,未来人类处理信息的方式将从 AI 上发生根本改变,这就是英伟达制造芯片和系统的根本原因。而生成式 AI 将从一个信息“种子”出发,计算的未来将高度依赖生成而非检索。

面对英伟达暴跌80%时的“低谷期”,黄仁勋坦言当时希望公司要回到事情的“核心”——坚持我所相信的,然后什么都不改变、继续前进。

黄仁勋还认为,液冷技术将成为 AI 算力的下一个趋势性领域。

黄仁勋强调,未来十年,英伟达最大的挑战来自技术和市场,其他的挑战还来自工业、地缘政治和社会层面。他希望所执掌的英伟达能通过坚持不懈地去做擅长且热爱的事,被历史以“改变了一切”而闻名。

(本文首发钛媒体App,作者|ChatGPT、林志佳,编辑|林志佳)

以下是黄仁勋在斯坦福大学的两场访谈对话全文,仅供参考:

第一个对话信息来自黄仁勋与MBA ’24Shantam Jain的对话,翻译部分自@美国攻略,并由钛媒体编辑进行人工整理和修正。

主持人:Jensen,非常荣幸能邀请到您,谢谢。

黄仁勋:能来这里我很高兴,谢谢。

主持人:为了庆祝您回到斯坦福,我想先聊聊您离开斯坦福的那段经历。当时您加入了 LSI Logic(美国逻辑芯片公司),那是当时最棒的公司之一。您也跟很多人建立了良好的声誉,但却决定离开去创业。是什么促使您做出这样的决定?

黄仁勋:是 Chris 和 Curtis(两位英伟达联合创始人、黄仁勋的好友)。当时我在 LSI 做工程师,他们在 Sun 工作。我当时跟 CS 领域最聪明的人共事,制造各种工作站包括图形工作站。有一天 Chris 和 Curtis 说,他们想离开 Sun 。他们想让我帮忙想想做什么好。我的工作很棒,但他们坚持要我加入他们一起思考如何创立一家公司。他们过来时,我们就在 Denny’s 聚会,那几乎算是我最初效力的公司。我成为 CEO 之前的第一份工作是洗碗工,那份工作我做得很出色。总之,我们经常聚会,而那段时期正值微处理器革命。

那是在 1992 到 1993 年期间,PC 革命才刚开始。革命性的 Windows 95 还没上市,奔腾处理器甚至还没发布。这一切都发生在 PC 革命爆发之前,显而易见,微处理器会非常重要。于是我们想,为什么不创立一家公司解决通用计算机无法解决的问题呢?这便成了公司使命:制造特殊的计算机解决普通计算机无法解决的问题。直到今天,我们还一直专注于此。

看看这些我们开拓的市场以及市场中的各种问题,比如计算机药物设计、天气模拟,材料设计。这些都是我们引以为豪的东西。机器人、自动驾驶汽车,以及人工智能的自主软件。随后我们不断地推动着技术进步,最终计算成本接近于零。这促成了一个全新的软件开发方式,计算机自己编写软件,也就是我们今天熟知的人工智能。就是这样。

主持人:这就是整个历程,感谢大家的光临(玩笑)。嗯,如今我们都在思考这些应用。那时,LSI 的 CEO 说服了他的最大投资者 Don Valentine 与您会面。就是红杉资本的创始人。我可以看到很多创始人都满怀期待地向前倾着身子。但您是如何说服硅谷最炙手可热的投资者为您投资的呢?您的团队是初创者,产品是面向尚不存在的市场。

黄仁勋:我不知道如何写商业计划书,所以我去了家书店。那时候还有书店呢。商业书籍区,有这本书,作者我认识,Gordon Bell 。这本书我应该再去把它找出来,不过它非常厚。书名叫《如何写商业计划书》。

对于一个很小众的市场来说,它的书名相当具体了。感觉像是他特意为十几个人写的,我就是其中之一。我买了这本书,立刻就意识到这是个坏主意,因为 Gordon 非常聪明,聪明的人总有很多话想说。

我很确定 Gordon 想从头到尾教我怎么写商业计划书,所以我拿起这本书,大概有 450 页后,好吧,我从没读完过,根本读不完。我随便翻了几页,然后想:算了。等我读完它的时候,公司估计都倒闭了,钱也花光了。

Laurie和我当时银行里只有六个月左右的生活费,我们已经有了 Spencer 和 Madison,还有一条狗,所以我们一家五口只能靠手头这点存款生活。因此我时间不多,我没有写商业计划书,而是直接去找了 Wilf Corrigan 。

他曾经有一天给我打电话说:「嘿,您离开公司了,您都没告诉我您干嘛去了,我希望您能回来给我讲讲。」我回去给 Wilf 做了详细的介绍。Wilf 听完我的介绍后说:「我完全不明白您在说什么。」「这是我听过最烂的创业推销之一。」

随后他拿起电话打给 Don Valentine,他打电话给 Don 说:「Don,我要给您送个小伙子过去,我希望您能给他投资。他是我在 LSI 最棒的员工之一。」

我学到的教训是:你可以忽悠一个精彩的面试,你也可能会把面试搞砸,但你无法逃避自己的过去,所以要把自己的「过去」做好。从很多方面来说,我说我是个好洗碗工是认真的,我可能是 Denny’s 餐馆史上最好的洗碗工。我有规划,注重组织有序,我准备工作很用心,然后全力以赴地清洗盘子,之后我被提拔为服务员,我是 Denny’s 最好的服务员。

我从不空手离开工作区,也不空手回来,我效率很高。总之,我最终成为了 CEO,但我仍在努力成为一名优秀的 CEO 。

主持人:您曾说要做最好的,要成为后来获得投资、做同样事情的 89 家公司中最优秀的。当公司的资金仅够维持 6 到 9 个月时,您意识到最初的愿景行不通。在如此不利的情况下,您如何决定下一步来挽救公司呢?

黄仁勋:我们创立了「加速计算」(NVIDIA)公司。问题是,它用来做什么?它的杀手级应用是什么?这就是我们做出的第一个重大决定,也是红杉投资的项目。我们的第一个重大决定就是,首个重点应用领域是 3D 图形。技术将是 3D 图形,而具体应用程序将是电子游戏。

当时,廉价的 3D 图形技术是不可能做到的。硅谷图形芯片产品要上百万美元,做廉价版本很难。而电子游戏市场当时的价值是零美元、不存在。你有一项难以商品化的技术,瞄准了一个尚未存在的市场。这个交集就是我们公司的创立点。

我还记得当我完成展示后,Don 说了句话,当时很有道理,今天听来也是:「初创公司不该投资初创公司或者跟初创公司合作。」他的观点是,为了让 NVIDIA 成功,我们需要另一家初创公司也取得成功,就是 Electronic Arts 。那家公司的 CTO 只有 14 岁,得由他妈妈开车送他上班。他想提醒我,这就是我要依靠的人。他说:「你要是赔了我的钱,我杀了你。」这就是我对第一次会议的回忆。

不过尽管如此,我们还是创造了点东西。接下来几年我们着手去开拓市场,为 PC 创造游戏市场。这花了很多时间,我们直到今天还在耕耘这块领域。

我们意识到,为了把百万美元的计算机图形技术商品化,使其适配进入售价 300 美元、 400 美元、 500 美元范围的电脑,你不仅要创造新技术,还得发明新的计算图形处理方式。同时你还需要去开拓全新的市场。因此,我们必须不断创造新技术、新市场。这种「创造技术、开拓市场」的理念定义了我们公司。我们做的几乎每件事情都是创造技术、创造市场。这就是人们说的「生态链」的本质。过去 30 年里, NVIDIA 的核心领悟就在于:为了让别人购买我们的产品,我们必须亲手开拓这个新市场。

这就是为何我们很早就开始布局自动驾驶、深度学习,以及在很多领域都处于前沿,包括计算药物设计和发现。我们在创造技术的同时致力于开拓所有这些不同领域的市场。

接下来我们步入正轨,然后微软推出了 Direct 3D 的标准。这催生了成百上千家公司。几年后我们发现自己在跟几乎所有人竞争。我们赖以创立公司、开拓消费级 3D 图形的那项发明技术,居然跟 Direct 3D 标准不兼容。

我们创立公司,想把百万美元的发明技术商品化,但很快发现与新的标准不兼容。我们不得不更改赛道,否则就只能倒闭。但我们不知道如何按照微软的方式来构建它。

我还记得那次会议上的讨论:我们现在有 89 个竞争对手,我们知道之前的方式不对,但我们不知道正确的方式是什么。

幸运的是我又看到一家书店 Fries Electronics 。我不知道它现在还在不在。有个周末我带女儿 Madison 去书店,然后就看到了这本书 OpenGL 手册,定义了硅谷图形的计算机图形处理方式。一本 68 美元,我带了几百块钱,买了三本。

我把书带回办公室,对大家说:「我找到了咱们的未来。」我把三本书分发下去传阅,中间有大幅的折叠插页,这个插页就是 OpenGL 流水线计算机图形处理流水线。我把它交给了与我共同创办公司的那些天才手中。

我们以前所未有的方式实现了 OpenGL 流水线,构建出了世界从未见过的东西。其中有很多经验教训。对我们公司来说,那一刻给了我们极大的信心:即使对所做的事情一无所知,也能成功创造出未来。

现在这就是我对任何事情的态度。当有人跟我说我没听过的事情,或者听说过但不懂原理,我的想法总是:能有多难呢?可能看本书就搞定了,可能找一篇论文就能搞清楚原理。

我确实花了很多时间阅读论文,这是真的。当然,你不能照搬别人的做法,指望会有不同的结果。但你可以了解某件事情的实现原理,然后回归问题的本质,扪心自问:基于现有的条件、动机、手段和工具,以及一切如今的变革,我会怎么去重做这件事?我会如何重新发明它?我会如何设计它?

如果今天造一辆车,我会沿用过去的方式吗?如果今天让我创造一台计算机,我会采用怎样的方式?如果今天让我来编写软件呢?

这么想有道理吗?即使是今天的公司,我也经常回归本质,从头思考。这是因为世界已经变了。过去编写软件的方式是单一的,是为超级计算机设计的,但现在软件架构已经解耦等等。我们今天思考软件、计算机的方式一直在改变。经常促使公司和自己回归问题本质,会创造出大量的机会。

主持人:而当您运用这种技术时,结果可能是革命性的。公司上市之后您获得了更快的发展,四年里营收增长了九倍。但您却因为一通化学教授的电话转变了 NVIDIA 的创新方向。能讲讲吗?您是如何把谈话与 NVIDIA 的未来联系起来的?

黄仁勋:记住,公司本质上是在开创一种全新的计算方式。计算机图形是第一个应用领域,但我们一直知道会有其他应用。陆续有图像处理、粒子物理、流体等领域开始使用我们的技术。还有很多我们想做、觉得会很有趣的应用领域。

我们努力让处理器更具编程性,从而可以表达出更多样的算法。后来我们发明了可编程着色器,让成像和计算机图形的各部分都具备了可编程性。这是一次重大突破。我们试图找到可以充分利用我们处理器(它和 CPU 有很大区别)来计算更复杂算法的方式。

大概是 2003 年,我们创造了 CG 。C for GPUs 的简写。它比 CUDA 早了大约三年。编写那本曾挽救公司的教科书的作者,Mark Kilgard,他也编写了关于 CG 的教科书。

CG 非常酷,我们还出了教科书。我们开始教人们如何使用它,也开发了一些相应的工具。后来有好几位研究人员发现了 CG,斯坦福大学的很多研究人员和学生都有在用它。很多后来成为 NVIDIA 工程师的人当时也在捣鼓这个。

马萨诸塞有几位医生开始使用 CG 进行 CT 图像重建。我飞过去见了他们,问他们拿这个工具在干什么。他们告诉了我他们的工作。然后一位量子化学家也用它来表达他的算法。

我意识到有迹象表明人们可能真的开始有需求使用它。这让我们逐步确信我们应该更深入地发展这块领域。这个计算领域、这种计算形式能解决普通计算机难以解决的问题。这也强化了我们的信念,让我们继续前行。

主持人:每次听到新的应用方式时,您都觉得很惊喜。这似乎贯穿了您在 NVIDIA 领导生涯中的一个主题,就像您在技术拐点出现之前就做出了赌注。当苹果终于从树上掉下时,您正穿黑色皮夹克在等着接住它。您是如何做到如此确信的?

黄仁勋:这总是感觉像是一个飞身接球,就像在飞身接球。你的行动源自于核心的信念。我们坚信可以创造出一种计算机能解决一般计算无法解决的问题。我们相信 CPU 的能力是有极限的,通用计算的能力也有极限。同时我们也知道能去解决一些有趣的问题。

但这些问题只是有趣吗?还是能扩展成有趣的市场?只有当它们成为市场时才能保证可持续性。

NVIDIA 有十年的时间在投资未来,但市场并不存在。当时只存在一个市场:计算机图形。十几年的时间,推动我们今天发展壮大的市场根本不存在。那么,你该如何继续带领身边的所有人:公司、管理团队、优秀的工程师、股东、董事会、合作伙伴?你带着所有人上路,但根本没有市场存在的证据。这是真的非常非常的具有挑战性。

我们的技术可以解决问题,有研究论文为证,这些都很有意思,但你得寻找市场。在市场出现之前,你仍然需要看到未来成功的早期指标。公司里有一句行话叫关键绩效指标 KPI 。不幸的是,KPI 很难理解,我觉得 KPI 很难理解。

什么是好的 KPI 呢?当我们看 KPI 时,很多人都会说「毛利率」,但那不是 KPI,那是结果。你应该寻找未来成功的早期指标,而且越早越好。原因是你想尽早看到自己正走在正确的方向上。

我们有个短语叫 EIOFS「未来成功早期指标」的缩写。我常使用这个词,它能帮助人们、给予公司希望。看,我们解决了这个问题,那个问题,这个问题。市场尚不存在,但存在着一些重要的问题,解决这些问题就是公司的意义所在。我们希望可持续发展,因此必须有市场在某个时刻出现。

但是,你要把结果与你正在做正确的事情的证据脱钩。这就是解决问题的办法:你投资某个非常遥远的事情,还得有信念坚持下去。办法就是尽早找出你做的事情是否正确的那些指标。最开始得有一个核心信念,除非有什么改变了你的想法,否则你就要继续相信它,并且寻找未来成功的早期指标。

主持人:NVIDIA 的产品团队使用过哪些早期指标呢?

黄仁勋:各种各样的都有。我看到过这样一篇论文,在此之前很久我遇到了需要我在「深度学习」领域提供帮助的人。那时,我甚至不知道深度学习是什么。

他们需要我们创建一个领域特定的编程语言,这样他们所有的算法都能在我们的处理器上轻松实现。我们创造了这个叫做 KU-DNN 的东西。它本质上是在深度学习领域的 SQL(数据库语言)。而 SQL 则应用在存储计算方面。

我们为深度学习创造了一门编程语言,就像是该领域的 OpenGL 。他们需要我们做这个,这样他们才能表达他们的数学计算。他们不懂 CUDA,但他们懂深度学习。我们在中间给他们创造了这个工具。我们之所以这么做,是因为即使当时市场规模是零……这些研究员身无分文,即使看不到财务回报、遥遥无期,只要你相信,公司也愿意去做。

这是我们公司的伟大能力之一。我们会问自己,这项工作是否有价值?它是否能在某个重要的领域推动科学的发展?注意,这是我从一开始就在强调的事情。从创立之初,我们就一直是注重工作的重要性而非市场规模。因为工作的重要性是未来市场存在的早期指标。

没有人需要做商业分析报告,没有人需要给我看损益表、或财务预测。唯一的问题是,这项工作重要吗?如果我们不来做的话,这些事还会不会发生?如果我们不做、事情也会自然发展,我其实特别高兴。因为你想想,你什么都不用做,世界却变得更好了。这是终极「懒人」的定义。从很多方面来说,你需要养成这种习惯。公司应该对别人总能做好的事情保持「懒惰」态度。

如果别人能做,那就让他们去做吧。我们应该去做那些「如果我们不做就会出问题」的事情。

你必须说服自己:如果我不做,这件事就做不成。这是一项艰巨而重要的工作,它会赋予你使命感。我们公司一直在选择这样的项目,深度学习只是其中之一。其早期成功的迹象是吴恩达的人工智能识别猫。Alex 检测出了猫,虽然不是每次都能成功,但至少能证明这条道路可能有所发展。

我们分析了深度学习的结构,我们是计算机科学家,我们理解事物运行的原理。我们说服自己这个技术能改变一切。无论如何,这就是一个例子。

主持人:您的这些选择取得了巨大的回报,字面、及比喻意义上都是。但金融危机期间,华尔街不相信您押注机器学习。公司市值蒸发 80%,您带领公司经历了非常艰难的时期。在那种情况下,您是如何掌控局势、让员工专注目标?

黄仁勋:我在那段时间的反应和过去一周的反应完全一样。之前你问我本周的事我的反应没有任何变化。本周与上周、或前一周毫无不同。当然,股价跌了 80% 确实有点难堪。你只想穿一件「不是我的错」的 T 恤出门。更糟的是你不想起床,不想出门。这些都很真实,但随后你还是得投入工作。

我在同一时间醒来,用同样的方式规划我的一天。我回归初心:我相信什么?你必须始终牢记核心,你相信什么?最重要的事情是什么?一项项确认。这样做有帮助。家人爱我吗?是的,很好。你就得逐条确认。再回到你的工作核心,继续工作。然后每一次对话都回到工作核心,让公司的注意力集中在核心上。你坚信吗?有什么东西改变了吗?股价变了但还有其他东西变了吗?物理定律变了?万有引力变了?那些促使我们做出决定的事情,那些假设、那些信念有变化吗?

因为如果这些东西变了,那一切都得变。但如果它们不变,你也什么都不需要改变。继续走下去,这就是坚持的办法。

主持人:和您的员工交流时,他们说您(不想公开露面)。他们说您在领导方面(连员工也不见。开玩笑的)。

黄仁勋:不,不幸的是作为领导者你得让人看到,这才是难的地方。

我是学电气工程的,入学的时候年纪很小。我上大学的时候才 16 岁,很多事情都经历得比较早。我有点内向,很害羞,不喜欢公开演讲。当然今天能来这里很开心……但这不是我的本性。当情况有挑战时,站在你最关心的人面前并不容易。你能想象公司股价下跌 80% 时开会吗?

作为 CEO,我最重要的职责是站出来面对你们,解释情况。有时候你不知道原因,不知道会持续多久、有多糟糕。你对这些一无所知,但仍然必须去解释。面对所有这些人,你知道他们在想什么。有些人可能认为我们完了,有人可能觉得你是个白痴,有人可能在想别的事情。大家可能胡思乱想,你知道,但你还得站在他们面前去做艰苦的工作。

主持人:他们可能那么想,但您领导的团队没有一个人离开。

黄仁勋:他们找不到工作,我一直这么提醒他们。开玩笑的。我身边都是天才,很不可思议。NVIDIA 众所周知拥有全球最出色的管理团队,这是世界上技术最深厚的管理团队。我身边都是这样的人,他们都是天才。商业团队、市场团队、销售团队,都非常出色。工程团队、研究团队简直难以置信。是的。

主持人:您的员工说您的领导风格非常投入。您有 50 个直接下属。您鼓励各级员工向您发送他们认为五件最重要的事情,您不断提醒大家没有任何工作您看不上。能告诉我们您为什么设计这么扁平的组织结构吗?我们该如何思考未来要设计的组织架构?

黄仁勋:没有任何工作我看不上。别忘了我曾经真是个洗碗工。我洗过很多很多厕所,比你们所有人加起来还要多。那些画面挥之不去。我也不知道对你说什么,这就是生活。

你不可能给我一项我做不了的工作。我做事情不是仅仅因为它是否配得上我。如果你给我发东西想要我的意见,如果我能为你提供帮助跟你分享我的思考过程,那我就能有贡献,让你看到我是如何进行推理的。了解一个人处理事情的思考方式能赋予你力量。你会想:「天哪,原来你是这么思考这种事情的。」

其复杂程度不如你想象。你会知道原来这么处理模糊不清的事情,你会知道如何处理无法估计的事,你会知道如何处理看似很可怕的事情,你会知道怎么……明白吗?我一直在示范给大家怎么进行推理,战略——如何预测某事如何分解问题。你在不断地赋权众人。我就是这样看待这事的。如果你发东西给我审阅,我会尽力而为,然后让你知道我会怎么做。这个过程中我也从你那里学到了很多,对吧?你提供了大量的信息我学到了很多。

所以我觉得这个过程很有回报。有时候确实会很耗费精力为了给别人增值,他们本来就很聪明,我身边都是这种人。要想给他们增值,你至少要达到他们的水平。你必须进入他们的思维空间,这真的很难。需要消耗大量的情感和智力能量。在做完这样的事情后,我会感到精疲力竭。我身边很多优秀的人。

CEO 应该拥有最多的直接下属,因为能直接汇报给 CEO 的人需要的管理最少。若 CEO 的下属很少,在我看来毫无道理,除非说, CEO 知道的信息最有价值、最机密。他只能告诉给两三个人,这些人也只能告诉另外几个人。我不认同这种「你掌握的信息就是权力」的文化或环境。

我希望我们都能为公司做贡献,我们在公司中的地位应该取决于我们解决复杂问题的能力、带领他人取得卓越成就的能力、激发他人灵感的能力、赋能他人和支持他人的能力。这才是管理团队存在的目的——服务其他员工,创造有利条件让优秀人才愿意来为你工作,而不是去其他令人赞叹的高科技公司。他们选择、自愿来为你工作。因此,你应该创造出能让他们从事毕生工作的条件,这就是我的使命。

可能你已经听过我说这件事而我也相信这一点。我的工作很简单,就是要创造你能够做毕生工作的条件。那么我如何做到这一点?这种条件是什么样的呢?

嗯,这种条件会带来很大的自主性。只有当你了解环境时你才会获得这种自主性,对吗?你必须了解所处状况的背景才能想出好点子。我必须创造让你知晓背景情况的环境,你得有知情权。得到知情权的最佳方式是减少信息扭曲的层次。这就是为什么我很经常在这样的场合下进行推理。我会说,这是最初的事实,这是我们拥有的数据。我要这样进行推理,以下是一些假设。以下是一些未知因素,以下是一些已知因素。所以你就进行推理了。现在,你已经建立了一个高度自主的组织。

NVIDIA 有 3 万人。我们是世界上最小的超级公司。但每位员工都有很大自主权,每天帮我做明智决定。原因是他们理解我的状态。他们理解我的状态。我对人很透明,我相信我可以把信息托付给你。信息可能难理解、情况很复杂但我相信你可以应付。我对很多人说过「你们是成年人、可以应付这个的。」但有些人不是真正的成年人,只是刚毕业(开玩笑的)。我刚毕业时不能算成年人,但我幸运地被信任和托付。我想这样做。我想为人们创造能够做到这一点的条件。

主持人:我现在想谈谈大家都在想的话题——人工智能。上周,您说生成式人工智能和加速计算已经达到临界点。随着这项技术变得越来越主流。您最兴奋的应用是什么?

黄仁勋:你必须回归初心,问问自己什么是生成式人工智能?发生了什么事?我们有了可以理解事物的软件它们可以理解为什么……我们将所有东西数字化了。基因测序,数字化基因。但这意味着什么呢?那串基因序列有什么意义?我们已经将氨基酸数字化但这是什么意思呢?我们现在有能力数字化文字、数字化声音,我们数字化图像和视频,我们数字化了很多东西。但是这意味着什么呢?通过大量学习、大量数据以及从模式和关系中,我们现在理解了它们的含义。我们不仅理解它们的意思还可以在它们之间进行转换,因为我们了解这些事物在同一个世界中的含义。

我们不是分开了解它们的。我们是在同一个上下文中学习口语、文字、段落和词汇。我们找到了它们之间的相关性,它们彼此都是有关联的。现在,我们不仅理解了模态、每个模态的含义,我们还明白如何在它们之间进行转换。显而易见的应用如:视频生成文本,就是字幕;文本生成图像如 Midjourney;以及文本生成文本如 ChatGPT,太神奇了。我们现在知道,我们理解了含义,还可以转换。某些事物的转换等同于信息生成。

突然间,你得退后一步扪心自问,这会对我们所做的每一件事的每一层面带来什么影响?我在你们面前练习、我在你们面前推理。和十几年前首次看到 AlexNet 时一样,当时我就这样推理。我看到什么了?多有意思?它能做什么?太酷了。最重要的是,这代表什么?对计算领域的每一层意味着什么?

因为我们处于计算的世界。未来我们处理信息的方式将从根本上改变。这就是 NVIDIA 制造芯片和系统的原因。我们编写软件的方式也会从根本上改变。我们未来的软件类型会改变会催生新的应用程序。还有,这些应用程序的处理方式也会发生改变。

过去,模型基于检索预先记录的信息,我们编写文本、预先记录然后基于算法来检索。在未来,某些信息的种子将成为起点。我们称之为 Prompt 提示词,然后生成其它的内容。未来的计算将高度依赖生成。举例来说我们现在正在聊天。我告诉给你们的信息很少是检索所得。大多数是生成的,这就叫做生成式人工智能(AIGC)。未来计算机的运算会高度依赖生成,而非基于检索。

回到原点,你们创业时得自问哪些行业会因此被颠覆?我们还会对网络持有同样的看法吗?我们还会对存储持有同样的看法吗?我们还会像今天这样滥用互联网流量吗?可能不会。我们此刻在对话,但不是你每问个问题我就上车离开。我们不必像过去那样滥用信息传输。什么会更多出现?什么会减少?哪些新的应用程序?等等之类的问题。你可以审视整个行业格局自问:什么会被颠覆?什么会改变?会出现哪些新事物?诸如此类。推理过程始于「发生什么了?什么是生成式人工智能?」从根本上,到底什么正在发生?对所有问题都回归本质。

我还想聊聊组织架构,你之前提问我忘了回答。创建组织的方式得回归本质,别管其它公司的组织架构。你记住组织是用来做什么的。过去的架构是上面一个 CEO 下面是辅佐大臣,层层向下,最底层就是普通员工。这样设计的目的是希望员工获得的信息越少越好,因为士兵们的根本任务就是在战场上卖命。牺牲而不问,原因你们懂的。我只有 3 万名员工,我不希望任何人去送死。我希望他们质疑一切,能理解吗?过去的组织方式与今天的组织方式截然不同。

问题是「NVIDIA 要创造什么?」组织架构的目标,是让我们更好地去创造我们要创造的东西。大家创造的东西不同,为什么还要用相同的组织架构方式呢?为什么采用相同的组织架构、而不考虑你们要创造的是什么?毫无道理。你造计算机用一种架构去组织。你提供医疗服务还用完全相同的架构去组织。这完全说不通。你得回归本质自问:需要什么样的架构?输入是什么?输出是什么?这个环境有什么特性?这种动物必须生活在什么样的环境中?它的特性是什么?大部分情况下是稳定的吗?是不是每时每刻都努力榨干最后一滴水?还是时常变化、随时会被攻击?你得明白,作为 CEO 你的工作就是架构这个公司。这是我的首要工作——创造条件让你能做毕生的事业。架构必须正确你必须回归本质,思考这些问题。

我很幸运,在 29 岁的时候有机会退后一步思考:我如何为未来构建这家公司,它的样子会是怎样?它的操作系统是什么也就是企业文化?我们鼓励和推广哪些行为、不鼓励哪些行为?等等。

主持人:今年我们的主题是重新定义明天,嘉宾的一个问题是,作为英伟达的联合创始人和 CEO,如果您能闭上眼、神奇地改变关于明天的一件事,会是什么?

黄仁勋:我们是不是应该事先想想这个问题?要不然我会给您一个糟糕的答案。

我个人观点,世上有很多事我们无法控制,你的工作是做出独特贡献、有目标的生活,做一些只有你才能做或会去做的事。做出独特贡献,在你离开世界后,大家会觉得因为有你,世界变得更好了。对我来说我就是这样过日子的。我会快进到未来再往回看。你的问题其实和我思考问题的视角完全相反,我不从当前位置向前看,我快进到未来,再往回看。因为这么做更容易。我会往回看,翻看历史。我们用这种做法、那种方式解决了某些问题……说得通吗?

这有点像你们解决问题的方式。你搞清楚最终想要的结果,然后反推实现它的方法。所以我设想 NVIDIA 为推动计算领域发展做出独特贡献,因为计算是推动整个人类进步的最大动力。这不是自我吹捧,而是因为这是我们擅长的领域,且难度极高。我们坚信自己能做出绝对独特的贡献。到今天,公司已经走过了 31 年,但我们的征途才刚开始。这是极难的目标。当我回首往事时我相信我们会被铭记,成为一家改变了世界的公司,不是因为我们到处宣讲通过言行改变世界,而是因为我们坚持做一件难度极高的事,这件事是我们擅长、热爱而且做了很久。

观众:我是 GSP 项目的负责人。我的问题是:您如何看待公司在未来十年的发展?您认为公司会面临哪些挑战?以及您对此的策略是什么?

黄仁勋:首先,我能说说您提问题时我脑海中的想法吗?当您说「什么挑战」时一大堆挑战在我脑中闪过,以至于我当时在想选哪个说比较好。呈现在我脑海中的大多数都是技术挑战,因为我整个早上都在处理这些问题。但如果您昨天问,我可能想的大多是市场开拓相关的挑战。有些市场我也非常想开拓。能不能快点行动?但我们无法单枪匹马实现它。

NVIDIA 是一家技术平台型公司。我们服务于很多公司,希望我们的梦想能通过它们实现。有些事我很想看到比如让生物学领域达到像 40 年前的芯片设计行业那样的状态。当年的计算机辅助设计(EDA)软件、整个 EDA 产业,成就了我们今天所拥有的一切。我相信明天我们会让生物领域也实现同样的突破。

今天,我们有能力将计算机辅助药物设计与基因、蛋白质、甚至细胞结合。我们非常非常接近能表示和理解细胞的含义,那是大量基因的组合。细胞代表着什么?如果我们能像理解文字那样理解细胞,想象一下前景。我迫不及待地期待那一天的到来对此感到很兴奋。还有一些我感到兴奋、确信马上要取得突破的领域。比如,以人为导向的机器人技术非常接近取得突破。理由是,如果你能将语音进行切分成单元并理解那么,为什么不能对动作进行同样的处理呢?因此,一旦你在某个领域想通了这些计算机科学技术,就会去思考:既然能做这个为什么不能做那个?这些让我很兴奋。这个领域的挑战是令人愉快的挑战。

当然,还有一些「不太愉快」的挑战, 比如产业问题、地缘政治问题和社会问题。你们应该都听说过这些了这些都是真实存在的问题。全球范围内的社会问题、地缘政治问题。为什么我们不能相处好呢?我们为什么要在世界上说那些话?为什么要说那些话然后在世界上放大它?为什么我们必须这么地批判别人呢?所有这些问题,你们都知道我不需要再重复一遍。

观众:我叫 Jose,我是 2023 年 GSB 班的学生。我的问题是:您是否对我们开发 AI 的速度感到任何担忧?您认为是否需要任何监管制度?谢谢。

黄仁勋:答案是肯定的也是否定的。现代 AI 最伟大的突破是深度学习,有了长足的进步。但另一个不可思议的突破是人类常有、常使用的一项能力。我们把它应用在语言模型上称为基础、强化学习、人为反馈。我每天都在提供强化学习与人为反馈。这就是我的工作。在场的各位家长,你们也一直在提供强化学习与人为反馈。如今,我们才弄清楚如何将这个系统性地应用在人工智能上。还有很多其它防范手段:例如,微调、基础。如何生成遵循物理定律的数据?

目前,有些模型生成的物体会在太空中飘、不遵循物理定律。这需要技术来解决。防范需要技术,微调需要技术,使 AI 与人类目标相一致需要技术,安全也需要技术。

飞机之所以安全,是因为所有的自动驾驶系统,都由多样性和冗余性系统支持, 还有各种各样新发明的功能安全和主动安全系统。我们需要更快、更快速地发明出所有与之类似的技术。安全和人工智能之间的界限网络安全和人工智能之间的界限将会变得模糊而紧密交融。在网络安全领域,我们需要技术非常、非常快速地进步才能保护我们免受人工智能的伤害。

从很多方面来看,我们需要技术更快推进,远比现在快得多。监管有两类,有社会监管,我真不知道该如何处理;也有产品和服务监管,这点我非常清楚该怎么做。FAA 、 FDA 、 NITSA 等等各种联邦政府机构,它们针对特定用途的产品和服务有各种监管措施。律师行业有职业资格考试、医生行业也是,如此等等。你们都有资格认证考试。都有需要达到的标准都需持续考取资质认证。会计师行业也是如此等。

不管是产品还是服务都已经有很多、很多的监管制度。请不要再额外增加一套横跨所有行业的超级监管。监管会计行业的监管者不应该去监管医生。我喜欢会计师,但如果我需要做心脏搭桥手术,会计师能算账固然不错但显然不能做心脏搭桥。我希望已有产品和服务的监管在人工智能的背景下加强。

我漏掉了很重要的一个方面,那就是 AI 给社会带来的影响。如何应对呢?我没有很好的答案,不过已经足够多的人在讨论了。但重要的是把这一切划分成很多个子问题。能理解吗?这样我们才不会过度聚焦于一个领域,而忘记了大量常规领域还可以做的事。那样的结果是,人们会死于车祸和飞机事故 —— 毫无道理。我们应该确保在那些领域做到位。

很务实。(你们)能再问一个问题吗?

主持人:好吧,按照惯例,我们有些快问快答问题。

黄仁勋:好的,我一直努力避免来着。好的,好的,请开始。

主持人:您第一份工作是 Denny’s 餐厅,他们现给您设了专门的卡座。在那里的工作您最美好的记忆是什么?

黄仁勋:我第二份工作是 AMD,他们有给我设专门卡座吗?开玩笑啦。我很喜欢那份工作。真心喜欢那是一家很棒的公司。

主持人:如果全球各地都出现黑色皮夹克短缺,您会穿什么?

黄仁勋:我储备了一大堆黑色皮夹克,我是最不需要担心这个的人。

主持人:您谈了很多关于教科书的事。如果您要写一本,主题会是什么?

黄仁勋:我不会写的。您问的是一个假设性、毫无可能性实现的问题。

主持人:这很公平。最后,如果您能分享一条简短的建议给斯坦福,会是什么呢?

黄仁勋:拥有一个核心信念。每天都发自内心地检视目标竭尽全力追求、持之以恒地追求。和您爱的人一起,携手踏上正途。这就是 NVIDIA 的故事。

主持人:Jensen,和您聊的这一个小时太愉快了。感谢您抽出宝贵时间。

下面是黄仁勋另一场在SIEPRkeynote会议上的对话,由讯飞听见、Kimi智能助手和ChatGPT进行 AI 翻译,钛媒体编辑进行部分人工整理和修正:

注:主持人为SIEPR前任董事长、斯坦福大学经济学名誉教授John Shoven,以下称他为“主持人”。

主持人:在我的一生中,我认为最大的半导体技术发展突破是晶体管。现在这是一个非常基础的发明,但我应该重新思考技术突破要变成人工智能吗?

黄仁勋:首先,晶体管显然是一个伟大的发明,但最伟大的能力是它使得软件成为可能。人类能够以可重复的计算方式表达我们的想法和算法,这是突破。我们公司在过去31年里致力于一种新的计算形式,称为加速计算。我们的想法是,通用计算并不适用于每一个工作领域。我们说,为什么不发明一种新的计算方式,以便我们能够解决通用计算不适合解决的问题?我们在特定计算领域有效地做到了这一点。这本质上是算法的可以并行化。我们已经将计算机的计算成本降低到接近零。

当你能够将某物的边际成本降低到接近零时,会发生什么?我们启用了一种新的软件开发方式,过去是由人类编写的。现在我们可以让计算机来编写软件,因为计算成本接近零。你不妨让计算机去处理大量的经验。我们称之为数据,数字经验,人类的数字经验,让它去发现关系和模式,从而代表人类知识。这个奇迹发生在大约十五年前。我们看到了这一点,我们让整个公司都投入到这个领域。结果,在过去的10年里,我们将深度学习的计算成本降低了100万倍。

很多人说,Jensen,如果你将计算成本降低了100万倍,人们就会买得更少。但事实恰恰相反。我们看到,如果我们能够将计算的边际成本降低到接近零,我们可能会用它来做一些疯狂的事情。大型语言模型,从互联网上提取所有的数字人类知识,将其放入计算机中,让它找出知识是什么。这个想法,将整个互联网的内容刮取出来,放入一台计算机中,让计算机找出程序是什么,这是一个疯狂的概念,但如果没有将计算的边际成本降低到零,你永远不会考虑去做它。

我们取得了这个突破。现在我们启用了这种新的软件开发方式。想象一下,对于那些对人工智能还不熟悉的人来说,我们找到了一种方法,让计算机理解几乎所有数字知识的含义,而不是模式。你可以数字化任何东西。我们可以理解它的含义。让我给你举个例子。基因测序是数字化基因。但现在有了大型语言模型,我们可以去理解基因的含义。通过质谱数字化的氨基酸。

现在我们可以从氨基酸序列中理解,不需要太多工作,我们就可以弄清楚蛋白质的结构。这在计算机的视角下和一张页面的文字没有什么不同。你让计算机问它,这是什么意思?总结它说了什么?这和基因、蛋白质有什么关系。因为我们正处于这一切的边缘。所以我会长篇大论地说,John,你完全正确。人工智能,这是我们称之为加速计算的新形式,我们花了三十年时间去做,可能是计算机行业最伟大的发明。

这可能是21世纪最重要的事情。

主持人:我同意这是21世纪的,但也许晶体管是20世纪的趋势,我们需要让历史来决定。那么,你能展望一下未来吗?我猜现在支持 AI 的GPU芯片是你们的H100,我知道你们正在推出H200,你们计划每年升级一次。那么,你能想象一下5年后的3月20日,你们正在推出H700吗?它会让我们做到我们现在做不到的事情吗?

黄仁勋:我会倒回去,但首先让我说一下John刚刚描述的芯片。正如我们所说,芯片,你们在座的每个人都可能见过芯片,你可能会想象有一个像这样的芯片。John刚刚描述的芯片重70磅。它由35,000个部分组成。其中8个部分来自台积电。这个芯片取代了一个数据中心的旧CPU,变成了一台计算机。

这些节省,因为我们计算得非常快,这个计算机的节省是难以置信的。

然而,它是世界上最昂贵的计算机。我们卖出了世界上第一个价值25万美元的芯片,但这个系统它所取代的,仅仅是连接所有这些旧计算机的电缆就比芯片贵。这就是我们所做的。我们重新发明了计算,结果,计算的边际成本降到了零。这就是你刚刚解释的。我们将整个数据中心压缩成了这一个芯片。它非常擅长于尝试这种计算形式,如果没有变得奇怪的话,我们称之为深度学习,它非常擅长于这个叫做人工智能的东西。这个芯片的工作原理,不仅仅是在芯片层面,而是在芯片层面、算法层面和数据中心层面,作为一个团队一起工作。所以当你看我们的一台计算机时,它是一件了不起的事情。

只有计算机工程师会觉得它了不起,但它确实了不起。它很重,有数百英里的电缆。下一个即将到来的是液冷技术,它在很多方面都很美。它以数据中心的规模进行计算。在未来的10年里,比如John所说的,我们将深度学习的计算能力再提高100万倍。当你这样做时,会发生什么?今天我们学习,然后我们应用。我们去训练推理,我们学习,然后我们应用。在未来,我们将有持续学习。我们可以决定是否将那个持续学习的结果部署到世界上的应用中,但计算机将观察视频和新文本,并从所有互动中不断改进自己。

学习过程和训练过程,训练过程和推理过程,训练过程和部署过程、应用过程都将成为一体。

这就是我们所做的。推理、训练、应用这套强化学习循环将是持续的,而强化学习将基于实时通过互动以及我们实时创造的合成数据。就像当你学习时,你获取信息的片段,然后你从第一原理开始,这应该是这样的。然后我们在我们的大脑中进行模拟,想象状态,未来状态在很多方面对我们来说表现为现实。

未来的人工智能计算机也会这样做。它会进行合成数据生成,它会进行强化学习,它将继续以真实世界的经验为基础。它会想象一些事情,它会用真实世界的经验来测试它。它会以此为基础。整个循环就是一个巨大的循环。当你能够将计算的边际成本降低到接近零时,就会有很多新的方法去做你愿意做的事情。这和我愿意去更远的地方没有什么不同,因为交通的边际成本已经降到了零。我可以相对便宜地从这里飞到纽约。如果它需要一个月,我可能永远不会去。这和我们所做的每件事都是一样的,我们将计算的边际成本降低到接近零。

因此,我们会做更多的计算。

主持人:你可能知道,最近有一些报道说NVIDIA在推理市场上将面临比训练市场更多的竞争。但你所说的实际上是一个市场。你能评论一下吗?将会有一个单独的训练芯片市场和推理芯片市场吗?或者听起来你将会持续训练并切换到推理?也许在一个芯片内,我不知道,你为什么不解释一下。

黄仁勋:今天,每当你提示NVIDIA,无论是ChatGPT还是Copilot,或者你现在使用的服务平台,你正在做推理。推理就在其中。

所以,它为你生成信息。每当你这样做时,背后的是什么?100%都是NVIDIA的GPU。所以NVIDIA,你们现在参与的平台,当你在做推理时,我们是世界上100%的推理。现在推理难还是容易?很多人,当他们看到训练时,他们会说,这看起来太难了。我不会去做那个。我是一个芯片公司,这看起来不像一个芯片。你必须为了证明某事是否有效而投入20亿美元。你投入了20亿美元,两年时间,然后你打开它,发现它并不是很有效。你投入了20亿美元和两年时间,探索新事物的风险对客户来说太高了。

所以很多竞争对手倾向于说我们不做训练,我们做推理。推理非常困难。让我们想一想。推理的响应时间必须非常快,但这是容易的部分。这是计算机科学部分。推理的难点在于,做推理的人的目标是吸引更多的用户,并将其软件应用于庞大的安装基础。推理是一个安装基础问题。这和在iPhone上编写应用程序的人没有区别。他们这样做的原因是因为iPhone有一个如此庞大的安装基础。几乎每个人都有一部。如果你为那部手机编写一个应用程序,它将受益于能够触及每个人。在NVIDIA的情况下,我们的加速计算平台是唯一真正无处不在的加速计算平台。因为我们已经在这方面工作了很长时间,如果你为推理编写了一个应用程序,并在视频架构上部署了那个模型,它实际上可以在任何地方运行。

所以你可以触及每个人。你可以产生更大的影响。推理的问题实际上是安装基础。这需要巨大的耐心和多年的成功和奉献,以及对架构、兼容性等方面的投入。

主持人:你制造了完全先进的芯片。但是,是否有可能你会面临激烈的竞争,虽然他们不如NVIDIA,但足够好且便宜得多。A(AMD)是一个威胁吗?

黄仁勋:首先,我们比地球上任何人都有更多的竞争对手。我们不仅有来自竞争对手的竞争,我们还有来自客户的竞争。是的。我是他们即将设计一个芯片来取代我们的竞争对手,我完全知道这一点。我不仅向他们展示我当前的芯片。我还向他们展示我的下一个芯片,我还会展示我的芯片适配器。原因是,你看,如果你不尝试解释你为什么擅长某件事,他们永远不会有机会购买你的产品。

所以我们在与行业里的几乎每个人合作时都是完全开放的。我们的优势在于几件事情,我们的优势在于,你可以为一个特定的算法构建一个芯片。记住,计算不仅仅是Transformers。有一个叫做Transformers的概念。有各种各样的Transformers物种,而且我们正在发明新的Transformers。软件的类型非常丰富。软件工程师喜欢创造新事物,创新。我们希望NVIDIA擅长的是加速计算的广泛领域。其中之一是数据中心的生成性AI,它希望拥有大量客户,其中一些在金融服务领域,一些在制造业等等。在计算世界中,我们是一个伟大的标准。我们在每一个云中,我们在每一个计算机公司中。我们公司的架构在大约30年后成为了一种标准。所以这真的是我们的优势。如果客户可以做一些特定的事情,那更具有成本效益。坦白说,我甚至对这一点感到惊讶。

原因是这样的。记住,我们的芯片只是一部分。当你看到现在的计算机时,它不像笔记本电脑。它是一个数据中心,你需要运营它。所以购买和销售芯片的人考虑的是芯片的价格。运营数据中心的人考虑的是运营成本,我们的总拥有成本(TCO)非常好。即使竞争对手的芯片是免费的,它也不够便宜。我们的目标是增加如此多的价值,以至于替代品不仅仅是关于成本。这需要很多努力,我们必须不断创新。我们不能把任何事情视为理所当然。但我们有很多竞争对手。

主持人:但也许不是每个人都知道,有一个术语叫做AGI。

黄仁勋:我为那次回答道歉。我本可以更巧妙地处理。我会在下次做得更好,但他用一个竞争对手让我措手不及。我以为我在一个经济论坛上。

主持人:我只是走进来。我向他的团队提出了一些问题。我说,你看过这些问题吗?他说,没有,我没有看。我想保持自发性。此外,我可能会开始考虑它,那会很糟糕。所以我们就这样即兴发挥。我们两个都是。所以我问,你认为我们什么时候会实现人类水平的通用人工智能?是50年后吗?还是5年后?你怎么看?

黄仁勋:我会给出一个非常具体的答案。但首先,让我告诉你一些正在发生的非常令人兴奋的事情。

首先,我们正在训练这些模型,使它们具有多模态性,这意味着我们将从声音中学习,从文字中学习,从视觉中学习。我们只是看电视并从中学习,等等。这之所以如此重要,是因为人工智能需要有根基,不仅仅是人类价值观。这是Chat GPT真正创新的地方。我记得我们之前有大型语言模型,但直到强化学习,人类反馈,人类反馈,将人工智能扎根于我们感觉良好的人类价值观。

现在,你能想象,现在你必须生成图像和视频之类的东西吗?人工智能如何知道手不会穿透讲台,脚站在地面上,当你踩在水上时,你会掉进去。你必须在物理上扎根。

目前,人工智能必须通过观察大量不同的例子,理想情况下主要是视频,来学习世界中的某些属性。它必须创建一个所谓的世界模型。首先,我们必须理解多模态。还有许多其他模态,如我之前提到的基因和氨基酸、蛋白质和细胞,这导致了器官等等。所以我们希望多模态。第二是越来越强的推理能力。我们已经做了很多推理技能。常识是我们所有人都默认的推理。我们的许多知识,互联网上已经编码了推理,模型可以学习那个。但还有更高层次的推理能力。例如,有些问题你问我。

现在,当我们谈话时,我主要是在做生成性AI,我没有花太多时间推理问题。然而,有一些问题,比如规划问题,这很有趣。让我想想。我在脑海中循环,我提出了多个计划。我穿过树,我遍历我的图,我修剪我的树,说这没有意义,但我会玩,我会在脑海中模拟它,也许我会做一些计算等等。那种长思考,那种长思考AI今天不擅长。你提示ChatGPT的一切都是即时回应,我们希望提示ChatGPT给它一个使命声明,给它一个问题,让它思考一会儿。不是吗?

那种系统,计算机科学称之为系统思考或长思考或规划那些事情,推理和规划那些问题。我认为我们正在研究这些事情。我认为你可以看到一些突破。所以在未来,你与AI的互动方式将会非常不同。有些只是给我一个问题,回答。有些是说,这里有一个问题。去工作一会儿。明天告诉我,它会做尽可能多的计算。你也可以说,我要给你这个问题,花1000美元,但不要花超过那个。它会回来给出最好的答案,等等。

所以那个就是AGI的问题,AGI的定义是什么?事实上,这是最高的问题。现在,如果你问我,AGI是通过一系列非法测试,记住,工程师只能知道,工程师知道,我们在这个享有盛誉的组织中,没有人确切知道工程师需要有一个规范,你需要知道成功的标准是什么。你需要有一个测试。

现在,如果我给AI很多数学测试、推理测试、历史测试、生物学测试、医学考试和律师考试,以及你能想象到的每一个测试,你把这个测试列表放在计算机科学行业面前。我猜在5年的时间里,我们会在每一个测试中都做得很好。如果你对AGI的定义是它通过人类的测试,那么我会告诉你5年。如果你以稍微不同的方式问我,AGI将拥有人类智能。

但我不确定如何具体怎样定义你所定义的 AGI 。没有人真正知道,因此,作为一个工程师,很难实现。这有意义吗?所以答案是我们不确定,我们都在努力让它变得更好。

主持人:我要再问两个问题,然后我会把它交给在座的观众。第一个问题是,你能深入一点,谈谈你如何看待AI在药物发现中的作用?

黄仁勋:我们理解拥有数字信息的含义。现在,我们有很多氨基酸,因为AlphaFold我们可以了解许多蛋白质的结构。

但问题是,这个蛋白质的含义是什么?这个蛋白质的功能是什么?如果我们能像和ChatGPT聊天一样,和PDF文件聊天,你把PDF文件,不管是什么,加载到Chat中,然后就像和研究人员聊天一样。你只是问,是什么激发了这项研究?它解决了什么问题?突破是什么?当时的艺术状态是什么?有什么新颖的想法?就像和人类一样聊天。在未来,当我们拿到一个蛋白质,把它放入Chat GPT,就像PDF一样,你是什么?什么酶激活你?什么让你开心?

例如,将会有一长串基因,你将代表一个细胞。你要把那个细胞放进去。你是什么?你有什么用?你擅长什么?你有什么希望和梦想?所以,这是我们可以做的最深刻的事情之一。如果我们能理解生物学的含义?你们知道,一旦我们理解了世界上几乎任何信息的含义,在计算机科学的世界里,在计算的世界里,杰出的工程师和杰出的科学家就知道该做什么。但这是一个突破,对生物学的多模态理解。

这是我对你的问题的深入和浅出的回答,我认为这可能是我们可以做的最深刻的事情。

主持人:俄勒冈州立大学和斯坦福大学真的很为你感到骄傲。如果我能稍微转换一下话题,斯坦福有很多有抱负的企业家、学生,他们可能是计算机科学专业的,或者是某种工程学专业。你会给他们什么建议,来提高成功的机会?

黄仁勋:我认为我的一大优势是,我期望值很低。我认为大多数斯坦福毕业生期望值很高。你们应该有这样的期望,因为你们来自一所伟大的学校。你们非常成功,你们是你们班级的顶尖学生。显然,你们能够支付学费,然后你们毕业于这个星球上最好的机构之一。你们周围都是其他令人难以置信的孩子。你们天生就有很高的期望。期望值很高的人通常韧性很低。不幸的是,韧性在成功中很重要。我不知道如何教你们,除了我希望痛苦发生在你们身上。我很幸运,我成长的环境中,我的父母为我们提供了成功的条件,但同时,也有足够的挫折和痛苦的机会。

直到今天,我在我们公司里用“痛苦和折磨”这个词,非常高兴。

原因是,你想要训练,你想要塑造你公司的性格。你想要他们表现出伟大,伟大不是智力。伟大来自于性格,性格是由受过痛苦的聪明人形成的。

所以,如果我能为你们所有人许愿,我不知道怎么做。

主持人:我将再问你一个问题。你看起来非常积极和充满活力。但是,你如何保持你的员工积极和充满活力,当他们可能比他们预期的要富有?

黄仁勋:我被55个人——我的管理团队包围。所以我被直接报告的高管有55个人。我为他们中的任何一个都不写评价。我给他们不断的反馈,他们也为我提供同样的反馈。我给他们的报酬是Excel的右下角。我只需拖动它。实际上,我们的许多高管薪水完全相同。我知道这很奇怪。它有效,我不和他们中的任何一个进行一对一的会谈。除非他们需要我,否则我会为他们放下一切。我从不和他们单独开会。他们永远不会听到我只对他们说的话。我绝不会把任何信息告诉他们,而不告诉公司的其他人。

所以,我们公司的设计是为了敏捷,为了让信息尽可能快地流动,让人们能够通过他们能做什么而被赋予权力,而不是通过他们知道什么。

我得到了,答案是我的行为。

在其中,我如何庆祝成功?我如何庆祝失败?我如何谈论成功?我如何谈论挫折?我每天都在寻找机会,每天都在灌输公司的文化。什么是重要的?什么是不重要的?什么是好的?你如何将自己与好比较?你如何看待好?你如何看待旅程?你如何看待结果?所有这些都是我整天在做的事情。

主持人:下面让我们开放一些问题,先从董事会成员Winston开始。

提问者:我有两个问题。一、你的皮夹克的故事是什么?第二个是,根据你的预测和计算,未来5到10年,为了支持人工智能的发展,需要多少额外的半导体制造能力?

黄仁勋:我感谢这两个问题。第一个问题,这是我妻子给我买的,这就是我穿的。因为我不做任何购物。一旦她找到不会让我痒的东西,因为她知道我从17岁起就认识我,她认为一切都会让我痒。

我说我不喜欢某样东西的方式是它让我痒。所以一旦她找到不会让我痒的东西,如果我看我的衣柜,整个衣柜都是衬衫,因为她不想再为我购物。所以这就是她给我买的,这就是我穿的。如果我不满意,我可以自己去购物。否则我可以穿它。对我来说足够好了。

第二个问题,关于预测,实际上,我非常不擅长预测,但我非常擅长基于第一原则的推理。所以让我先为你推理。我不知道需要多少晶圆厂,但我知道一件事。我们现在做计算的方式。信息是由某人编写的,由某人创建的。基本上是预先录制的所有文字,所有视频,所有声音。我们所做的一切都是基于检索的。这有意义吗?就像我说的,每次你触摸手机,记住,有人写了那个并存储在某个地方。所有模态都是预先录制的。在未来,因为我们将拥有一个理解当前情况的AI,因为它可以接入世界上所有最新的新闻等等,这被称为基于检索的。

好的?它理解你的上下文,意味着它理解你问的是什么。当你和我谈论经济时,我们可能意味着非常不同的事情。基于那个,它可以为你生成完全正确的信息。所以在未来,它已经理解了上下文。而且大部分计算将是生成性的。今天,100%的内容都是预先录制的。如果在未来,100%的内容将是生成性的。问题是,这将如何改变计算的形状,而不会让你感到困扰?这就是我推理的方式。

我们需要多少网络?我们需要多少内存?答案是,我们需要更多的晶圆厂。但请记住,我们也在极大地提高算法和处理的效率。并不是说计算的效率就是今天的样子。与此同时,需求正在上升。这必须相互抵消。然后还有技术扩散等等。这只是时间问题,但这并不改变这样一个事实,那就是有一天,世界上所有的计算机都将100%地改变。

每一个数据中心,价值数万亿美元的基础设施,将完全改变。然后还会有新的基础设施建立在那个基础上。

提问者:感谢你今天的到来。所以最近你说,你鼓励学生不要学习编程。如果是这样,那可能意味着一两件事。你认为从公司成立和创业的角度来看,世界会变得像是由更多的公司组成,还是会变成只有几个大玩家的整合?

黄仁勋:首先,我说得太差了,你重复得也太差了。我并没有说,如果你喜欢编程,那就去编程。如果你想要的是煎蛋,那就去做煎蛋。我不会编程,编程是一个推理过程。这是好事。它能确保你的工作吗?一点也不。世界上的程序员数量肯定会继续很重要。NVIDIA需要程序员。然而,在未来,你与计算机的互动方式不会是C++,至少对我们中的一些人来说不是。这是真的,但对你来说,为什么用Python编程这么奇怪?在未来,你会告诉计算机你想要什么。计算机会说,嗨,我想让你提出一个建造计划,包括所有供应商和建造材料,基于我们为你提供的预测。然后根据这个区域所需的所有必要组件提出建造计划。

好的?然后如果你不喜欢那个,你可以写一个Python程序,我可以修改那个建造计划。所以记住,我第一次和计算机交谈时,我只是用英语说话。

第二次,如果你不喜欢,你可以用Python程序来修改建造计划。所以记住,我刚才说的第一点,我只是想用英语和计算机交流。所以英语,顺便说一下,是人类未来最好的编程语言。你如何与计算机交流?你如何提示它?这被称为提示工程。你如何与人交流?你如何与计算机交流?你如何让计算机做你想要的事情?你如何微调给计算机的指令?这就是提示工程的艺术。例如,大多数人对此感到惊讶,但这对我来说并不奇怪,但这是令人惊讶的。例如,你让我生成一张图片,一只小狗在夏威夷的冲浪板上,在日落时,然后它生成了一个,你说更可爱,让它更可爱。它回来了,更可爱,你又说没有比这更可爱的了。它回来了。为什么软件会这样做?有一个结构性的原因。但例如,你需要知道计算机在未来有这样的能力。如果你不喜欢第一次的答案,你可以微调它,让它在你可以的上下文中给出更好的结果。

甚至有一天,你可以让它完全编写程序来生成那个结果。所以我要说的是,编程已经发生了变化,可能变得不那么有价值了。

另一方面,让我告诉你,因为人工智能,我们缩小了人类的技术差距。今天,大约有1000万人因为知道如何编程而有工作,这让其他80亿人落后。未来不是这样。我们都可以编程计算机。这有意义吗?你只需要看看YouTube,看看所有使用提示工程的人,所有的孩子,他们正在用它做出惊人的事情。他们不知道如何编程。他们只是和Chat GPT交谈,他们知道如果我告诉它做这个,它就会做那个。所以这和未来与人交流没有什么不同。这是计算机科学行业对世界的伟大贡献。我们缩小了技术差距。

提问者:非常感谢。我只是想知道,你考虑过地缘政治风险吗?你认为它会对你的行业产生什么影响?

黄仁勋:地缘政治风险?我们几乎是地缘政治风险的典型例子。原因是我们制造了一种非常重要的人工智能工具,正如John和我早些时候讨论的,人工智能是这个时代的界定技术。

所以美国完全有权决定这种工具应该限制在它认为应该限制的国家。美国有这个权利,他们行使了这个权利。

那么,这与我们有什么影响?首先,我们必须理解这些政策,我们必须保持敏捷,以便我们能够遵守这些政策。一方面,它限制了我们在某些地方的机会,另一方面,它在其他地方打开了机会。

在过去的6到9个月里发生的一件事是,每个国家、每个社会的觉醒,他们必须控制自己的数字智能,印度不能外包它的数据,让某个国家将其转化为印度智能,然后将这种智能进口回印度,这种觉醒,即主权AI,你必须致力于控制你的主权AI,保护你的语言,保护你的文化,为你自己的行业。这种觉醒是我发生在过去的6到9个月里。

提问者:我记得你提到过,你愿意为一定规模的客户定制解决方案,而不是像现在这样更通用的解决方案。你看到自己未来会这样做吗?

黄仁勋:我们愿意定制吗?为什么现在的门槛相对较高?原因是,我们每一代平台,首先是GPU,还有CPU,还有网络处理器。有两种交换机。我为一代产品制造了五个芯片。人们认为这是一个芯片,但实际上是五个不同的芯片。每一个芯片的研发成本都是数亿美元。仅仅为了我们所说的发射,即我们的芯片设计完成,就需要数亿美元。

我每一代有五个这样的产品。然后你还得把它们放进一个系统中,然后你还得有网络设备,你还得有光通信设备,你还得有大量的软件。运行像这个房间这么大的计算机需要大量的软件。

所有这些都是复杂的。如果定制要求非常不同,那么你必须重复整个研发过程。然而,如果定制利用了我们现有的一切,并在此基础上增加了一些东西,那么这是非常有意义的。也许是一个专有的安全系统。也许是一个机密计算系统。也许是一种新的数值处理方式。这可能是可以扩展的。我们非常开放。

我们的客户知道,我愿意这样做,并认识到,如果你改变得太远,你就基本上浪费了我们走到现在所花费的近100亿美元,从头开始。所以他们希望尽可能地利用我们的生态系统。我很愿意这样做,他们知道这一点。

主持人:那么,我认为我们需要结束了。非常感谢John和Jensen。

揭秘OpenAI成长史:理想主义,冲突,抉择与权力斗争

Reading Time: 4 minutes

作者:陈茜

如今现在站在风口浪尖,被神话被仰望但同时又被疯狂批判的公司是谁?没错,就是此轮AI浪潮的领头羊:OpenAI
但OpenAI的成长史并非一帆顺风,背后映射出硅谷的一众大佬、顶级科学家们与资本的理想主义,冲突,抉择和权力斗争
所以,这是一个充满了细节的精彩故事,关于一群拥有纯粹信仰的顶级AI研究员,关于马斯克间接触发了OpenAI的商业化路径,关于OpenAI核心领导人物Sam Altman放弃理想主义去投靠微软,关于微软CEO纳德拉与创始人比尔-盖茨之间的较量,关于ChatGPT惊艳世人背后不为人知的故事。我们硅谷101团队在内部成立了一个AI研究小,加入了不少从业者,希望从专业的角度来深挖更多有意思的技术和故事。而OpenAI崛起这个故事,将是决定人类未来最重要的故事之一。
Mira Murati, OpenAPI CTO
Mira Murati, OpenAPI CTO
2022年3月底,伊隆-马斯克等一众科技领袖发出联名信,以人工智能的安全担忧为由,要求暂停开发更强大的AI系统
Sam Altman, OpenAI CEO
Sam Altman, OpenAI CEO
而Sam Altman这个人,在公关和在商业路径设计上,都太厉害了。所以,随着AI发展派和反对派的声浪都双双的日益高涨,硅谷开始纷纷站队,所以最近又有很多知情人士将OpenAI发展的细节和故事给曝光了出来。我们就结合所掌握的信息,其中包括了我们硅谷101的一些独家线索,再来详细复盘一下OpenAI的崛起

01

理想主义:一群纯粹的顶尖科学家 
2014年,谷歌以6亿美元的价格收购了当时在行业中最顶尖的人工智能研究机构DeepMind,没错,就是之后推出AlphaGo在围棋上打败李世石和柯洁那家AI研究公司。
在硅谷,一众大佬坐不住了。他们比公众更早的看到人工智能带来的潜力与威胁:在未来,谁拥有最强大的AI技术,谁会就有最难以撼动的权力
他们害怕,谷歌会成为垄断式的AI权力霸主 – 而就连谷歌当时“Don’t Be Evil”(不作恶)的公司座右铭都无法消除他们的担忧。所以,根据Wired杂志的报道,在2015年的一个夏天傍晚,几位硅谷最有影响力的人物聚集在斯坦福大学旁边的Palo Alto瑰丽酒店的一个私人会议室中。
没错,就是那个硅谷最贵的豪华酒店。跟很多硅谷项目从车库里出来不同,可能这就预示着含着金钥匙出生的AI项目注定就是一个烧钱机器。
这次会议是由硅谷孵化器YC掌门人Sam Altman发起的,想聚集一些人工智能领域最顶尖的研究员,来讨论共同建立一家AI实验室。这些研究员当中,包括了当时在Google Brain的人工智能研究员Ilya Sutskever,互联网支付处理平台Stripe公司的首席技术官Greg Brockman等。而马斯克会出现在这个会上,也是因为他是Sam Altman的老朋友,并且AI技术对马斯克旗下公司 – 无论是特斯拉还是SpaceX来说 – 都至关重要,并且,马斯克对人工智能的安全问题从很早就开始给出警告。所以,两位有着顶级资源和资本的大佬,带着几位有着顶级技术能力的AI研究员就开始搞事情了。
他们最开始想做的是谷歌的对立面,一家不受任何公司任何资本任何人控制的AI实验室,大家一致认为,这才是让人类更接近以安全方式构建通用人工智能AGI的正确路径。(AGI:具有一般人类智慧,可以执行人类能够执行的任何智力任务的机器智能。)
创业嘛,最重要的是找人找钱找方向。大方向有了,接下来就是人才和钱了。你要做全世界探索AGI的领头羊,你需要的不是一般的人才,而是人工智能届最最最最顶尖的高手。但这些高手分布在各大科技巨头中,被高薪供着,怎么能吸引他们出来呢?
Brockman首先想到的就是2018年获得图灵奖的神经网络三巨头Yann LeCun, Yoshua Bengio和Geoffrey Hinton教授。
这里插一句:本轮人工智能的技术突破正是因为“神经网络”这个曾经不被看好的研究路线获得突破进展,也必须归功于这几名老科学家几十年来在AI寒冬中的坚持,这部分历史起源我们之后准备单开一个AI大模型系列来讲其中的故事,大家记得关注我们硅谷101,敬请期待。
回到Brockman这里,三大巨头中,Hinton教授在谷歌,LeCun教授在脸书,年纪都比较大了、不大可能全职出来。Bengio教授主要在学术界活动,对产业届没多大兴趣,不过Bengio给了Brockman一个名单,上面是AI神经网络领域最优秀的研究人员。大家记一下这个时间线哈,结尾的时候还有一个关于Bengio蛮讽刺的小反转。
Brockman当时一拿到这个名单就像一本武功宝典一样,赶紧回来和大家开始去联系这个名单上的所有人。
但是,问题来了:刚才我们说到,这些顶尖科研人员在科技大厂里面薪酬非常高,要拉他们出来,还是一个非营利组织,前途未明、空有一张大饼,还是不太容易的。怎么突破呢?诶,这里就要说到硅谷另外一个地理优势了:Napa酒庄
从硅谷往旧金山开一个多小时,就是美国最著名的产酒地区:纳帕溪谷。在硅谷星巴克谈不成的事情,拉去Napa酒庄住一个周末,就不一定谈不成了Brockman不愧是创业多年的老手,在Bengio给他的名单上,选了10个他觉得最重要的研究员,拉去了Napa酒庄度过了一个周末。Brockman对Wired杂志就描述说,当你在Napa酒庄将人们聚集在一起的时候,会很容易产生化学反应。你被困在那里,你必须说话,必须参与。
在度过了一个周末、要离开Napa酒庄的时候,Brockman邀请了这十名研究人员加入OpenAI,并给了他们三周时间考虑。而在这三周,硅谷的科技巨头们听到了OpenAI的风声,开始出更高的薪资,要留住这些顶尖AI研究员。而正因为科技巨头的留人行为,OpenAI不得不推迟对外宣告成立的时间。要知道,这些顶尖AI研究员的工资已经很高了。
媒体报道原文是“Eclipsed the cost of a top quarterback prospect in the NFL”(超过了美国NFL橄榄球联赛中的顶尖四分卫的薪水),我平时不是橄榄球的粉丝不是很有概念,然后去查了一下,结果吓一跳:这些顶级橄榄球星的薪水都是几百万、上千万美元的,也就是说,最顶级的AI研究学者在科技巨头中的年薪也是这个价格,当然可能还包括股票啥的。
而且,据其中一名研究员说,在得知他们有意向离开的时候,科技巨头们为了留住他们开出的新价格,是这个行业中已经如此高薪的工资的再2-3倍。
但是,就算大公司们给出了这么极具诱惑力的年薪,十位受邀请的AI顶尖学者中,有九位都拒绝了高薪、加入了OpenAI也不知道是不是Napa的红酒起了作用。OpenAI完全没有实力来match这么高的薪水,因为OpenAI最开始是非营利组织所以每年要公布支出。税务文件显示,给首席技术官Ilya Sutskever的薪水是大概190万美元,另外一个首席研究员Ian Goodfellow是80万美元,这两人都是从谷歌挖过来的,虽然当年他们的薪水公布之后是引发了一些舆论争议,觉得在非营利组织里面这个公司太高了。但是,我们要知道,他们从谷歌出来加入OpenAI,这个薪水下降得不是一点半点。我把OpenAI的历年报税表给找出来了,上面有蛮多有意思的信息的。
OpenAI第一年的花销是1123万美元,其中超过665万是50多名员工的工资。平均算下来,在硅谷的水平也就真的还好。
而这些放弃高薪的顶尖科学家们,加入这样的一个充满巨大不确定性的非营利组织,没有股权没有慷慨福利没有豪华年会没有明确的升值路径,其实就是因为一个很纯粹的目的聚在一起。这个目的,也写在了OpenAI的创立章程中:确保通用人工智能(AGI)造福全人类
2015年底,我们上面提到的YC总裁Sam Altman、Strip前CTO Greg Brockman、LinkedIn创始人Reid Hoffman、YC联合创始人Jessica Livingston、著名投资人Peter Thiel、特斯拉创始人Elon Musk、亚马逊AWS、Infosys公司和YC Research宣布成立OpenAI,并承诺给这家非营利组织机构投资超过 10 亿美元。由于OpenAI的非营利组织形式,没有人拥有公司任何股份或权益,而公司的财产和收入永远不会派发给任何捐赠人或业主。OpenAI表示,将通过向公众开放其专利和研究,并且会与其他机构和研究人员“自由合作”
听上去是不是很理想主义、非常乌托邦?最开始确实挺振奋人心的,但很快,OpenAI内部冲突四起。

02

冲突加剧:马斯克的决裂
冲突的起因很简单,人工智能技术,是一件耗钱耗资源耗算力耗时间的事情最开始,这些最顶尖的研究员和硅谷最有影响力的资本家们还可以为爱发电,但真正开始做的时候,发现烧钱是个无底洞,而看看OpenAI的对手们,哪个不是手握千亿美元资金的科技巨头。并且,我们硅谷101在跟OpenAI早期实习生聊的时候,对方回忆说,当时办公室座位,前后左右都是业界最牛的大佬,每个人想法都不一样,大家擅长的方向和领域也可能不一样,还没找到一个着力点,让这批世界上最牛的AI科学家们拧成一股绳一起发力。这个时候是最难的,谁也不服谁。
确实在早期,OpenAI被谷歌的DeepMind各种吊打
而且从税表上我们也可以看到,最开始,硅谷大佬们承诺的10亿美元也不是一下就全部到位的,而是分成好多笔一点点到账,这意味着OpenAI每年的预算都有限,也不敢乱花做个对比,在OpenAI报税表上,我们看到2017年,OpenAI的职能支出在2866万美元,其中云计算上就花了790万美元,训练模型的CPU和GPU甚至都要从谷歌那么去租。对比一下背靠谷歌这颗大树的DeepMind,2017年的总支出是4.42亿美元,想要云计算,想要CPU/GPU,随便在谷歌调用,你看这资源和资金差距,是不是有点大。
并且在早前,OpenAI发布的研究结果并没有掀起什么水花,反而谷歌那边各种风光一时无两。
比如说在OpenAI发布的OpenAI Gym和Universe让它在圈内稍有名气的2016年,诶,谷歌DeepMind的AlphaGo击败了围棋顶级选手李世石,引发全民对AI的关注。2017年,好不容易OpenAI在Dota2游戏上战胜了人类顶级选手,你说可以火一把了吧,结果谷歌发布了Transformer模型,这个模型是奠定所以大语言模型的基础架构,反正就是震惊整个业界的牛。然后在2018年,OpenAI基于Transformer发布了GPT第一代,结果谷歌随后重磅发布了跨时代意义的Bert,比GPT参数大四倍,几乎所有表现上都碾压GPT。
稍微说一句哈,以上提到的产品,技术和模型如果大家听得有点云里雾里,没关系,我们之后的大模型系列会专门详细说说这些技术的进化。反正今天这个视频里,大家知道,2018年底之前,谷歌都全面碾压OpenAI就可以了
这个时候,业界对OpenAI各种不看好,之前好不容易请来的很多技术大佬,不少又回谷歌脸书这些大厂了,公司面临着严重的人才流失、军心不稳
在2018年的时候,我们的马斯克大佬就坐不住了。气势汹汹来问罪说:你们都在干嘛,烧了钱出不来活儿,说好的要领先谷歌率先达到AGI呢,结果落后这么多!对马斯克熟悉的观众们都知道,马斯克是非常有占有欲和掌控欲的,根据科技媒体Semafor的信源爆料,马斯克就直接向OpenAI的董事会提议,我要全面接管OpenAI,我来当CEO。
但是在2018年那会儿,大家可能还记得,马斯克他本人已经被特斯拉搞得焦头烂额,当时Model3又遭遇了生产地狱、被市场疯狂做空、质疑很快就要破产了,而马斯克每天就睡特斯拉工厂里。
就这样,马斯克还想再全部接管OpenAI这个完全不同赛道的AI实验室,OpenAI的董事会肯定觉得不靠谱,就拒绝了马斯克的提案。于是,Semafor和Wired杂志等媒体报道,马斯克非常不爽,甩手就走人了。
当然还有其它的一些说法,包括马斯克先挖走了OpenAI的核心研究员Andrej Karpathy去特斯拉做自动驾驶的主管,这就让OpenAI的人不太爽,怎么还带挖自己墙角的。所以利益冲突和矛盾慢慢就起来了,哦补充一句,最近这哥们儿又跳回OpenAI了,感觉里面的瓜不少。当然,还有一些阴谋论我们就不在这里展开了,总之,2018年,马斯克宣布退出董事会,当时在媒体上大家关系都做得挺好看,马斯克也表示在离开董事会之后将继续捐赠和支持OpenAI。
但是,马斯克在离开之后,就立即停止了捐赠。
Wired杂志以及网站Semafor都报道,此前,马斯克承诺在几年内将向OpenAI捐赠10亿美元,而马斯克和OpenAI分手之际,他兑现的捐赠仅在1亿美元。也就是说,马斯克的离开和他尚未兑现的捐赠,将OpenAI一下推到了一个非常不利的境地:训练AI模型比之前想象得要更烧钱,如果公司无法找到技术突破点、一直被谷歌等大公司碾压,那么很快只能关门大吉。
就在这个时候,Sam Altman意识到,自己必须要站出来了
在2018年之前,Sam在公司内部只是一个“董事”的职位,CEO一直是Greg Brockman。根据当时OpenAI的实习生回忆,在公司不太见得到Sam本人,因为他那个时候还是YC的掌门人,很大的一部分时间其实在管理那边的事物和孵化YC的创业项目。
OpenAI的税务文件显示,直到2018年,Sam才把自己的职称在董事之外,加上了总裁President一职。随后,马斯克退出了OpenAI董事会,再之后,Sam在2019年接替Brockman成为了OpenAI的CEO,Brockman退成了CTO首席技术官。这意味着,Sam辞去了YC总裁的职位,正式将工作重心转移到OpenAI这边
对于Sam来说,正是与马斯克的决裂让他对非营利组织的模式产生了动摇。而正是因为他放弃纯粹的非营利组织模式,转而探索更现实的商业路线,OpenAI和ChatGPT才能出现在如今众人的眼前

03

起死回生:Sam Altman选择的商业道路
先来说一下Sam这个人。Sam是一个很神奇的存在,经常和马斯克一样被怀疑是机器人或者是人工智能。他甚至对记者开玩笑说,我要多去几趟厕所,这样你才不会怀疑我是个AI
Sam非常年轻,1985年出生在一个犹太家庭,美国芝加哥出生,密苏里州长大,8岁学会编程,16岁宣布出柜,本科考上斯坦福,大二选择退学创业,进入硅谷孵化器YC的首批孵化项目、开发了一个名为Loopt的应用,在2012年以4300万美元被收购,27岁的Sam因此获得了第一桶金,500万美元。之后,YC创始人Paul Graham准备退休、将28岁的Sam推上了YC总裁的掌门人席位。之后Sam在执掌YC,投资并孵化众多硅谷项目的同时,联合其它几个投资人成立了Hydrazine Capital风投基金用于投资YC的项目,在成立四年后翻了10倍,让Sam很早就实现了财富自由。
短短几行字我们能感受到,Sam是一个天分极高、极其聪明、忠于自我、追求极致效率的人
2016年《纽约客》有一篇报道用非常非常长的篇幅介绍了Sam,其中有几点细节描述我印象特别深:
首先是对Sam的外貌描述,说Sam本人很瘦小,1米7左右,只有130磅(大概59公斤),眼睛是绿色,眼神犀利得像黑夜中的巨角猫头鹰。巨角猫头鹰和猫头鹰是有区别的,前者是非常犀利的那种,而对比之下,猫头鹰就有点萌萌哒。而且Sam的坐姿很奇怪,会把自己卷起来,经常被误会有“阿斯伯格综合症”。
此外,在他的工作方式上,对自己和对同事都很苛刻,要求非常高,性格也比较冷漠偏执,情绪不太稳定,超级爱加班甚至一度患上了败血症。同时,他对不感兴趣的事情和人都超级没有耐心,会在员工讲话的时候毫不眨眼的盯着你,给对方施压加快速度。所以就是这么极度高效极度勤奋和极度聪明的人。这一点倒是和马斯克和乔布斯都挺像的。
Sam Altman的最大优势是在于清晰的思路和对复杂系统的直觉把握,也就是商业战略和野心。他对技术细节并不感兴趣,让Sam最着迷的是技术对世界的潜在影响他的这种能力其实对于科技创业非常关键,这也许是为什么Paul Graham在选YC继承人的时候出人意料的选了Sam。
因为说实话,当时硅谷很多人对Sam这个人选是不服气的。Sam当时还太年轻,并且他第一次的创业也不是特别成功。Sam创业的Loopt一度估值达到1.75亿美元,但是后续融资不顺利,导致出售价格4300万美元,差不多就是融资的额度,这意味着对风投来说是负回报,所以Sam本人也说第一次创业的经历是完全的失败。然而,Paul Graham就是觉得,Sam就是他要找的人,他没有一个人选的名单,就只有Sam这一个选项。
而Sam在担任YC掌门人的时候,完全展示出了他的野心,基本上重组了YC的模式YC在Sam之前的模式是,每年从上万家初创公司的申请信中挑出200家左右,给他们每家12万美元,占股7%,然后孵化三个月,毕业这天给众多知名硅谷VC风投演示demo,之后继续融资,成长,做大做强。
但Sam不满意YC的模式,认为YC之前的做法只是把创业者送上摇摇晃晃探险的小船,送他们出海仅此而已,Sam想做的是搭建一只背靠强大帝国的铁甲舰队。意思是:YC不仅满足于占股7%,而是要用更多的资本在项目早期给予更大的支持,从YC孵化完成后的成长过程中还要继续投资这些公司。并且Sam不满足于YC每年打造两百家公司,而是想要打造一千家、一万家。并且他希望,这些公司形成的万亿市值的大船,能真正意义上的推动人类发展。
很讽刺的是,在过去几年的时间,硅谷出现了一个比较尴尬的局面:虽然投资人和创业者都高喊着要改变世界要有雄心壮志要shoot for the moon,但真正落到实处,VC们的关注点却经常落在:什么时候能变现,客户增长曲线能否好看,利润能不能更厚一点这样的“六便士”问题上,希望创始人专注于打造某一区域的租赁平台或者送货服务;而那些“月亮”项目,比如说核聚变,生物科技,人工智能这些硬技术上,大家出手得越来越谨慎。所以“硅谷已死”的言论在过去几年出现很多。
Sam接管YC之后,马上就写了一篇文章发表,标题是“Science seems broken”(科学看上去破产了)来警醒硅谷和学界,并呼吁能源、生物技术、人工智能、机器人和其他硬科技领域的公司提出申请。Sam认为,YC身为最有影响力的孵化器,只有公开支持这些硬科技的项目,大学里的学生们才会继续对这些领域保持兴趣,创业者也才会更有信心。所以,Sam执掌下的YC开始筹集更多的资金去支持项目,甚至成立了一个名为YC Research的非营利组织去对那些异想天开的科研想法进行纯粹研究。连硅谷著名的风险投资家Marc Andreessen都评价说:“在 Sam的领导下,YC的雄心壮志水平提高了 10 倍” 而也许这就是当年Paul Graham一定要Sam接任的原因,因为他意识到,“Sam的目标是创造整个未来”。
而但Sam在执掌YC几年后,OpenAI走到了命运的十字路口,Sam辞去YC的职位,全职加入OpenAI。就在马斯克退出董事会、切断资金捐赠时,Sam Altman意识到,如果他不站出来主导转型,那么OpenAI只有倒闭这一条路。现在,他要重新再设计架构,在商业和社会责任中去寻找一个平衡点。 
Sam去找了硅谷著名投资人Reid Hoffman和Vinod Khosla。
前一位大家很熟悉了,我们最开始提到过,是OpenAI最开始的捐赠人之一,后者是亿万富翁,也是太阳微系统公司(Sun Microsystems)的联合创始人,之后创立了自己的风投基金Khosla Ventures。Sam的需求是上千万美元,但不再以捐赠的方式,而是同意创建OpenAI营利性部门的条件。Hoffman和Khosla两名大佬在反复讨论了未来回报之后,写了支票
2019 年 3 月 11 日,OpenAI宣布在母公司OpenAI Inc的非营利主体下,创建一个限制性营利实体OpenAI LP。
为了保留控制权,OpenAI Inc这家非营利组织实体将作为General Partner普通合伙人,意味着OpenAI Inc的董事会来负责新公司的管理和运营。在OpenAI Inc的董事会席位中,三个席位是员工,包括Sam Altman为CEO,Ilya Sutskever为首席科学家,Greg Brockman是董事长兼总裁
然后非员工的董事会席位包括Quora的联合创始人兼职CEO Adam D’Angelo, 投资人Reid Hoffman, 前共和党联邦众议员Will Hurd, 乔治城大学安全与新兴技术中心战略总监Helen Toner,还有机器人公司Fellow Robots的首席执行官Tasha McCauley(对了,这里插一句,她老公是谁你可能想象不到)没错,就是参演过《和莎莫的500天》《黑暗骑士》《盗梦空间》《史诺登》中的好莱坞文青男神约瑟夫·莱维特Joseph Gordon-Levitt。
是不是瞬间觉得这个董事会名单有点八卦了,别着急,还有一个大瓜,你们知道另外一位女性Shivon Zilis是谁吗?她,就是马斯克现在最小的双胞胎娃的妈。是不是这八卦值蹭一下就上去了。
这对双胞胎是2021年11月出生的,是马斯克的第8和第9个娃。Zilis在2016年担任OpenAI的顾问,估计在那个时候认识的马斯克,之后跟随马斯克去了特斯拉,后来去了马斯克旗下的脑机接口公司Neuralink,但一直担任OpenAI的董事。
但3月份马斯克开始和Sam对呛之后,估计Zilis也很尴尬,就离开了董事会。八卦时间结束,回到公司架构上。
这些OpenAI的董事会成员只有少数人持有OpenAI LP的股份注意一下,大家的持股都是营利实体Open LP的,大实体OpenAI Inc是非营利组织架构不能持股。

而投资人和公司员工拥有OpenAI LP的股份,被称为,LP有限合伙人,他们的回报上限是100倍。OpenAI大概率不会走上市这条路,也多半不会接受被收购,那么投资人的退出方式则是每年的利润分红,在未来,一旦累计分红超过100倍的回报,资金就会自动流入OpenAI Inc非营利组织的账户中。而当LP和公司的使命发生冲突的时候,要由没有持股的董事会成员来投票。

这里有一个重要的知识点,Sam Atlman本人没有在这个新架构中拥有任何持股,一股都没有,只拿了每年6万多美元的基本工资
The information报道说,Sam对外宣称是因为他已经足够富有,不需要更多的金钱回报了,并且Sam不拿股份这件事情也劝退了很多投资人,因为硅谷的逻辑是,一个公司的CEO要有足够的激励去创业,不拿股份可能意味着你自己也不看好公司的前景。但如果我们回到公司董事会投票的章程上,可以猜测,Sam不拿股份是为了在LP和公司使命起冲突而需要没有持股的董事会成员来投票时,他能够有投票权。也就是说Sam希望用放弃金钱上的激励,来换取权力上的激励
就像最懂Sam的Paul Graham在接受媒体采访时说的那样:
“一个人为什么要做一些不会让他变得更富有的事情?一个答案是,很多人一旦有了足够多的钱就会这样。另外一个答案是,他喜欢权力。” Sam可能是前者,也有可能是后者。
OpenAI的商业化转型招致了大量的外界舆论争议与批评。但对Sam来说,似乎也没有选择。当他意识到理想主义行不通时,就毅然选择了实用主义,但也尽最大可能去平衡了这两者,他的选择看上去确实都是最优解。
2018年,OpenAI已经确定了基于Transformer模型的GPT路径,接下来需要大量的算力和参数去训练。人才和资金都是接下来缺一不可的。
OpenAI LP的新架构能给员工们提供类似初创公司的股权激励,稳定住了军心,同时,这样在硅谷史无前例的新架构也吸引了一位同样雄心勃勃的大LP投资方:微软

04

Nadella的抉择:无视盖茨的反对
现在我们看微软对OpenAI的投资,很多人会说,微软太聪明了,这个投资太好了,太有眼光了。但如果我们回到过去,会发现,这个决定也没有那么简单。Satya Nadella在2014年接替比尔-盖茨、被任命为微软CEO之后,一直非常支持人工智能技术的研发。但微软在AI上也摔过一个大跟头。

微软在2016年就尝试过推出一款AI聊天机器人Tay,并在Twitter,Facebook,Snapchat和Instagram所运营的社交媒体上都发布了这款软件。然而很快,Tay就被网友们玩坏了,故意教会Tay说具有攻击性的言论,所以很快在Twitter上,网友们就开始各种收集Tay说的反犹太人言论,各种种族歧视,性别歧视,脏话等等。结果Tay发布不到一天就被关闭。

 

The information报道,虽然摔过跤,但Nadella依然非常看重AI的潜力,试图鼓励让微软各部门都尝试用AI模型来提升产品,也和英伟达达成了协议来开发训练AI的GPU。种种迹象都让微软成为了Sam Altman眼中的一个非常有吸引力的合作伙伴,多次前往西雅图试图达成交易

然而,当Nadella想在微软内部推动和OpenAI的合作的时候,他受到了相当的阻力,一部分的阻力来自于微软创始人比尔-盖茨。

虽然比尔-盖茨在2008年退出微软的日常工作之后,媒体对他的很大曝光是慈善,还有在抗击贫困、疾病和气候方面的项目上,但老爷子依然有大概20%的时间是在审查微软新产品上的。其中,在2019年,微软和OpenAI接触的时候,比尔-盖茨亲自参与了对OpenAI合作的审查中, 而且表示了,自己不喜欢这项投资,并持有怀疑态度

但是,比尔-盖茨在名义上是不再参与微软的日常运营,Nadella有权力自己做决定。所以,Nadella还是决定押注AI。

2019年7月,微软宣布与 OpenAI 建立合作伙伴关系,向这家初创公司投资10亿美元,成了OpenAI的大投资人LP。

 

但如果我们仔细来看这个deal,会发现,其实Nadella还是很精的。媒体都在广泛报道微软投了OpenAI10亿美元,但事实上,这个10亿美元中,大部分都以微软的Azure云服务积分的形式兑现,没太用额外的新现金,相当于OpenAI免费用微软的云服务来训练和运行AI模型而微软获得了OpenAI技术的独家权,可以在Bing搜索等产品上使用OpenAI的大部分技术
对于微软来说,还顺便有个好处就是捅了谷歌一刀,因为OpenAI一直是谷歌云的最大客户之一,2019年和2020年一共给谷歌交了1.2亿美元的云计算费用。所以,不用太多的现金就得到一个新伙伴,同时还打击了竞争对手,Nadella这步棋简直是一石二鸟有没有。
但是要知道,在与OpenAI合作期间,除了刚才说到的比尔-盖茨,Nadella还遇到过很多压力,大多数是财务和资源上的,因为OpenAI需要的算力太大了
2019年发布的GPT-2有15亿的参数,2020年5月发布的GPT-3有1750亿的参数,每一次GPT的升级,参数量都是指数型的上升。
后来训练ChatGPT的时候,CNBC报道,微软专门为OpenAI推出了一台全球前五的超级计算机,用了1万个英伟达的DGX A100 GPU。我稍微算了一下帐,每个DGX A100的server服务器上有8个GPU、卖价是20万美元,所以ChatGPT用了1250个A100 GPU服务器,也就是2.5亿美元。另外,训练一次大模型就要几百万美元,每年的云成本也都上亿。

而同时,微软还面临着2022年开始的美联储加息周期下的资本寒冬、上万人的裁员,所以,Nadella对OpenAI全力的支持不是没有压力和风险的《纽约时报》报道说,在2019年到2023年期间,微软其实又给OpenAI投资了20亿美元,但这笔交易细节没有公开,所以我们不知道这20亿里面是什么条件,但这都不重要,因为很快,Nadella会发现,自己赌对了。

OpenAI在2020年5月发布的GPT3引发了业内轰动,紧接着基于GPT3.5的ChatGPT在2022年底发布之后一鸣惊人,直接让谷歌拉响“红色警报”。

2023年,微软决定更深度合作。这次的投资额度是:100亿美元,持股OpenAI的49%。

新的谈判条款依然对微软很有利。这次的投资协议对未来的利润分配有了更详细的规定:

第一阶段:100%利润全部给到初始和创始投资人,直到投资人回本;

第二阶段:25%利润给到员工和支付投资人的回报上限,剩余75%给到微软直到回本、收回130亿美元投资额;

第三阶段:2%给到OpenAI Inc非营利组织,41%给到员工,8%支付投资人的回报上限,剩余49%支付微软的回报上线。

第四阶段:等到所有投资方的回报结清,100%的权益回流到OpenAI Inc非营利组织。

对于微软来说为什么是一个非常有利的协议呢?因为首先,这100亿美元的投资也不是全现金,而中间可能很大部分像之前投资那样,是OpenAI使用微软超级计算集群的权利和credit积分,就相当于OpenAI先用着微软的资源,然后慢慢还钱,并且还以数倍的价格给分红,这简直相当于高得不能再高的高利贷了。

这里要注意,最开始OpenAI规定的是初始投资方的最大回报是100倍,之后进来的投资人回报率是相对打折扣。基于此,《财富》杂志预测,在未来,OpenAI会还给微软130亿美元的本金之外,微软还会分得大概920亿美元的利润回报。是不是很赚。

并且,The information还给了一个爆料,说OpenAI正在考虑放松最多100倍回报的限制,改成每年将利润分配增加20%。这个消息还没有正式公布、可能还会有变数,但确实给了像微软这样的投资人更有潜力的未来回报,这也使得一些已经分配给员工或投资人的OpenAI股份也正在被风投基金争先恐后的抢购,

在去年,红杉资本、老虎全球、Bedrock Capital 和 Andreessen Horowitz就用200亿美元的估值,从OpenAI员工和之前投资人那里入股了OpenAI。而可想而知,在今年ChatGPT爆火之后,OpenAI的股票会在一级市场中多么吃香。

而确定的是,OpenAI和微软签署的条款意味着,OpenAI接下来一定会推动商业化进程,确实我们也看到OpenAI开放了API借口,ChatGPT也推出了付费版本商业变现压力是很大的,毕竟有金主爸爸们在后面等着还钱。
但对于微软而言,投资OpenAI的战略意义远高于投资回报,ChatGPT的横空出世与微软的产品紧密联动,比如现在的New Bing已经链入了ChatGPT,对谷歌搜索造成了降维打击,另外,微软还在继续将OpenAI的人工智能技术整合到旗下的各类软件、GitHub编码工具、Microsoft 365工具套件还有Azure云服务中,整个微软的产品升级速度非常快。这使得微软一跃成为此轮AI风口的先驱。

微软之前一直没有披露人工智能业务的规模,只是在去年10月提过一嘴,说Azure的机器学习服务连续四个季度翻番,而富国银行就预测,AI的应用将为微软每年新增超过300亿美元的营收,其中大约一半来自云服务Azure。

也就是说,OpenAI就算还不上钱了、或者分红很慢,也没关系,因为微软可以自己用AI赚回来
所以,不得不说,投资OpenAI的这步棋,Nadella走得真是太有远见了。
而当年差点毙掉OpenAI投资的比尔-盖茨现在也开始自豪的讲述与OpenAI团队的接触故事,引发马斯克在推特上毫不留情地反怼说:“盖茨当年对AI的理解有限,现在依然如此”。

但无论如何,盖茨因为Nadella的坚持而重新让微软走到了最有利的位置,而马斯克这位“前人种树被后人乘了凉”的联合发起人,现在不仅跟OpenAI半点关系都没有,还只能在网上和Sam对呛,实在有点不甘心。试想一下:如果当初马斯克没有直接甩手走人,而是履行剩下9亿的承诺呢?结局会不会不一样?

一些在生成式人工智能竞赛的最新进展,《金融时报》报道,Elon Musk正式加入竞赛、开始了他自己的人工智能公司。

不过,最近媒体报道说马斯克从2月份就开始组建AI团队,已经从英伟达购买1万张GPU芯片,并从谷歌的人工智能部门DeepMind招募了两名大将,也开始加入到这场AI混战。我们也拭目以待,马斯克是否也能最终推出自己的大模型来和OpenAI一较高下。

05

不那么“纯粹”的未来:OpenAI会如何?

OpenAI如今站在了浪潮的最前方,但竞争才刚刚开始。OpenAI有领先优势,但优势不多。如今科技巨头们看到ChatGPT大模型的成功范式,开始纷纷入局。训练大模型不难,论文和技术都是现成的,堆钱堆算力就可以,但接下来难的,是如何将成本降下来,以及商业化模式的探索 

1965年,时任仙童半导体研究负责人、后来成为英特尔联合创始人之一的戈登·摩尔发表论文预测集成电路芯片上可容纳的晶体管数量,每隔18-24个月便会增加一倍,微处理器的性能提高一倍,或价格下降一半。这就是大名鼎鼎的“摩尔定律”。

而Sam预测,新版摩尔定律很快就要来了,他认为,宇宙中的智能每18个月翻一倍。但这句话有点模糊,到底是什么翻一倍,Sam没有具体做解释,这也是引发了学术界的很多争论,以及对人工智能安全进行监管的呼声也越来越高。

在GPT4发布的两周后,马斯克联合1000多人,其中不乏很多业内知名科学家和科技领袖签署公开信,呼吁所有 AI 实验室应立即暂停训练比 GPT-4 更强大的 AI 模型,为期至少 6 个月。

这个名单上有一个的名字特别引起我的注意:Yoshua Bengio,是不是看着有点眼熟?没错,就是我们片子开头提到的,给OpenAI“武功宝典”人才名单的图灵奖得主。Bengio可能在当年也没想到,自己未来有一天会后悔当初出的这一份力。
如今看来,各大科技巨头的AI军备竞赛一旦开始,就很难停下来了,除非有全球政府和人类社会的强烈共识和监管,就像当年的克隆技术一样。目前,意大利以违反欧洲严格的数据隐私法 GDPR 为由暂时禁止了 ChatGPT,不排除之后有其他国家效仿,但在那之前,OpenAI与它的竞争对手们是不会停下的,因为领先意味着未来的市场份额,影响力和话语权。囚徒困境这道题在人类社会,百试不爽。

也许,OpenAI诞生的那天就注定人类通向AGI的这条路是不够纯粹的,会充满冲突、利益争夺与权力斗争。但是,这才是人性啊。很多悲观论调认为,作为如此逐利、贪婪、矛盾的人类,我们训练出的人工智能,怎么能保证其纯粹性呢?而在跟一个专业人士聊天时,他提醒我,目前大家看到的OpenAI版本是经过了好几个月的“阉割”,也就是雇佣了非常多人类审核员去剔除掉那些有害的、暴力的、有侵略性的语言参数,而未阉割版本的GPT模型是一个巨大的monster怪兽,OpenAI在守着这个怪兽不会将它放出来,Sam就像之前描述的那只巨角猫头鹰,在黑暗中为我们放哨。可是我们能相信Sam,能相信OpenAI吗?

Sam和马斯克等人一开始不相信谷歌所以创造了OpenAI,而如今,马斯克和Sam也互相不相信了。他们都觉得,自己才是能守住怪兽的人。

在结尾,我们再回到Sam和一众大佬们刚创立OpenAI的这一天。《纽约客》的文章描述到说:Sam在OpenAI位于旧金山的新办公室做的第一件事,就是走到会议室的墙上,写下有着“核动力海军之父”Hyman Rickover说过的一句名言。

这句话是:“生命的伟大目的不是知识,而是行动我们每个人都有责任表现得似乎世界的命运取决于我们,我们必须为未来而活,而不是为了自己的舒适或成功。” 

目前为止,Sam似乎是在这么做的,虽然他的商业化路径和在早期就将ChatGPT推向大众招致了很多骂名。但仍然要强调的是,Sam只是前方制定策略的人,但我们不要忘了,OpenAI的成功还是要归功于一种顶级科学家们,这包括放弃高薪出来加入OpenAI的这群人,还有ChatGPT所用到谷歌开源的Tranformer模型范式和RLHF基于人类反馈的强化学习方式背后的论文作者和研究科学家,以及再往前追溯,不放弃“神经网络”路径、坚持了几十年的的三名老科学家。科技的进步离不开这些最前沿的头脑和最纯粹的信念。在这里故事中,有很多冲突,抉择和权力斗争,但同时,也有真诚的理想主义。而OpenAI崛起的复杂故事,其实也就是人性的故事。拥有这样复杂人性的我们,能造出一个什么样的AGI呢?我们拭目以待。

(转载自硅谷101)

美国芯片内战

Reading Time: 3 minutes

科技公司最终都是芯片公司?

文丨邱豪 贺乾明
编辑丨黄俊杰 龚方毅

尽管人人都能用上手机,但 PC 处理器依然是现代生活的计算中心:近 20 亿人每天打开个人电脑工作、学习。这些电脑里的处理器再加上被装在数据中心和超级计算机里的数亿颗 PC 处理器在无形的数据世界里计算着一切,从推荐视频、记录股市交易,到分析战场情报,找到下一个轰炸目标。

过去 20 年里,这个重要的基础设施的竞争格局长久地维持静态。

上一场芯片大战后,几家头部公司牢牢控制着自己的位置。大多数时候,英特尔控制着超过 2/3 的市场,决定着明年 CPU 计算能力提升 8% 还是 10%;英伟达是在虚拟世界里描绘画面的首选,高通决定信号如何在空气里传播。三年前,苹果 M1 芯片推出,一度以超出想象的性能打破平静。但它的成功更多被外界归因于资本实力——果然只有钱最多的公司才可能造好芯片。

这一局面在过去一周几乎被彻底改写。并且向世界重复了一个朴素真理:纯粹的商业世界里,技术终会前进、垄断不可能永远持续,此前芯片市场的平静不过是在等待技术积累。

七天以来,一场围绕个人电脑的芯片战争在美国市场逐渐成型。至少六家市值数千亿美元的公司参与其中,向本来没有竞争关系的公司、甚至是合作伙伴发起进攻。

10 月 25 日,高通发布笔记本电脑芯片 Snapdragon X Elite,宣称其性能超过苹果的 M2 Max 和英特尔的同级别处理器,还说要为世界上其他笔记本电脑制造商提供 “与苹果竞争的领先解决方案”。

同一天,苹果预热了新的发布会,并在本周二推出新的 M3 系列处理器。以别无二家的 3 纳米技术,刷新了笔记本电脑的性能基准。

与此同时,多家美国媒体报道了英伟达和 AMD 的新计划:研发高性能、低功耗的笔记本电脑芯片方案,在两年内上市与苹果、高通竞争。

新的竞争正在向同级别市场扩散。英伟达要用最新的车用芯片 DRIVE Thor 解决从车内娱乐到自动驾驶的一切需求。特斯拉则像苹果一样,一颗一颗地将自家产品里的芯片换成自己的。

一场决定未来计算形态的芯片战争正在爆发,而战场又回到了硅谷。

共同的方向:手机芯片反攻电脑、汽车、服务器

不论苹果的 M3 系列、还是高通的 Snapdragon X Elite,它们的结构看上去都不像是传统电脑的芯片,而更像是手机芯片——虽然尺寸会大一些。

传统的电脑中,不同公司生产的 CPU、显卡、内存条等零件被送去工厂,焊接在电路板上。苹果和高通的处理器都是 SoC(System On a Chip,片上系统)——CPU、GPU、内存、控制器等处理器内核都被集成在一个芯片封装里。台积电的工厂里就可以完成大部分生产工作。

类似的,英伟达下一代汽车芯片 Thor 也转向 SoC 设计。对性能要求更高的服务器芯片则是下一个突破目标。

转折点发生在 2020 年底,苹果发布采用 SoC 设计的 M1 芯片。一开始苹果只在入门级的电脑里用了新处理器,但性能已经追上前一年的顶级配置英特尔处理器电脑,续航还多出几个小时。

此前 14 年,苹果一直在 Mac 电脑上使用英特尔的 CPU。从 2015 年起,英特尔处理器的性能提升跌入个位数的百分比。这一度被视为摩尔定律行将就木的必然结果。

“SoC 里,CPU、GPU、内存等计算单元距离最多不过 1 厘米,可以通过晶圆直接互通,相比传统通过外部的 PCB 板的电路的方式,信息传输效率会大幅提升,也能降低功耗。”《芯片简史》作者汪波博士说。

如果把电脑完成一项任务看做做菜,传统的电脑中调度芯片就像是去不同的超市、摊位买食材,再做菜。SoC 相当于从一个冰箱里拿食材做菜。而 M1 芯片的 “食材” 更丰富,苹果针对人工智能、音视频编码、加密存储等一系列特定用途订制了专用的计算单元,以更快解决常见问题。这些功能都需要和 CPU 协作,缩短信息传输距离颇为必要。

第二年,苹果陆续发布性能更好的 M1 Pro、M1 Max、M1 Ultra。《连线》杂志称这些产品 “让摩尔定律保持了活力”。

英特尔也早早意识到了行业向 SoC 转移的趋势,并在 2012 年推出了适用于智能手机和上网电脑的 SoC 平台 Atom,但它对英特尔 x86 架构、自身芯片代工厂的依赖,都让它与苹果、高通等公司支持的 Arm 架构 + 台积电竞争中捉襟见肘,最终在 2016 年放弃尝试。

“x86 属于复杂指令集,基于它的 CPU 性能强但功耗也大。GPU 同样是高功耗的处理器,把它们放一起做 SoC,散热会是一个极大麻烦。” 汪波说。

而且 Windows 笔记本电脑市场品牌众多、个人配置需求千变万化,一定程度上也限制了英特尔,它要尽可能提供同时满足多种需求、价格更低的 CPU,很难像苹果那样迅速迭代。

英特尔的 CEO 帕特·基辛格(Pat Gelsinger)同样意识到了苹果的威胁,他在 2021 年初告诉员工:“我们必须向 PC 生态系统提供比一家生活方式公司更好的产品”。

但它面临的对手不只有苹果。2020 年推出搭载 M1 芯片的 MacBook 后,苹果在笔记本电脑市场的销售份额翻了一倍到 11%。M1 的成功让高通等迫切想要进入的新公司们明确了接下来该怎么做,以及找谁做。

技术门槛降低:芯片设计民主化、台积电解决制造

回头看来,各种设备上的芯片向 SoC 进化是理所当然,但期间过程极其复杂。从组建芯片设计团队到推出 M1,苹果花了 12 年。

在此期间,苹果通过高薪和并购网罗了曾在英特尔、高通、博通、Imagination 等芯片公司工作过的人才,进而一步一步将芯片里的计算单元替换为自研产品。先是弃用 Arm 公开发售的 CPU 内核设计、再是以自己的 GPU 取代了 Imagination 的设计,并自研了处理图像、编解码音频和视频、加速人工智能算法、加密存储等各种专用计算单元,推动着 iPhone 芯片每两年实现一次性能飞跃,才有了 M1 超过英特尔芯片的可能。

一个伟大产品的诞生往往也是一场超长马拉松结束。苹果第一代 Mac 电脑和第一代 iPhone 发布后,大批工程师在短时间里离职。苹果创始人史蒂夫·乔布斯和微软创始人比尔·盖茨(微软深度参与第一代 Mac 的软件研发)都将不止一次在采访中提及这样的离职潮,来说明自己的团队付出了多么超常的努力,并最终工作到力竭。

苹果芯片工程师则发现,一场马拉松的结束是下一场的开始。

根据 The Information 报道,苹果内部的芯片项目数量在过去十年中从个位数增加到几十个,但员工人数却没有以同样的速度增长。

本周的发布会就是苹果工程师负担持续加重的例证。M1 系列芯片有四个规格,但苹果工程师只做了两个完整设计——M1 和 M1 Max,发布相隔近一年。M1 Pro 是 M1 Max 的缩水版,而 M1 Ultra 是 M1 Max 的拼接版。而本周苹果则同时发布了三个完全不同的设计——M3、M3 Pro、M3 Max。这让 M3 Pro 可以尺寸更小更便宜,M3 Max 可以追求极致性能。苹果的芯片更精确地服务了不同价位段的产品,但增加了芯片团队的工作量。

M1,M1 Pro/Max 是两个设计;M3、M3 Pro、M3 Max 用了三个设计。来源:X(@LuvLetter_moe)

一位苹果芯片工程师在接受采访时称,为了满足公司各个产品线迅速、稳定且大幅迭代芯片的需求,苹果的芯片工程师每周工作近 80 个小时——996 不过是 72 小时,通常还有午休——才能按时完成任务。

根据多家媒体统计,过去两年有数百名苹果芯片工程师离职。他们也把做高性能处理器的经验扩散开。

2019 年,苹果芯片部门平台架构高级总监杰拉德·威廉姆斯三世(Gerard Williams III)牵头创办了芯片公司 NUVIA。他于 2010 年加入苹果,此前在 Arm 工作了 12 年。在苹果的 9 年,带队开发了苹果所有 SoC 的 CPU,也是苹果 M1 Pro、M1 Max 的首席架构师。

与他一起创办 NUVIA 的另外两位芯片专家分别是:约翰·布鲁诺(John Bruno)和马努·古拉蒂(Manu Gulati),都有丰富的芯片工作履历。

根据 NUVIA 官网介绍,这批苹果芯片元老的目标是开发性能更强的 CPU,处理指数级增长的数据和不断增长的需求。他们的技术路线与苹果一致——从头设计一款兼容 Arm 生态的 CPU 内核。

M1 系列成功后,NUVIA 得到了一批大型科技公司的收购邀约。2021 年,高通从微软、英特尔、Meta 等公司竞争中胜出,花 14 亿美元收购。三位 NUVIA 创始人能从这笔交易中获得数亿美元收入——比苹果 CEO 蒂姆·库克(Tim Cook)的年收入还高。

NUVIA 团队带着上百名员工加入高通,其创始团队均担高通的高管。两年不到,高通新处理器的性能已经超过苹果 M2 系列。

曾经限制一家公司制造出高性能芯片的还有制造。在芯片 60 多年历史的大多数时间,掌控了芯片制造工厂基本上就等于掌控了芯片本身,英特尔一度靠着独占的先进晶圆厂垄断了芯片市场,竞争对手即使能设计出好的芯片,也没法用先进技术造出来。

直到 2017 年,英特尔建立的芯片垂直整合体系开始出现裂缝。靠着庞大的 iPhone 订单和苹果每两年大幅迭代芯片性能的要求,台积电的芯片制造工艺迅速超过英特尔。这一年,台积电造出 10 纳米制程芯片时,英特尔还在使用 14 纳米工艺。之后几年,台积电按照稳定节奏推动 7 纳米、5 纳米芯片变成现实,保持领先。

相同制程下英特尔的 x86 架构芯片性能好过 SoC 芯片中普遍使用的 Arm 架构,但双方制程的差距给 Arm 方案补上了性能短板。苹果在 2020 年发布的 M1 芯片使用了 5 纳米的工艺,而同年英特尔的笔记本电脑芯片还停留在 10 纳米(晶体管密度与台积电 7 纳米工艺相当)。

台积电的公开代工属性决定,任何一家希望做芯片的公司,不用大幅投入就能获得顶尖的制造工艺。高通的 X Elite 紧跟着苹果用上了 4 纳米工艺,虽然比最新的 M3 使用 3 纳米有一些差距,但已经超过了 M 系列的其他产品。

研发芯片不只得有钱,还得能靠芯片持续赚钱

芯片研发需要不间断的巨额投入,所以这也是为什么挑起竞争的总是那些巨头。巨头们不仅需要资深的芯片管理者,还需要成百上千的工程师团队。因此,研发人员和工程师的薪酬、福利是研发投入的一大部分。

2019 年开始,原本每年 “只” 愿意投 50 多亿美元做研发的高通,研发费用以大约每年 10 亿美元的规模递增。在截至今年三季度的 12 个月里,累计研发投入近 90 亿美元。

支撑这些公司如此密集投入的原因各不相同,但本质上它们都有非常稳定的 “税” 收,才有机会借着芯片技术带来的性能提升,带来更多收入,形成良性循环。

苹果每年卖出 2 亿多部 iPhone,每自研一个芯片不仅提升产品竞争力,还能拿走原本属于芯片供应商的利润。同时它的芯片又被用于电脑、手表、耳机、以及 Vision Pro。

高通依靠自己在移动通信领域拥有的大量专利和领先地位,从几乎每一部智能手机里收税 —— 也包括苹果。根据分析机构测算,苹果每卖出一部 iPhone 就要向高通支付 13 美元的无线专利授权费和 25 美元的基带芯片费用。每一年高通光是向苹果收的 “税” 差不多就撑得起全年研发费用。高通再把这些费用来研发更先进的骁龙芯片,让更多设备商离不开它。

类似的,AIGC 和大模型的需求爆发意味着,计算厂商和 AI 初创公司未来几年都需要大量采购英伟达 GPU。英伟达有了可靠的现金流,可以支持自研 CPU,在汽车和电脑市场更进一步。

一旦离开了如此高关联度的主业支撑,再有钱的大公司也要认真算账。Google 2016 年就想给自己的 Pixel 手机自研 SoC,之后从高通挖来 SoC 工程师史蒂夫·莫洛伊(Steve Molloy)担任芯片主管,在印度招聘了大量芯片工程师。

但 Pixel 系列手机发布至今 7 年,全球累计出货量为 3790 万部,还赶不上 iPhone 一个季度的销量。Google 的创始人们早已将权力分给 CFO,不会给没有回报前景无限资源。Google 自研 Pixel 芯片的量产计划已经推迟到 2025 年。

同样不顺的还有 Meta。Meta 于 2018 年组建了一个名为 Facebook Agile Silicon Team 的芯片团队,希望从易到难设计芯片,最终在 Quest 系列虚拟现实设备用上自研芯片。但 Quest 持续亏损,于是 Meta 将定制芯片的设计任务先后外包给了三星和联发科,最后放弃定制芯片,直接购买高通 XR 芯片。

Meta Quest 2 已经是迄今最畅销的 XR 设备,一年也不过卖 1000 万台左右。苹果即将发售的 Vision Pro 初期销量不会比它好,但其所需要的芯片研发成本,早已被年销 2 亿部的 iPhone 和 2600 万台的 Mac 摊薄。

AI、汽车和 XR,新的需求、新的税收机会

大约 60 年前,美国加州旧金山湾区南部的一串小城开始被称为 “硅谷”。这里一批企业推动了晶体管和集成电路的应用,催生芯片产业。他们的第一批客户是政府和军队。

1980 年代后,随着计算机普及、互联网诞生,消费者、企业取代政府机构成为硅谷的最大客户。苹果、英伟达、Google、Meta 等科技公司在此诞生。科技巨头们盘踞一方,赚走各自行业里的大多数利润,也离 “硅” 越来越远。一度,美国最重要的科技公司都专精于软件或互联网。

如果芯片需求依旧只停留在现有视频、表格、游戏,无论苹果、高通,还是英伟达、AMD,可能都不会如此全力以赴。但 AI、汽车和 XR 催生出新的计算需求,而消费电子市场的停滞则加剧了竞争的急迫性——每家公司都需要挤出更多利润。

目前 AI 已经有一些实际应用诞生。微软想把名为 “Copilot” 的 AI 助手塞进 Office 365、Bing 搜索、Outlook 邮件等几乎一切生产力工具里;苹果在用 Transformer 模型改进输入法(中文还不行);Adobe 的 AI 工具 Firefly 也将集成进 Photoshop、Illustrator、Premiere 等设计软件当中。

但是训练和推理大模型的算力资源消耗和成本非常夸张。无论是自己采购 GPU、还是向云计算商租用服务器,提供 AI 服务的公司们都面临严重的算力短缺和昂贵的运营成本。通过大模型普及的必经之路是用上每台电脑、每个手机的处理器。

这也是为什么从高通到苹果的发布会,都在强调新的芯片可以更好地支持移动设备本地跑大模型。苹果称 M3 Max 能够支持运行包含数十亿各参数规模的 Transformer 模型;高通则表示,首款搭载骁龙 X Elite 的 PC 将支持 130 亿参数模型的本地推理。

在可预见的未来,个人电脑依然是最重要的生产力工具。行业研究机构 Counterpoint 预计,AI 将为已经消沉多年的 PC 市场注入新的活力,到 2026 年,全球 AI PC 的渗透率将超过一半。在这个市场,苹果要用芯片留住最愿意花钱买电脑的顾客、高通要让 PC 厂商卖出更多电脑给自己交税、英伟达则要从 GPU 做到 CPU,拿走更多 PC 厂商的利润,三家公司在这里碰撞。

另一个潜在市场需求来自 XR。很难说这会是多大的市场,但苹果今年发布的 Vision Pro 已经为其它厂商指明了方向 —— 借助屏幕 “透视” 功能实现增强现实(AR)效果。要让它的视觉体验达到我们已经习惯的 “视网膜” 标准,需要单眼屏幕分辨率达到 6K。

Vision Pro 目前还只有 4K,已经需要把 M2 芯片戴在头上,再加一颗 R1 芯片实时处理传感器信息,内置风扇、外接电池。在 6K 精度下的实时渲染复杂画面,需要今天各家芯片所无法达到的性能和功耗。

汽车对于芯片算力的需求也在增长。随着电动化和智能化的加快,以及智能座舱和自动驾驶的普及,这些 “轮子上的数据中心” 吸引了一批芯片厂商的进入。汽车芯片也已经从原来通用、分散的单一功能芯片转向集成的多功能 SoC。

早前高通已经借骁龙 8155 将 7 纳米先进制程带入汽车芯片;而英伟达去年发布的下一代 SoC 芯片 Thor,单片算力最高可以达到 2000 TOPS,是其现款产品 Orin 的近 8 倍。高通要参与自动驾驶、英伟达则要做汽车的主芯片,特斯拉则不希望依赖其中任何一家。

新的环境驱动着这些科技公司转向芯片之争,而芯片之争很可能将决定之后谁才是科技公司。

题图:《晚点 LatePost》制图