新闻  |   论坛  |   博客  |   在线研讨会
OpenAI到底做对了什么?(2)
AI科技大本营 | 2023-07-05 21:13:29    阅读:181   发布文章

图片

技术路线四:****


在Transformer打开了大语言模型的理论窗口之后,大语言模型发展出了三种路线。第一种,以Google BERT、ELECTRA为代表的Encoder-Only(编码器)路线;第二种,以Google T5、BART为代表的Encoder- Decoder(编****)路线;第三种,以OpenAI GPT为代表的Decoder-Only(****)路线。

这三种路线,Encoder-Only路线适合理解类任务,很难应对生成式任务,也不具有好的扩展性和适应性,虽然被Google BERT在个别子领域一度带火,但现在几乎处于被主流抛弃的地步。Encoder- Decoder路线适合特定场景任务,但通用性和扩展性也比较差。Decoder-Only路线首先非常适合生成类任务,同时对各类任务都具有很好的通用性,在工程上也具有很高的可扩展性(scale),非常适合将模型规模做大。

图片

基于这些特点来看,要以AGI通用人工智能为目的地的话,那么Decoder-Only路线显然是不二选择。从上面的大语言模型进化树来看,可以看出GPT选择的Decoder-Only路线显然引领了大语言模型的发展和繁荣。


图片

技术路线五:从强化学习到对齐


通过以上的无监督学习、生成式模型、自然语言、****这几个关键的技术岔路口选择之后,GPT模型显然已经奔赴在通往AGI的康庄大道上了。但是GPT的强大也引入一些新的隐忧,它的强大会不会为人类带来危险、破坏人类价值观、帮助作恶、扰乱社会秩序、甚至威胁人类的生存?

这是严重违背OpenAI的愿景和使命的。如何将强大的GPT模型与人类价值观和社会规范对齐?强大之后如何变得“对人类有用”?技术的问题要靠技术来解决。这时候OpenAI在早期训练Dota游戏智能代理时积累已久的强化学习功底就派上用场了。通过在预训练之后加入基于人类反馈的强化学习(RLHF,Reinforcement Learning from Human Feedback)来教导AI做一个对人类有益的“好的AI”,设立护栏,防止被用来做恶。这方面,OpenAI想得很远,投入的也很大,配得上它的“愿景和使命”。


图片

工程智慧:Scale Law


如果回顾OpenAI在历史上做的一系列技术选择,我们会发现几乎所有的选择都是围绕“是否有利于通用人工智能Scale”的原则进行的,而与该技术在当时“是否能快速变现”、“是否主流”、“是否容易上手”、“是否效果立竿见影”完全无关。

做过技术架构,或者商业战略的人也都知道,“快速易扩展”是好的技术架构或者商业模式的“铁律”。这一铁律同样适用于通用人工智能的发展。OpenAI的团队显然是洞悉这一点的。他们甚至在2020年发表了一篇著名的论文《Scaling Laws for Neural Language Models》来总结模型参数、训练数据集大小、算力投入(FLOPs 每秒浮点操作)、网络架构之间的扩展法则。

其实除了模型的Scale Law,OpenAI对于迈向AGI道路上的各种Scale力量都有非常深刻的洞见和睿智的选择。


图片

产品智慧:从超级应用到生态平台


从2018年OpenAI推出GPT 1.0到2020年GPT发展到3.0,OpenAI这时已经拿到大语言模型这样一张王牌,但怎么出牌也很重要。历史上握着一手技术好牌,但是打得稀烂的也比比皆是。以OpenAI强大的“通用人工智能”愿景来说,不做平台型公司是很难的。但是科技史上一上来就做平台的公司,大部分都折戟沙场。反观那些成功的平台型技术公司,绝大多数都是先从建立“超级应用”开始的。

历经硅谷顶级孵化器YC总裁的锻炼,OpenAI的另一位灵魂人物CEO Sam Altman,当然是产品战略高手中的高手。OpenAI选择先从ChatGPT这一“超级应用”入手,通过短短几个月的时间,积累了上亿的用户、海量的交互数据、和极强的品牌号召力,才有后面的ChatGPT API, Plugins等一系列大手笔的平台布局。以目前各种渠道的消息来看,OpenAI在产品上还有很多大招,让我们拭目以待。

顺便提一下,我在前面《AGI时代的产品版图和范式》文章中,也更深入地谈了很多我对AGI时代产品创新的思考。


图片

股权设计:限制盈利公司


OpenAI最早是以非盈利组织的方式成立,初期资金以捐赠的方式募集。但显然创始团队低估了发展AGI需要的硬件和人才投入,也高估了捐赠的兑现(早期承诺的捐赠后来其实很多没到位)。因此到2019年3月,OpenAI重新设计公司治理架构,改为“限制盈利”的公司,接受微软10亿美金投资。

“限制盈利”规定向OpenAI投资的股东,未来从OpenAI能够获取的利润分配最多到投资额X100倍的上限。超出部分将由非盈利组织OpenAI Nonprofit控制。

这一精妙的股权设计既能吸引OpenAI所需要的投资,又防止了AGI过于强大而攫取巨额利润。平衡了发展AGI需要的商业支持和AGI造福全人类这一宏大愿景之间的矛盾。我觉得若干年后回看历史,这一股权设计也是商业史上一个伟大的发明。创始人兼CEO Sam Altman不拿股权,不求商业回报,一心追求AGI改变世界的胸怀也让人心生敬意。


图片

战略设计:合纵连横


如果将OpenAI比作AI时代的一只小恐龙,那么在AI领域长期重兵投入、市值万亿的Google和微软显然是AI时代的两只大恐龙。OpenAI这样的“搅局者”如果被两只大恐龙中的任何一只盯上,都会惹火烧身。而OpenAI对于ChatGPT这样的“爆款应用”推出所引起的AI战国纷争显然有充分的预判和精妙的战略设计。

OpenAI首先通过和微软这只大恐龙的战略合作,既拿到百亿美金量级的宝贵发展资金,同时又通过GPT赋能微软Bing搜索、半路****Google这只大恐龙,还顺带将GPT赋能到自己一时半会照顾不到的B端市场(Azure云服务、Office 365等)以获取适当利润,而自己却可以集中精力、以C端市场为切入点、在构建AGI时代的生态平台上蒙眼狂奔。

这一巧妙利用巨头“创新者窘境”的合纵连横,让一家人数仅有300多估值不过300亿美金的创业公司,同时撬动两家市值万亿美金、员工近二十万的科技巨鳄的战略布局,放眼整个商业史,空前绝后,蔚为大观。


图片

团队架构:学术+工程+产品+商业


读到这里很多朋友可能会问,OpenAI到底什么来头、何德何能如此彪悍?秘密无他,科技公司最贵的就是人才。OpenAI有着足以笑傲AI江湖的联合创始团队组合。

一号位CEO Sam Altman 20岁从斯坦福辍学创办Loopt,于2012年将公司以4300万美金出售。于2014被大自己二十岁的YC创始人、硅谷创业教父格雷厄姆说服接替他担任YC总裁。格雷厄姆很早就看到Sam Altman的卓越才华,在他眼里,Sam Altman就是硅谷未来的乔布斯。Sam Altman在硅谷的创业和YC的经历锻造了他在产品模式、商业战略、投融资方面的顶级才能。

二号位首席科学家Ilya Sutskever是深度学习之父Geoffrey Hinton的关门弟子,从ImageNet大赛一战成名,后来加入Google大脑,发明Seq2Seq大幅改善机器翻译,参与TensorFlow和AlphaGo的研发。是深度学习学术领域当仁不让的“开山功臣”。

总裁Greg Brockman之前创立著名支付公司Stripe并担任CTO,具有极强的工程技术能力和从零到一搭建技术团队的经验。是OpenAI长期的工程技术支柱。除此之外,像Andrej Karpathy 、John Schulman、Lukasz Kaiser等灿若群星的汇聚,使得OpenAI在AI人才密度上放眼全球,都属顶流之列。OpenAI的团队结构也反应OpenAI的AGI创业观:学术、工程、产品、商业,四大支柱缺一不可,而且各个都很强。

除了自己聚焦AGI还不够,OpenAI和Sam Altman还投资了众多核聚变、量子计算、加密货币等公司,围绕能源、算力、财富分配等未来变革进行大手笔布局。这些每一个都剑指AGI的未来。

综上所述,OpenAI无论是在技术的多个岔路口上的关键选择,还是在产品、工程、股权、战略、团队上,都打得一手好牌,是一家非常值得研究和重视的公司,也是我们窥视AGI时代的一扇窗户。



*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客