GPT-4/文心一言齐发布，谁更强？李开复:AI 2.0 最先应用在能容错领域；颜水成加入智源，任访问首席科学家

AI科技大本营 | 2023-03-19 10:25:53 阅读：539

本周AI界又有哪些新鲜事？

大模型

史上最强模型 GPT-4 上线，赋能 Office 全家桶
本周，OpenAI以迅雷不及掩耳之势推出了GPT-4。相较于ChatGPT，GPT-4的更强性能表现在多模态，可以接受图像和文本输入，同时返回文本输出。具体强大到什么程度，一个示例足以证明：

用户：这幅画有什么好笑的地方？逐一描述它的板块。图片来源：https://www.reddit.com/r/hmmm/comments/ubab5v/hmmm/GPT-4：图片显示的是一个 "Lightning Cable "适配器的包装，有三个板块：板块1：一部智能手机，VGA 连接器（通常用于电脑显示器的大型蓝色 15 针连接器）插在其充电端口。
板块2："Lightning Cable "适配器的包装上有一张 VGA 接口的图片。板块3：VGA 连接器的特写，末端是一个小的 Lightning 连接器（用于为 iPhone 和其他苹果设备充电）。这张图片的幽默感来自于将一个大的、过时的 VGA 连接器插入一个小的、现代的智能手机充电端口的荒谬性。除了具备超强的判断和输出能力外，GPT-4的理解能力也相当惊人，据OpenAI的官网透露，在模拟律师的考试中，GPT-4的分数达到应试者前10%，较上一个版本GPT-3.5倒数10%的得分有了跨越式提升。而据最新消息，继将 GPT-4 引入搜索引擎之后，微软再出“杀手锏”，重磅宣布由 AI 驱动的 Microsoft 365 Copilot ，它将大模型（LLM）与 Microsoft Graph 和 Microsoft 365 应用中的数据相结合，打破了传统办公软件的方式，能自动生成文档、电子邮件、PPT，让Word、Excel、PowerPoint、Outlook、Teams 等办公软件的效率提升多倍。顶住压力，百度文心一言正式亮相蓄势了一个多月，承载着无数人或期盼或好奇的目光，“国产版 ChatGPT” 文心一言本周终于正式亮相！在发布会伊始，对于外界频频问及的“为什么现在发布，百度是否真做好了准备”等疑问，百度 CEO 李彦宏在开场进行了回应：
“过去多年，百度一直在进行 AI 技术的研究与研发。文心大模型首个版本在 2019 年便已发布，文心一言只是过去多年研发成果的延续。之所以现在发布，是因为现在市场有强烈的需求，包括百度从搜索、智能云到自动驾驶，再到客户、用户，都需要这样的技术。同时，大模型只有发布了，才会有用户反馈，只有通过不断地反馈，才能加速模型自身的迭代。”在文心一言的产品性能上，据李彦宏介绍，包括多模态生成、数理推算、文学创作、中文理解，以及商业文案创作等。另据百度 CTO 王海峰表示，“文心一言是新一代知识增强大语言模型，是在 ERNIE 及 PLATO 系列模型的基础上研发的。”在未来产业落地上，主要有三大机会预测：新型云计算公司、行业模型精调公司，以及基于大模型底座进行应用开发的公司。GPT-4 VS 文心一言对比测试：文心一言 vs ChatGPT！相同 10 问，结果出乎意料

谷歌反击战！开放大语言模型 PaLM API

当整个科技圈都在为 GPT-4 的强悍而震惊时，无人在意的角落，谷歌正在努力追赶 OpenAI ：日前，谷歌官方宣布，正式开放其 PaLM 大型语言模型 API，并将在 Gmail、Docs 等中陆续提供 AI 功能，帮助企业“从简单的自然语言提示中生成文本、图像、代码、视频、音频等”。好在，尽管大多人的目光都聚焦在 GPT-4 上，但仍有不少网友发现了谷歌的动作：据官方介绍，本次谷歌开放的 PaLM API，是其大型语言模型的入口，可用于各种应用程序。不仅可为开发者提供针对内容生成和聊天功能优化的模型，擅长汇总、分类等任务的通用模型也不在话下。在博文中，谷歌表示：“PaLM API 是一个面向开发者的新产品，可轻松安全地试验谷歌大型语言模型。”值得一提的是，为了方便开发者使用 PaLM API，谷歌还发布了一个名为 MakerSuite 的工具。事实上，近年来谷歌一直在构建和部署大型语言模型时发现，生成式 AI 开发的过程太“碎片化”：不论是制作或迭代提示、生成合成数据还是调整自定义模型，开发者都必须要用不同的工具来完成。李开复：AI 2.0会最先应用在能容错的领域在3月14日创新工场举办的现场讨论会上，董事长兼CEO李开复对AI的2.0时代提出了自己的见解。在看他看来：“AI 2.0 是绝对不能错过的一次革命，它会是一个平台级别的趋势，超过移动互联网十倍。”早在去年末ChatGPT横空出世之前，李开复便用一个比喻来形容现今人工智能的发展潜力：“全球人工智能商业化还在篮球比赛第一节，我们用深度学习投中了一个三分球，用卷积神经网络和自监督学习投中了两个二分球，而整个比赛可能刚打了两分钟。”
而对于以ChatGPT掀起的AI 2.0时代首当其冲的领域，李开复表示：“虽然我们看到微软和谷歌在打搜索仗，但如果是我，一定先把Office改造一次。”在他看来，AI 2.0会最先应用在能容错的领域，而毫无疑问是内容创造。事实上，他的这一预言隔天即得到验证。此外，他认为：“AI 2.0也是中国面临的一个巨大的平台式机会，而且是中国在AI领域的第一次平台角逐机会。”

AI人物

颜水成加入智源，任访问首席科学家

据北京智源人工智能研究院官网发布，计算机视觉和机器学习领域专家颜水成加入智源研究院，任访问首席科学家。颜水成教授是新加坡工程院院士、AAAI、ACM、IEEE 和 IAPR 会士。此前曾任智源学者-机器学习方向首席科学家，Sea集团首席科学家。他的研究领域包括计算机视觉、机器学习和多模态分析等。迄今为止，颜水成的 H-index 高达 130+，八次被评为年度全球“高被引科学家”。此外，颜水成的团队曾在两项核心竞赛 Pascal VOC 和 ImageNet (ILSVRC) 中获得十次冠军和荣誉奖，在多模态顶级会议 ACM 上拿下3次最佳论文奖，2次最佳学生论文奖和1次最佳演示奖。何恺明MIT求职演讲成追星现场百度百科关于何恺明的评价是这样的：“提到何恺明，很多学术界的人都将其视为天才型人物。从高考满分状元，到CVPR最佳论文奖首位华人得主，再到震惊学界的深度残差网络，这位80后青年才俊有着诸多传奇故事。”近日，这位天才人物去到MIT进行求职演讲，虽然不知道能否在学术圣地继续续写传奇，但天才的光环效应着实拉满。据现场参会者传出消息，有人为了听他的演讲，提前3小时在教室门口排队，而到演讲前半个小时，门口的队伍都拐了几个弯。据了解，何恺明为此次演讲准备了129页PPT，回顾了他在计算机视觉领域所做的研究工作，涵盖ResNet、Faster RCNN、Mask RCNN、MoCO和MAE。对于未来的工作规划，他定位为“AI for Science”。如果何恺明成功加入MIT，他将成为该校论文被引数量最高的人，其目前被引次数高达40万+。

AI工具

PyTorch官网正式发布PyTorch 2.03月15日，PyTorch官网正式发布PyTorch 2.0。相较1.0版本，2.0版本有了较大改进，包括：图片来源：PyTorch官网PyTorch 2.0的主要API torch.compile，具备100%向后兼容性；配置Nvidia和AMD GPU，以及依靠OpenAI Triton深度学习编译器的TorchInductor，可生成高性能代码，同时隐藏低级别的硬件细节；

加速变形器引入了对训练和推理的高性能支持，可以使用一个定制的内核架构来实现缩放点积关注（SPDA）；

金属性能着色器（MPS）后端在Mac平台上提供GPU加速的PyTorch训练，增加了对最常用的60个操作的支持，覆盖范围可达到300多个操作；

与之前版本相比，PyTorch 2.0提高了Graviton上的推理性能，包括对Resnet50和Bert的改进；

跨越TensorParallel、DTensor、2D parallel、TorchDynamo、AOTAutograd、PrimTorch和TorchInductor的新原型功能和技术。

*博客内容为网友个人发布，仅代表博主个人观点，如有侵权请联系工作人员删除。