新闻  |   论坛  |   博客  |   在线研讨会
GPT-4/文心一言齐发布,谁更强?李开复:AI 2.0 最先应用在能容错领域;颜水成加入智源,任访问首席科学家
AI科技大本营 | 2023-03-19 10:25:53    阅读:476   发布文章

本周AI界又有哪些新鲜事?

图片

大模型

史上最强模型 GPT-4 上线,赋能 Office 全家桶
本周,OpenAI以迅雷不及掩耳之势推出了GPT-4。相较于ChatGPT,GPT-4的更强性能表现在多模态,可以接受图像和文本输入,同时返回文本输出。具体强大到什么程度,一个示例足以证明:

用户:这幅画有什么好笑的地方?逐一描述它的板块。图片图片来源:https://www.reddit.com/r/hmmm/comments/ubab5v/hmmm/GPT-4:图片显示的是一个 "Lightning Cable "适配器的包装,有三个板块:板块1:一部智能手机,VGA 连接器(通常用于电脑显示器的大型蓝色 15 针连接器)插在其充电端口。
板块2:"Lightning Cable "适配器的包装上有一张 VGA 接口的图片。板块3:VGA 连接器的特写,末端是一个小的 Lightning 连接器(用于为 iPhone 和其他苹果设备充电)。这张图片的幽默感来自于将一个大的、过时的 VGA 连接器插入一个小的、现代的智能手机充电端口的荒谬性。除了具备超强的判断和输出能力外,GPT-4的理解能力也相当惊人,据OpenAI的官网透露,模拟律师的考试中,GPT-4的分数达到应试者前10%,较上一个版本GPT-3.5倒数10%的得分有了跨越式提升。而据最新消息,继将 GPT-4 引入搜索引擎之后,微软再出“杀手锏”,重磅宣布由 AI 驱动的 Microsoft 365 Copilot ,它将大模型(LLM)与 Microsoft Graph 和 Microsoft 365 应用中的数据相结合,打破了传统办公软件的方式,能自动生成文档、电子邮件、PPT,让Word、Excel、PowerPoint、Outlook、Teams 等办公软件的效率提升多倍。顶住压力,百度文心一言正式亮相蓄势了一个多月,承载着无数人或期盼或好奇的目光,“国产版 ChatGPT” 文心一言本周终于正式亮相!在发布会伊始,对于外界频频问及的“为什么现在发布,百度是否真做好了准备”等疑问,百度 CEO 李彦宏在开场进行了回应:
图片“过去多年,百度一直在进行 AI 技术的研究与研发。文心大模型首个版本在 2019 年便已发布,文心一言只是过去多年研发成果的延续。之所以现在发布,是因为现在市场有强烈的需求,包括百度从搜索、智能云到自动驾驶,再到客户、用户,都需要这样的技术。同时,大模型只有发布了,才会有用户反馈,只有通过不断地反馈,才能加速模型自身的迭代。”在文心一言的产品性能上,据李彦宏介绍,包括多模态生成、数理推算、文学创作、中文理解,以及商业文案创作等。另据百度 CTO 王海峰表示,“文心一言是新一代知识增强大语言模型,是在 ERNIE 及 PLATO 系列模型的基础上研发的。”在未来产业落地上,主要有三大机会预测:新型云计算公司、行业模型精调公司,以及基于大模型底座进行应用开发的公司。GPT-4 VS 心一言对比测试:文心一言 vs ChatGPT!相同 10 问,结果出乎意料

谷歌反击战!开放大语言模型 PaLM API

当整个科技圈都在为 GPT-4 的强悍而震惊时,无人在意的角落,谷歌正在努力追赶 OpenAI :日前,谷歌官方宣布,正式开放其 PaLM 大型语言模型 API,并将在 Gmail、Docs 等中陆续提供 AI 功能,帮助企业“从简单的自然语言提示中生成文本、图像、代码、视频、音频等”。好在,尽管大多人的目光都聚焦在 GPT-4 上,但仍有不少网友发现了谷歌的动作:图片据官方介绍,本次谷歌开放的 PaLM API,是其大型语言模型的入口,可用于各种应用程序。不仅可为开发者提供针对内容生成和聊天功能优化的模型,擅长汇总、分类等任务的通用模型也不在话下。在博文中,谷歌表示:“PaLM API 是一个面向开发者的新产品,可轻松安全地试验谷歌大型语言模型。”值得一提的是,为了方便开发者使用 PaLM API,谷歌还发布了一个名为 MakerSuite 的工具。事实上,近年来谷歌一直在构建和部署大型语言模型时发现,生成式 AI 开发的过程太“碎片化”:不论是制作或迭代提示、生成合成数据还是调整自定义模型,开发者都必须要用不同的工具来完成。李开复:AI 2.0会最先应用在能容错的领域在3月14日创新工场举办的现场讨论会上,董事长兼CEO李开复对AI的2.0时代提出了自己的见解。在看他看来:“AI 2.0 是绝对不能错过的一次革命,它会是一个平台级别的趋势,超过移动互联网十倍。早在去年末ChatGPT横空出世之前,李开复便用一个比喻来形容现今人工智能的发展潜力:“全球人工智能商业化还在篮球比赛第一节,我们用深度学习投中了一个三分球,用卷积神经网络和自监督学习投中了两个二分球,而整个比赛可能刚打了两分钟。
而对于以ChatGPT掀起的AI 2.0时代首当其冲的领域,李开复表示:“虽然我们看到微软和谷歌在打搜索仗,但如果是我,一定先把Office改造一次。”在他看来,AI 2.0会最先应用在能容错的领域,而毫无疑问是内容创造。事实上,他的这一预言隔天即得到验证。此外,他认为:“AI 2.0也是中国面临的一个巨大的平台式机会,而且是中国在AI领域的第一次平台角逐机会

图片

AI人物

颜水成加入智源,任访问首席科学家

北京智源人工智能研究院官网发布,计算机视觉和机器学习领域专家颜水成加入智源研究院,任访问首席科学家。图片颜水成教授是新加坡工程院院士、AAAI、ACM、IEEE 和 IAPR 会士。此前曾任智源学者-机器学习方向首席科学家,Sea集团首席科学家。他的研究领域包括计算机视觉、机器学习和多模态分析等。迄今为止,颜水成的 H-index 高达 130+,八次被评为年度全球“高被引科学家”。此外,颜水成的团队曾在两项核心竞赛 Pascal VOC 和 ImageNet (ILSVRC) 中获得十次冠军和荣誉奖,在多模态顶级会议 ACM 上拿下3次最佳论文奖,2次最佳学生论文奖和1次最佳演示奖。何恺明MIT求职演讲成追星现场百度百科关于何恺明的评价是这样的:“提到何恺明,很多学术界的人都将其视为天才型人物。从高考满分状元,到CVPR最佳论文奖首位华人得主,再到震惊学界的深度残差网络,这位80后青年才俊有着诸多传奇故事。”近日,这位天才人物去到MIT进行求职演讲,虽然不知道能否在学术圣地继续续写传奇,但天才的光环效应着实拉满。据现场参会者传出消息,有人为了听他的演讲,提前3小时在教室门口排队,而到演讲前半个小时,门口的队伍都拐了几个弯。图片据了解,何恺明为此次演讲准备了129页PPT,回顾了他在计算机视觉领域所做的研究工作,涵盖ResNet、Faster RCNN、Mask RCNN、MoCO和MAE。对于未来的工作规划,他定位为“AI for Science”。如果何恺明成功加入MIT,他将成为该校论文被引数量最高的人,其目前被引次数高达40万+

图片

AI工具

PyTorch官网正式发布PyTorch 2.03月15日,PyTorch官网正式发布PyTorch 2.0。相较1.0版本,2.0版本有了较大改进,包括:图片图片来源:PyTorch官网PyTorch 2.0的主要API torch.compile,具备100%向后兼容性;配置Nvidia和AMD GPU,以及依靠OpenAI Triton深度学习编译器的TorchInductor,可生成高性能代码,同时隐藏低级别的硬件细节;

加速变形器引入了对训练和推理的高性能支持,可以使用一个定制的内核架构来实现缩放点积关注(SPDA);

金属性能着色器(MPS)后端在Mac平台上提供GPU加速的PyTorch训练,增加了对最常用的60个操作的支持,覆盖范围可达到300多个操作;

与之前版本相比,PyTorch 2.0提高了Graviton上的推理性能,包括对Resnet50和Bert的改进;

跨越TensorParallel、DTensor、2D parallel、TorchDynamo、AOTAutograd、PrimTorch和TorchInductor的新原型功能和技术。


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客