从技术创新到场景落地,百度文心大模型开启价值阶段

撰文   | 懂懂

编辑 | 秦言

来源:懂懂笔记

从元宵节 AI 做画,到高考季度晓晓的高分作文;从百度 APP 对话式搜索,到龚俊数字虚拟人的聊天……今年以来,百度文心大模型频频创造社会热点,AI 已经离我们越来越近了。

这不是错觉,AI 正在我们每个人的工作、生活中潜移默化、润物无声地渗透。这背后,是大模型加速落地、开启价值阶段的转折点。

「 01 」

 场景"大爆炸" 度晓晓"出圈"

今年的高考季,数字人度晓晓"出圈"了。

每年的高考作文都会成为公众的一大关注点。今年语文考试结束后,百度数字人度晓晓化身为"数字人考生",挑战高考作文写作——《本手、妙手、俗手》这篇议论文,在 40 秒内就创作了 40 多篇文章,平均 1 秒生成 1 篇。

不仅速度快,文章结构还非常完整,论述逻辑清晰、文字语言流畅,文中还大量引用了名人名言,并使用了排比、比喻等修辞手法。面对高考作文写作"审题"、"逻辑"和"创意"等挑战,度晓晓在文心大模型的帮助指导下,又快又好地完成了写作。

曾担任北京高考语文阅卷组组长的申怡,为度晓晓的作文打出了 48 分的成绩(满分 60 分),这一分数已经超过 75% 的高考考生。

作为一个数字人,度晓晓不仅能答题,还能变身学习助理,为考生提供虚拟服务,包括整合多模态交互技术、3D 数字人建模、机器翻译、语音识别、自然语言理解等多项技术能力,可以在查分、报志愿、查录取等重要高考节点推送提醒,确保考生和家长不会错过任何重要信息,还能根据考生的不同特点,智能推送个性化的报考推荐和优质内容。

另外,"度晓晓"还能与考生进行智能聊天对话,通过情感陪伴的方式帮助用户缓解压力与情绪波动,全程陪伴考生及家长。

在百度文心大模型的加持下,度晓晓的角色还可以从高三考生秒变 AI 艺术生,带着她的画作"现身"西安美术学院的 2022 年"时空留痕 · 无界西美"本科毕业展。在其展出的用 AI 创作的六幅绘画作品中,除了四幅与"无界"主题强相关的作品(《自然与虚拟》、《火星上的月亮》、《沙漠中的孤岛》、《颜色与星空》)外,还有两幅有关西安大雁塔的特别作品。度晓晓仅用数十秒就完成了作品,而且"已经达到了本科美术毕业生的基本要求"。

拥有一个智慧的灵魂——文心大模型,度晓晓可以分饰多个角色,可以跟据场景换不同的造型,也可以换个合适的名字。

在百度自己的智能化产品中,语音搜索、信息推荐、对话系统、智能音箱、自动驾驶等方面都得到了实践。比如在百度 App 端内的 AI 数字人,目前主要可以实现四大功能:即个性化聊天陪伴、辅助搜索、服务分发和互动玩法。

在外部,文心大模型已落地工业、能源、金融、通信、媒体等领域,通过飞桨开源开放平台、百度智能云等赋能到各行各业,个人、企业开发者数量超 6 万。

随着"度晓晓"一次次出圈,你才突然发现 AI 已经遍地开花。

在 AI 遍地开花的同时,其价值也在不断被验证:在媒体行业,可以激发创新,提升内容多样性,降低制作成本;在保险领域,能够让文本处理效率提升 30 倍;在人力资源应用中,候选人信息智能分类识别准确率可高达 99%;在医疗领域应用中,病历检查时间从 30 分钟缩短到了秒级……

一项技术的快速普及,其要素之一就是广泛的应用场景,并且能在场景中产生价值。从过去这两年文心大模型落地的应用来看,场景正在不断丰富,尤其是今年呈现出"大爆炸"之势,与此同时应用价值也逐渐被用户认可。此次度晓晓出圈,也让更多人看到了 AI 的价值,无疑将对 AI 的普及起到进一步催化作用。

「 02 」

技术成熟,文心大模型已是"优秀生"

预训练大模型在 AI 进程中为什么重要?它如同 AI "轮子",解决场景碎片化的难题,是 AI 从作坊式变成工厂式生产的通用工具。所以,大模型在一定程度上也决定着 AI 落地的速度。

所谓预训练大模型,是通过自监督学习的方法,让模型对海量无标注数据中的规律和知识进行提炼、学习,当面向实际任务和场景应用时,只需要少量的任务标注数据,就能通过持续微调得到在应用场景中非常好用的模型。从这一点可以看到,其特点就是通用性强、泛化性强,易用且好用。也正是因此,全球科技巨头都在预训练大模型领域投入研发力量,展开"军备竞赛"。

百度是中国企业中走得早、走得快的科技企业之一。2019 年 3 月,百度率先发布国内首个正式开放的预训练模型 ERNIE 1.0,那个时候这项技术还相对稚嫩。此后两年两次升级,到 2021 年 7 月,百度百亿参数规模的知识增强型预训练模型 ERNIE 3.0   问世,这是当时业界首次在百亿级预训练模型中引入大规模知识图谱。

ERNIE 3.0   一举刷新了 54 个中文 NLP 任务基准,其英文模型在国际权威的复杂语言理解任务评测 SuperGLUE 上,以超越人类水平 0.8 个百分点的成绩登顶全球榜首,处于全球领先地位。当年 12 月,百度联合鹏城实验室打造了"鹏城 - 百度 · 文心"(代号 ERNIE 3.0 Titan),这是全球首个知识增强千亿大模型,参数规模达到了 2600 亿,是当时全球最大中文的单体模型。就在刚刚结束的 WAVE SUMMIT 2022 深度学习开发者峰会上,文心大模型又迎来一系列重大升级—— ERNIE 3.0 Zeus 成为融合了任务相关知识的千亿大模型,也是国内首个开放 API 调用的千亿大模型。

文心大模型的一大特色是"知识增强",即引入知识图谱,将数据与知识融合,使得学习效率更高、可解释性更好。今天,用 AI 进行创作已经很成熟,从财经、体育类新闻快讯,再到诗歌、小说等文学创作,AI 写作覆盖的领域越来越广,创作形式和内容也变得更加丰富多彩。

这次支持度晓晓完成高考作文的,就是文心大模型最新发布的融合任务相关知识的千亿大模型 ERNIE 3.0 Zeus。这一模型在学习海量数据和知识的基础上,进一步学习了百余种不同形式的任务知识,增强了模型的效果,在各类 NLP 任务上都表现出更强大的零样本和小样本学习能力。

技术的成熟度,是市场普及的另一个关键因素。短短几年时间,百度文心大模型已经成为业界的优秀生。随着技术的成熟,只需要少量的任务标注数据,就能通过持续微调得到在应用场景中非常好用的模型,进一步加速在各类场景中的应用落地。

以 AI 创作的一些例子来分析,在文心大模型的支持下,利用 AI 自动生成内容的新型生产方式—— AIGC 已经渗透到诸多场景中,并且愈发成熟:AI 作画、AI 写歌、AI 剪辑、虚拟主持、智能客服……根据百度研究院预测,2022 年 AIGC 技术将借助大模型的跨模态综合技术能力,实现更为规模化的应用。

对此《经济学人》最近发表的一篇关于大模型的文章也指出,文心 ERNIE 大模型是中国最好的预训练大模型," AIGC 的普及,能够给人类的创作带来更多灵感。"

「 03 」

搭桥铺路,由点到面加速普及

基于技术成熟、场景价值的基础,AI 普及的第三个要素就是实现路径。

在今年 WAVE SUMMIT 2022 深度学习开发者峰会上,百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜认为,今年是大模型的落地关键年,她对此强调:"要做好落地,需要解决的关键问题,是前沿的大模型技术如何与真实场景的方方面面要求相匹配。"实际上,就是要在技术与场景之间搭桥铺路,让技术快速在场景中落地。

首先是模型体系。不同场景对模型的需求会有一定的差异化,所以在通用模型的基础上要增加不同特质,对此百度增加了两类模型:一是任务大模型,主要面向特定任务,比如语音搜索、图文搜索、图象理解等等;二是行业大模型,针对特定行业进行知识增强后的大模型,百度当前的模型体系中已经发布能源和金融两个行业大模型,未来还将不断更新更多行业。

将大模型体系化,按技能、行业细化,拓宽了人工智能技术落地场景的覆盖广度。如果用盖房子来比喻,大模型就是基础设施,有人建公寓,有人建别墅,有人建写字楼,有人建厂房,有人建商场。不同的建筑,选择不同的基础设施。

其次是全流程支持。百度今年 WAVE SUMMIT 2022 发布了大模型开发套件、API 和内置了文心大模型能力的 EasyDL 及 BML 开发平台。

所谓全流程支持,本质上是降低了技术渗透到产业应用的难度,提升了落地速度。如果用盖房子来比喻,这就相当于提供各种工具、图纸以及施工指导,帮助你快速完成工程。

比如,高性能部署方案涵盖了通用蒸馏、任务蒸馏、模型裁剪等大规模轻量化落地方案,以及飞桨算子融合、模型量化等加速方案。再比如,预设多领域的丰富任务,包括 40 多种 NLP 任务,涵盖了分类、抽取、检索、生成等;20 多种计算机视觉任务,涵盖了人脸、人体、车辆、商品、食物等细粒度分类识别。在这些预制任务下,方案提供配置文件、命令行等多种启动方式、实现一键组网训练。

最后是生态、社区。任何一项技术的普及,都与生态的繁荣度密切相关。大模型的技术成熟了,未来如何创新地应用于场景中,需要更多的开发者共同探索与创造。百度开放的大模型创意和探索社区——旸谷,是文心大模型支持下的一个创意应用空间,也是开发者尽情展现自己"脑洞"的地方。百花齐放、百家争鸣,将会加速世界向 AI 迁移的进程。

我们都知道,生态能促进场景应用的丰富度。如果类比于盖房子,生态就是各种设计师、建筑师在这里发挥创意,出设计图、建样板间,他们在实现自我价值的同时也可以供别人参考、复制。

可以说,今年度晓晓的"出圈",让更多人深刻感受到了 AI 的发展已经到达一个临界点:这将是由点到面快速普及的一年。广度、速度、丰富度,百度有意识地在多个维度加速 AI 的落地,今年我们将在更多的场景中看到 AI 带来的创新价值。

【结束语】

正是因为大模型的重要性,过去几年间,业界展开了大模型的技术军备竞赛,大家不停刷榜。事实上,无论大模型的性能有多强、参数量有多么庞大,最终的价值体现是要落地,好用、易用的同时,还要在应用场景中产生价值,带动产业发展和升级。文心大模型完成了初期的技术积累,率先开启了大模型的价值阶段。

冷眼旁观 麻辣点评 深入分析

� � � �   真诚推荐你关注� � � �

END

来个"分享、点赞、在看"吧� �

posted on 2022-06-23  作者:admin  阅读量:

栏目导航

九洲彩票平台,九洲彩票官网,九洲彩票网址,九洲彩票下载,九洲彩票app,九洲彩票开户,九洲彩票投注,九洲彩票购彩,九洲彩票注册,九洲彩票登录,九洲彩票邀请码,九洲彩票技巧,九洲彩票手机版,九洲彩票靠谱吗,九洲彩票走势图,九洲彩票开奖结果

Powered by 九洲彩票 @2018 RSS地图 HTML地图