华为小艺做起“贾维斯”梦
2023-08-19 14:40:27 | 来源:钛媒体APP | 编辑: |
2023-08-19 14:40:27 | 来源:钛媒体APP | 编辑: |
图片来源@视觉中国
ChatGPT带火的大模型,在软件应用领域一路高歌,与硬件设备的结合却不疾不徐。
(相关资料图)
最先有动作的是微软的老对头谷歌。今年5月,后者公布新一代大语言模型PaLM 2,其代号为“壁虎”的版本,每秒可处理约20个Tokens(大约为16个单词),适用于手机等移动设备,可以离线使用。并且,联动谷歌旗下搜索、地图、邮件、视频等各类产品后,相应的功能可进行重构。
大模型向手机端蔓延的战火突然加速。6月29日,荣耀在上海世界移动通信大会上表示,未来将把AI大模型引入端侧。7月初,搭载高通第二代骁龙8芯片的安卓手机,直接运行了参数规模超过10亿的Stable Diffusion,只需要15秒左右就可以出图。更重要的是,这是完全本地化,只依赖手机本身的算力。
8月初的华为开发者大会上,随着HarmonyOS 4的发布,基于AI大模型的全新技术,华为的智能语音助手小艺也公布了三大方向的优化升级。
在华为的构想中,旗下盘古大模型给小艺赋予的能力一改往日的呆板,看起来更加吸引人。但冷静下来看,由ChatGPT引发的故事已经老套,这时各大厂商们爆出将大模型接入智能手机,究竟是噱头还是创新?
移动端的智能语音助手,在过去的很长一段时间内,被人戏称为“人工智障”。
这种巨大的落差在于,艺术作品中的AI助手如《钢铁侠》中的贾维斯,拉高了人们的期待,而现实中无论是苹果的Siri还是国产阵营的小爱、小度、小艺等,实际体验都与智慧二字沾不上边。大部分人或许有这样的经历,对语音助手下达指令时,得到最多的回复是“我不太明白你在说什么?”,甚至没有反应,不得不尴尬地喊话多次。
而在大模型的赋能下,用华为的话来说,小艺会变得“更聪明、更能干、更贴心”,在1+8设备操控、语音交互、文案帮写等方面都能处理得游刃有余,能够理解更为复杂的场景对话,输出相应的交互动作和内容。
这得益于华为早前在大模型领域的布局。今年7月7日的华为开发者大会2023(Cloud)上,华为常务董事、华为云CEO张平安就宣布推出盘古大模型3.0,通用大模型、行业大模型及更为细化的场景模型分别对应“L0~L2”三层模型架构,进而为行业提供大模型服务。
最新迭代的HarmonyOS 4就融入了自身盘古大模型底层能力,能为C端用户带来更智慧化、高效化、个性化的AI体验。比如智慧助手小艺,在传统的语音交互外,还扩展了文字、文档、图片等交互功能。用户的表达可以更加模糊,口语化,能够像与朋友交流一样与小艺自然交互。
小艺背后的大模型就是在盘古L0基座大模型的基础上,针对终端消费者场景构建了大量的场景数据与精调模型后的L1层对话模型,进而适用于终端消费者场景。
不过,根据官方发布会以及线下体验视频来看,华为小艺确实展现出了如定闹钟、听新闻、识别文字制作表格等,面对复杂内容时的良好表现能力。但由于目前受制于鸿蒙系统的正式发布,小艺也只是公布了测试计划:在今年8月底开放邀请测试,并于晚些时候在搭载HarmonyOS 4.0及以上的部分机型通过OTA升级体验。也就是说,从目前华为公布的蓝图到落地,再到小艺融入寻常百姓家,这个过程中仍有着时间鸿沟。
大模型顾名思义包含的参数规模是巨大的,训练时的算力也成了关键。
中国工程院院士、鹏城实验室主任高文把算力比作电力,认为没有大算力做大模型就是天方夜谭。华为轮值董事长胡厚崑也提到,大模型训练的效率或者是创新的速度,根本上取决于算力的大小。
因此,研发ChatGPT的OpenAI对英伟达A100/H100芯片的需求持续增加,订单量超过数十亿美元,并且造成了预计H100的43万张缺口。同理,当手机上嵌入大模型后,其算力如何保证,以及算力背后的芯片性能如何提升,也影响着产品应用的使用体验。
在能耗方面,荣耀CEO赵明表达过看法和担忧:端侧大模型在后台不断地运行,AI低功耗的能力未来会是一个核心。未来端侧大模型的时代,一定对续航的体验不会产生大的影响,实现路径上会在“更聪明的AI”和“更优的续航”之间做一个平衡。
因为表现良好的模型规模较大,所需要的存储空间也越多,所以更大的模型也意味着在推理训练和运算的过程中需要更多的能耗。而目前行业中对移动端大模型压缩精简的方法主要是,通过知识蒸馏、轻量化模型架构、剪枝、量化等其中的一种或几种方式进行压缩后 “塞”到手机里,最终的能耗和续航表现也需要在实验室测试完毕后才能拿到市场进行验证。
最后还要考虑大模型训练时所需要的数据参数,放在手机上就是来自于语音助手的日常交互量。
据华为终端BG首席运营官何刚介绍,华为手机语音助手小艺月活用户数超2亿,智慧屏小艺日均唤醒次数为7次以上。而小米旗下的小爱同学截止到3月27日,月活用户达 1.15亿,语音交互次数累计达2158亿;激活小爱同学的设备数达4.59亿,小爱同学支持控制共79类,支持智能产品共计5312款。对于语音助手的覆盖数量来看,想要达到大模型的千亿级参数量级以便能有更为精准的交互和反馈,小艺、小爱同学还远远不够看。
刚刚结束的小米新品发布会上雷军提到,未来的小米将全面拥抱大模型,小爱同学也将第一时间用上大模型。与此同时有消息显示,OPPO、vivo也都在发力于大模型领域,但最终的落地会稍晚一点。据国外媒体报道,苹果也开始着急招聘大模型研发人才,其位于巴黎的AI研究所从Meta挖到了相关研发人员。
智能手机真的能在AI大模型的加持下,如愿捅破存量市场的天花板吗?
一方面,部署在云端的人工智能算法和App,在手机这类设备中应用时,往往存在三个短板:服务响应延迟高、服务个性化不足、云端服务器压力大。这不仅直接影响到用户的产品体验,而且会增加厂商对云服务器的采购成本。
而作为如今每年拥有十几亿出货量的个人终端设备,智能手机就像是拥有大量闲置算力的移动计算单元,如果能在这些设备闲置时间里将碎片化、分布式的算力利用起来,对于厂商和用户来说会是一种双赢的局面。
另一方面,智能手机厂商们在高度同质化的激烈竞争下,存量市场迟迟得不到突破,亟需新的技术和故事来拉动市场表现。而一直被认为是鸡肋的语音助手刚好是用户的智能化入口,在对用户的个性化需求理解方面更具优势。
用语音助手来服务用户的同时也面临着一些争议,比如训练语言模型的数据是否合法?在这方面,华为表示坚持以安全与隐私保护为首要原则,主张更负责任的AI,所有AI体验创新和场景设计的第一原则是安全与隐私保护。
AI大模型一日千里,其发展故事早已不够稀奇和吸睛,但由于其表现出的巨大技术潜力,刚好符合智能手机厂商对未来的期待,想要彻底在端侧引爆大模型,还需要时间来鉴定。
参考资料:
关键词: