国内大模型竞赛火力全开 华为盘古大模型7月升级-全球观速讯

南方都市报   2023-06-28 08:54:20

AI大模型掀起的浪潮,一浪高过一浪。不久前,英伟达总市值首次突破万亿美元,成为仅次于苹果、微软、谷歌、亚马逊的美股市值第五大公司。“英伟达一天暴涨2000亿美元的市值,等于一个AMB、两个英特尔,很大程度上正是源于AI训练对算力的需求。”6月17日,在华为开发者联创日深圳首站的活动现场,北京前沿金融监管科技研究院执行理事长、贝克资本董事长兼CEO张克感叹道。

行业专家指出,大模型的参数规模正越来越大,ChatGPT-3拥有1750亿个参数,GPT4没有公开,但预计超过万亿的量级,已经和人类神经元连接数差不多。

活动现场,与会嘉宾围绕AI技术的趋势前瞻、行业应用、开发者成长等展开交流探讨。


(相关资料图)

大模型引领新一轮人机革命  

回顾人工智能发展的历史,1960年代至1990年代,第一代人工智能是以知识驱动的人工智能,主要代表是专家系统;1990年至2020年,第二代人工智能是以数据驱动的深度学习为代表的连接主义,其特点是数据+算力+算法;2020年至今,第三代人工智能以“知识+数据”为驱动,特点是常识、经验、推理等类人思考的能力。

会上,华为AI技术规划专家王琛介绍大模型技术正被用于企业服务,通过公有云、私有云、Finetune(专有训练+推理资源)等部署模式,助力企业应用升级。王琛认为,当前人工智能的深度学习还面临三大难题:一是泛化性差,二是难以与领域知识融合,三是安全可信。美国自然科学基金会指出,AI系统进入千行百业,关键是融合更多的关键知识领域,比如说AI和农业、物理、化学的技术相结合;在今年的AI大会上,则发布了坚守有责任的使用AI的章程,提出了大模型时代坚持的原则,如人类可审计、开源可获取等标准。

王琛表示,当前正处于第二代人工智能向第三代人工智能交替的阶段,“知识+数据”驱动使得AI的系统具有常识经验推理等人类思考的能力。

他认为,未来AI技术突破有三个方向:一是以大模型为基础,“语言”牵引“AI编解码”模型架构趋于统一,未来模型向“模态时空动态”演进;二是通用求解器,从游戏到AI4Science,结合专家知识突破挑战NP-hard难题,未来“预测与控制”深入应用;三是EmobodiedAI,集成AI,AI与物理世界的交互,积累更多经验和常识,提升推理能力,达到与人类共生。王琛也提醒说,未来要有责任地使用AI。  

AIGC大爆发

2025年将有10%数据由AI创造 

人工智能迈入新阶段,AIGC持续火爆。Al生成内容(Al Generated Content,AlGC),生成式Al是指计算机通过机器学习从现有数据中学习一个对象(物品、产品或任务)的要素,进而生成一个全新的、原创的、真实的、与原来内容相似的对象。

华为云AI生态技术专家夏飞认为,AIGC的火爆预示着人工智能发展的趋势,从感知世界到理解世界,如今已经开始创造世界。

Gartner在2021年发布的《人工智能对人类和社会的影响》,预计至2023年将有20%的内容被生成式Al所创建,至2025年,生成式AI产生的数据将占所有数据的10%,而今天这个比例还不到1%。

夏飞援引的数据显示,预计2030年,中国AIGC市场(仅包含内容创作,不含Al代码生成)将达到万亿的规模。与Al市场空间比例类似,全球市场约5~7万亿。最近1-2年的市场空间主要集中在AI直接生成的内容作为业务变现点。未来3~5年,更大的市场空间会延伸至营销推广、数据合成(作为补全数据的方式)、虚拟陪伴、游戏策略生成、游戏角色生成等方面。

夏飞也指出,当前很多的公司进入AIGC这个赛道,但是AIGC不光需要技术突破,还是一项系统性的工程,从底层的算力资源需求,到上面的集成框架层以及AI平台层都需要有一定的积累,不能盲目跟风冒进。

大模型竞赛是巨头间的战争,国内相继诞生了百度文心一言、阿里云通义千问、腾讯混元大模型、华为盘古大模型等。业内人士认为,国内能够把两万块GPU卡训练出来的公司,只有5家企业以内,能够把通用大模型做出来的只有3到4家。

而华为是这场竞赛中重要的种子选手。在当天活动现场,夏飞也提到盘古大模型在7月会有重磅的升级。

夏飞介绍,华为盘古大模型发布了CV大模型、NLP大模型、科学计算大模型等,华为在大模型的领域研究多年,拥有多模态中文数据库,判别模型与生成模型结合,能够灵活支持下游任务,如文生图、文本导向的图像补全、图片编辑等。

活动现场,夏飞还展示了在华为盘古大模型的支持下,AIGC完成了文本生成、图片生成、视频剪辑等内部应用,以及AIGC跟手机厂商合作,自动生成手机的屏保,跟品牌零售商合作,生成不同商品的海报和广告图片。

腾讯云布局行业大模型

汤道生:加速大模型在产业场景的创新探索

ChatGPT引发了全球“大模型”热潮,人工智能产业进入新的发展阶段。如何掌握“下一个十年”的核心竞争力,在新拐点中构建优势成为企业关注的新命题。6月19日,腾讯云在国家科技传播中心召开行业大模型及智能应用技术峰会,首次公布腾讯云行业大模型研发进展,依托腾讯云TI平台打造行业大模型精选商店,探索大模型应用实践的可行路径。 

生态共建是AI发展

有效路径  

会上,腾讯云联合22家客户正式启动行业大模型共建合作,并携手17家生态伙伴共同发起了“腾讯云行业大模型生态计划”,致力于共同推进大模型在产业领域的创新和落地。基于腾讯HCC高性能计算集群和大模型能力,腾讯云已经为传媒、文旅、政务、金融等10余个行业提供了超过50个大模型行业解决方案。

腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,生态共建是AI发展的有效路径,腾讯将坚持生态开放,为企业提供高质量模型服务,同时支持客户多模型训练任务,加速大模型在产业场景的创新探索。

当前,通用大语言模型在应对产业场景落地时存在一定的局限性。首先,通用大模型的训练数据主要来自公开数据集或网络数据,对于特定行业的专业领域知识了解有限。此外,通用大语言模型的训练需要大量计算资源和漫长的训练周期,这对企业来说可能昂贵且耗时。同时,安全和合规也是必要考量因素。  

根据自身业务场景需求

定制不同规格模型服务 

对于企业而言,选择定制一个专属大模型,或许是解决这些问题的最佳答案。腾讯云针对上述行业应用的痛点和需求,依托腾讯云TI平台打造行业大模型精选商店,提供涵盖模型预训练、模型精调、智能应用开发等一站式行业大模型解决方案。在TI平台内置行业大模型基础上,企业加入自己独有的场景数据,就可以快速生成自己的专属模型;同时,也可根据自身业务场景需求,“量体裁衣、按需定制”不同参数、不同规格的模型服务。

在加速产业场景探索的同时,腾讯云行业大模型能力已在腾讯企点、腾讯会议、腾讯云AI代码助手等多款头部SaaS产品中率先应用。

汤道生表示:“今天,我们再一次站在数字科技革命的起点上,大模型只是开端,AI与产业的融合,将绽放出创造力的未来。”

采写:南都·湾财社记者 程洋 受访者供图