本报告由中信建投证券股份有限公司在中华人民共和国(仅为本报告目的,不包括香港、澳门、台湾)提供。在遵守适用的法律法规情况下,
本报告亦可能由中信建投(国际)证券有限公司在香港提供。同时请务必阅读正文之后的免责条款和声明。 证券研究报告 ·海外行业深度 逐浪大模型: 互联网巨头
的AI野望
核心观点
语言模型已步入大模型发展阶段,国内大模型研发应用热潮
持续高涨,科技大厂在模型、算力、平台、应用进行了四位一体
的全面布局,如阿里的“通义大模型 +飞天智算平台 +魔塔社区 +
行业应用” 、百度的“文心大模型 +昆仑芯+飞桨平台 +行业应用” 、
腾讯的“混元大模型 +HCC 算力集群 +太极机器学习平台 +行业应
用” 、字节的“视觉语言模型 +火山高速训练引擎 +火山机器学习
平台+行业应用” 。大模型落地将形成 API、PaaS 和MaaS 三种收
费模式, 目前仍以内部应用为主, 后续主要向 B端企业拓展服务,
预计少数企业将在 C端市场形成规模。
摘要
大模型发展全面加速,通过“预训练 +精调”模式进行落地。
语言建模经过统计语言模型、神经语言模型、预训练语言模型,
已经全面迈入百亿、千亿参数规模的大语言模型阶段。大语言模
型具备优秀的上下文学习能力、上下文学习能力、可观的知识容
量、优秀的泛化性和复杂推理能力。大模型研究存在 Google 的
Bert 模式、OpenAI 的GPT 模式和国内的混合模式三条技术线,
以ChatGPT 为主导GPT 模式目前已经占据主流。目前,国内已
有至少19家企业及科研院所参与人工智能大模型训练,主要分
为大型科技公司、 科研院所和初创科技团队三类。 国际对比来看,
目前美国领跑,中国跟跑,但差距不断缩小。在 实践中,预训练
大模型在基于海量数据的自监督学习阶段完成了“通识”教育,
再借助“预训练 +精调”等模式,在共享参数的情况下,根据具
体应用场景的特性,用少量数据进行相应微调,即可高水平完成
任务。
互联网大厂在“模型、算力、平台和应用” 进行四位一体布
局。阿里“通义大模型 +飞天智算平台 +魔塔社区 +行业应用” : 在
模型层,阿里达摩院主导大模型研究,发布通义大模型,包括通
义M6多模态模型、通义 AliceMind 自然语言处理模型、通义视
觉计算机视觉模型。在算力层,阿里云推出全栈智能计算解决方 维持 强于大市 孙晓磊
sunxiaolei@csc.com.cn
SAC 编号:S1440519080005
SFC 编号:BOS358
崔世峰
cuishifeng@csc.com.cn
SAC 编号:S1440521100004
于伯韬
yubotao@csc.com.cn
SAC 编号:S1440520110001
发布日期: 2023 年05月31日 市场表现
相关研究报告
-14%6%26%46%66%86%2022/5/302022/6/302022/7/312022/8/312022/9/302022/10/312022/11/302022/12/312023/1/312023/2/282023/3/312023/4/30传媒标普500互联网
海外行业深度 报告 互联网
请务必阅读正文之后的免责条款和声明。 案“飞天智算平台” ,并启动两座超大规模智算中心。此外,阿里不仅拥有最多的英伟达A100芯片,还拥有自研芯片含光800、倚天710芯片,共同为人工智能大模型提供算力。在平台层,阿里推出AI开源社区“魔搭” ,旨在打造下一代“模型即服务”的共享平台,整合业界多方模型提供者,为开发者提供预训练基础模型和API接口。在应用层,阿里已宣布旗下所有产品未来将全面改造并接入通义大模型,包括天猫、钉钉、高德地图、淘宝、优酷、盒马等。 百度“文心大模型+昆仑芯+飞桨平台+行业应用” :在模型层,百度文心大模型构建了“基础+任务+行业”三级模型;在算力层,算力基础设施均由百度智算中心支持,昆仑芯二代已广泛应用在文心大模型,预计昆仑芯三代将于2024年初量产;在平台层,百度飞桨PaddlePaddle是其自主研发的深度学习平台,文心大模型通过百度飞桨平台,实现模型训练、推理部署和场景应用;在应用层,文心大模型将应用在电力、燃气、金融、生物医药、航天、传媒、城市、影视、制造、社科等多个行业。 腾讯“混元大模型+HCC算力集群+太极机器学习平台+行业应用” :在模型层,2022 年 4 月,腾讯对外披露了混元大模型,涉及自然语言处理、计算机视觉、多模态等多个领域。腾讯自研的太极机器学习平台为混元大模型提供算力,可支持 10TB 级模型训练、TB 级模型推理计算能力等。2023 年 3月,腾讯对标 ChatGPT 已成立“混元助手”战略级项目组;在算力层,2023年4月14日,腾讯云发布新一代HCC高性能计算集群,其采用最新一代星星海自研服务器,搭载NVIDIA H800 Tensor Core GPU,并基于自研网络、存储架构,带来3.2T超高互联带宽 TB级吞吐能力和千万级IOPS;在平台层,腾讯自研搭建了业界一流的太极机器学习平台,致力于让用户更加聚焦业务AI问题解决和应用,一站式的解决算法工程师在AI应用过程中特征处理,模型训练,模型服务等工程问题;在应用层,混元大模型已成功应用于腾讯广告,将全面接入微信端、QQ 端和王者荣耀、英雄联盟游戏端,提供智能聊天、内容推荐、情感分析、故事生成、角色塑造等功能,以及腾讯混元大模型有望将在游戏、社交、金融、教育、医疗等领域发展生态。 字节“视觉语言模型+火山高速训练引擎+火山机器学习平台+行业应用” :在模型层,字节在AI方面的积累主要集中在机器翻译、智能语音、视频图像和多模态四个领领域。字节跳动的研究成果包括非自回归模型 DA-Transformer、端到端语音到文本翻译模型 ConST、多颗粒度的视觉语言模型X-VLM、图片和文本统一生成模型DaVinci等; 在算力层, 火山引擎在春季火山引擎FORCE原动力大会上正式发布自研DPU等系列云产品,并正式推出智能推荐-高速训练引擎,支持100GB至10TB以上超大模型的高效训练;在平台层,火山引擎在2023春季FORCE原动力大会发布了机器学习平台升级版,在数据管理、资源管理、流程和模型三大领域具备核心优势;在应用层,火山引擎的AI场景产品主要包括智能创作、智能体验以及智能营销,目前已服务数百家客户,分别在视频创作、互动创作、直播短视频构建中推动客户业务增长。此外,字节在内部的相关产品持续引入AI,包括海绵乐队、飞书My AI等。 商业应用尚处早期,以API、PaaS、MaaS三种模式为主。当前全球大模型产业落地仍处于早期探索阶段,需要与下游场景企业合作建立大模型商业模式,但下游企业目前对于大模型的理解相对有限,所需要的资源支撑比较薄弱。总的来说,大模型落地可以通过API接口调用付费、或者大厂提供落地所需的开发工具、云平台、服务等的PaaS模式、更进一步是直接提供相关定制好的模型调用的MaaS模式。
海外行业深度 报告 互联网
请务必阅读正文之后的免责条款和声明。 目录 摘要 ................................ ................................ ................................ ................................ ................................ ........... 1
一、大模型发展情况 ................................ ................................ ................................ ................................ ............... 1
1、行业发展历程 ................................ ................................ ................................ ................................ ............. 1
2、大语言模型概览 ................................ ................................ ................................ ................................ ......... 3
3、产业发展趋势 ................................ ................................ ................................ ................................ ............. 6
二、互联网大厂模型 ................................ ................................ .................
逐浪大模型:互联网巨头的AI野望
文档预览
中文文档
68 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共68页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-05-12 21:31:13上传分享