中国大模型发展研究报告（2024）(1)

中国大模型发展研究报告（2024） 2024年04月智引前沿，模生未来2 技术创新中国的大模型技术近年来经历了快速的创新与发展，成为全球人工智能领域的重要力量。在技术创新层面，中国科研机构与科技企业持续投入研发资源，推动了大模型在算法优化、架构创新、训练效率提升等方面取得显著成果。此外，中国在模型压缩、模型剪枝、知识蒸馏等优化技术方面也取得了创新，有效降低了大模型的计算成本和能耗，使得大模型能够在更多的实际应用场景中得到部署和应用。模型规模与性能方面，国内已成功研制出多款具有国际影响力的超大规模预训练模型。如百度的“文心”系列模型，其最新版本“文心一言”已达到数十亿参数量级，展现出强大的自然语言理解与生成能力。阿里云的M6大模型更是突破10万亿参数，刷新了全球最大的预训练模型记录。这些模型在通用语言任务基准测试（GLUE、SuperGLUE等）上表现出与国际顶尖模型相当甚至超越的性能。跨模态与专业领域应用拓展方面，中国大模型研究积极向多模态融合及特定行业知识嵌入方向深化。如华为发布的盘古大模型，实现了视觉、语音、文本等多种模态数据的统一表征与理解，应用于智能家居、医疗影像分析等场景。腾讯的药物发现大模型“云深”则专攻生物医药领域，通过大规模预训练提升化合物性质预测与新药设计效能。1一、中国大模型发展现状 2. 市场进展中国大模型的应用商业化进程日益加速，已在诸多行业形成实际落地案例。在互联网内容创作领域，大模型助力智能写作、新闻摘要生成、虚拟人对话等应用，提升了内容生产效率与个性化用户体验。在企业服务领域，基于大模型的智能客服、文档理解与自动摘要工具帮助企业实现高效信息处理与决策支持。此外，金融、教育、政务等行业也积极探索大模型在风险评估、智慧教育、政策解读等场景的应用，形成了多元化的商业模式。市场进展还体现在大模型服务平台的兴起。一些企业开始提供 “模型即服务”（Model as a Service, MaaS）的解决方案，让没有足够资源和能力独立训练大模型的中小企业也能够享受到大模型带来的技术红利。 3. 产业生态中国大模型产业生态呈现出蓬勃生机与高度协同特征。从产学研用的角度看，高校与科研院所作为基础理论与关键技术的研发源头，与科技巨头、独角兽企业及初创公司紧密合作，共同推进大模型技术的研发、迭代与应用落地。例如，清华大学、中国科学院等学术机构与百度、阿里、腾讯等企业共建联合实验室，开展前沿课题研究与人才培养。同时，各类AI开放平台如飞桨、阿里云天池等，通过提供大模型开发工具、训练资源与竞赛活动，有力促进了技术社区的交流与创新生态的构建。近年来，随着人工智能技术的快速发展，大语言模型（Large Language Model）逐渐成为我国人工智能领域的研究与应用热点。大模型指的是使用大规模数据进行训练的深度学习模型，具备较强的泛化能力、语言理解和生成能力。截至2024年，我国在大模型技术创新与市场应用方面取得了显著成果。“ 2 334 政策环境中国始终高度重视人工智能发展机遇和大模型等新技术的发展，发布多项人工智能支持政策。2017年，国务院颁布《新一代人工智能发展规划》，旨在通过顶层设计，引领人工智能技术的创新和发展。 2022年，为了进一步落实该规划，科技部等六部门发布了《关于加快场景创新以人工智能高水平应用促进经济高质量发展的指导意见》，明确了人工智能技术在不同场景下的应用路径和目标。2023年，国家网信办等七部门联合出台《生成式人工智能服务管理暂行办法》，标志着对生成式人工智能技术应用的规范和监管，确保其健康发展和合理利用。而在2024年的《政府工作报告》中，更是提出了 “人工智能+”行动，这不仅是对人工智能技术融合各行业应用的鼓励，也是推动经济结构转型升级的重要举措。地方层面，多个省市也相继出台了支持AI大模型发展的政策措施。北京正致力于促进大模型技术的创新，并构建一个高效的产业生态系统。上海的目标是打造具有国际竞争力的大模型技术集群。深圳则特别支持基于国内外芯片和算法技术的开源通用大模型的研发，并鼓励企业对商业大模型进行持续的创新和改进。安徽通过提供资源支持，吸引大模型企业在当地落户。成都则专注于推动大模型技术的创新，特别是在计算机视觉（CV）、自然语言处理（NLP）以及多模态大模型等领域，以及针对医疗、金融、商务和交通等行业的专用大模型的研发。杭州则支持行业龙头企业在多模态通用大模型的关键技术方面进行攻关，同时鼓励中小企业深入特定领域，开发更为精细化的专业模型。这些政策的实施，不仅为AI大模型技术的发展提供了坚实的政策基础，也为形成健康、有序的产业生态提供了保障，进一步加速了大模型技术在中国的产业化进程。颁布时间颁布主体政策名称主要内容 2023年7月国家网信办等七部门《生成式人工智能服务管理暂行办法》《办法》旨在促进生成式人工智能健康发展和规范应用，维护国家安全和社会公共利益，保护公民、法人和其他组织的合法权益。《办法》根据《中华人民共和国网络安全法》、《中华人民共和国数据安全法》、《中华人民共和国个人信息保护法》、《中华人民共和国科学技术进步法》等法律、行政法规制定。出台《办法》，既是促进生成式人工智能健康发展的重要要求，也是防范生成式人工智能服务风险的现实需要。 2023年5月北京市人民政府办公厅《北京市促进通用人工智能创新发展的若干措施》高效推动新增算力基础设施建设: 将新增算力建设项目纳入算力伙伴计划，加快推动海淀区、朝阳区建设北京人工智能公共算力中心、北京数字经济算力中心，形成规模化先进算力供给能力，支撑千亿级参数量的大型语言模型、大型视觉模型、多模态大模型、科学计算大模型、大规模精细神经网络模拟仿真模型、脑启发神经网络等研发。开展大模型创新算法及关键技术研究: 围绕模型构建、训练、调优对齐、推理部署等环节，积极探索基础模型架构创新，研究大模型高效并行训练技术和认知推理、指令学习、人类意图对齐等调优方法，研发支持百亿参数模型推理的高效压缩和端侧部署技术，形成完整高效的技术体系，鼓励开源技术生态建设。表1 2023中国大模型相关政策汇总4