人工智能经历近70年的发展,核心能力不断提升,覆盖:
感知、认知、决策、学习、执行、社会协作能力
发展趋势:
向符合人类情感、伦理、道德观念的智能机器迈进
当前阶段:
技术能力驱动向需求应用驱动的转型关键期
技术进化推动经济进化,从旧范式到新范式
人工智能发展处于第三阶段向第四阶段过渡的战略拐点
定义:
拥有亿级以上参数的深度学习模型
利用深度学习算法、神经网络学习大量数据提升预测能力
特性:
性能与参数规模、数据集大小、计算量呈幂律关系
基于注意力机制,训练于大规模多样化无标注数据集,泛化能力强
分类:
按输入数据类型:语言大模型、视觉大模型、多模态大模型
按应用领域:通用大模型、行业大模型、垂直大模型
1956—2006年:深度学习与神经网络技术奠定基础,大模型萌芽
2006年后:自然语言处理技术、Transformer架构发展,为大模型预训练打基础
2018年:OpenAI发布GPT-1、Google发布BERT,预训练大模型成为NLP主流
2022年底:OpenAI推出ChatGPT,引发全球大模型发展热潮
2023年:中国大模型训练井喷,“百模大战”现象
2024年:中国政策加大行业落地推动力度,商业发展加速
2024年1-7月:央国企采购大模型项目数量超过950个
截至2024年11月:中国备案大模型数量达309个,垂直行业场景落地加速
2024年底:国产大模型使用价格下降,为大模型广泛商用奠定基础
备案:依照《生成式人工智能管理暂行办法》,3批次共计309个大模型备案
应用类型:
通用大模型:28%
垂直大模型:72%
应用领域:
互联网、金融、医疗、教育、工业行业占比均超过10%
两条产品进化路线:
增加参数量、扩大数据集、提升计算量 → 获得性能更强大模型
优化架构与训练策略 → 获得高性价比模型
2024年底:典型国产大模型价格降至0.5元/百万Tokens以内
商业化模式:
定制化模式(面向大型政企,占比55%)
API及订阅模式(中小企业及机构,占比40%-45%)
嵌入智能终端和APP收取广告费(未来趋势)
案例:
浦发银行:定制化算力设备与大模型软件,满足信创要求
苹果与百度合作:iPhone接入百度Ernie4.0,实现智能助手、图像识别等功能
场景需求评估:技术能力评估、应用场景梳理、能力分析
部署能力建设:大模型能力体系设计、系统研发、数据与算法准备
大模型应用部署:定制化优化、效能评估、全生命周期管理
大模型运营管理:实时监测、动态追踪、持续优化
2022—2027年:中国AI大模型应用市场复合增长率148%
2027年市场规模预计达1130亿
2024年公开大模型中标项目超1000个,市场规模约157亿
GPU新增需求超过190万张,算力投资千亿规模
80%新增算力用于头部互联网大模型训练及自有业务,20%用于行业用户能力建设
DeepSeek-R1重新设计训练流程
少量SFT数据+多轮强化学习:
提升模型准确性
降低内存占用和计算开销
算力与性能近似线性关系
核心三要素创新循环:算力、数据、算法
当前:产品供给驱动为主
未来3年:最终用户需求驱动,行业用户积极推动应用落地
营销获客难、风险管理低效、产品精准定位难、数字化转型成本高
AI解决方案:智能化营销、风险控制、客户精准洞察、全流程数字化
候诊时间长、检查效率低、处方复杂、中医资源不足
AI解决方案:智能分诊、辅助诊断、精准用药、知识管理
多渠道咨询效率低、数据分散、获客成本高、客服压力大
AI解决方案:智能分流、数据集中管理、自动化客服
数据分散、知识库更新慢、文书写作耗时、咨询回复慢
AI解决方案:智能数据分析、文书自动生成、知识库实时更新
客户洞察不足、市场预测难、体验差、营销效率低
AI解决方案:智能分析、个性化推荐、精准营销
研发知识难找、依赖核心技术人员、生产良品率低、营销脱节、知识缺少场景化、知识运营难
AI解决方案:知识体系化管理、智能推荐、研发协同、生产优化
Scaling Law面临挑战,研究重心从预训练向后训练转移
算力平台与模型创新紧密耦合
MoE架构广泛应用,提高模型性能和效率
大模型工具链完善,加速研发与落地
三大方向:
融合应用软件:优化用户体验、生产效率,提供增量付费点
智能助手:提升自然语言理解、生成能力和多模态能力
Agent:多模态大模型支持复杂任务,提升协同效率
高质量中文数据集稀缺
原因:
国内专业数据服务产业起步阶段,投入不足
数据交易体系规范尚未形成
私域数据流通难,行业场景数据获取受限