图1从基于规则到遵循人的价值观，大型语言模型变迁由来已久-行业数据

您的当前位置：上海品茶 > 行业数据 > 图1从基于规则到遵循人的价值观，大型语言模型变迁由来已久

图1从基于规则到遵循人的价值观，大型语言模型变迁由来已久原图定位

1.1. NLP 五级进阶，大模型应运而生 ............................................ 3 1.2. 从 CNN 到 Transformer，大模型底层架构显著优化 ................. 3 1.3. 大模型技术路线各有侧重，MaaS 已成产业趋势 ..................... 5 2. GPT 系列一路领先，海外大模型角逐激烈 .................................... 6 2.1. OpenAI:GPT 系列大模型一骑绝尘，智能化程度提升迅速 ....... 6 2.2. 微软：与 OpenAI 深度绑定，占得行业先机 .......................... 10 2.3. 谷歌：扎根基础模型研发，引领技术革新 ............................ 13 3. 国内大模型蓄力已久，赶超动能强劲 ......................................... 16 3.1. 百度：全栈技术积累颇丰，AI 应用场景全覆盖 .................... 16 3.2. 腾讯：优化大模型训练，加速大模型应用落地 ..................... 20 3.3. 阿里：聚焦通用底层技术，开源释放大模型应用潜力 ........... 21 3.4. 华为：昇腾 AI 打造全栈使能体系，定位行业级 CV 应用 ...... 23 4. 算力及硬件承压，模型训练多路径优化 ...................................... 25 4.1. 海量参数开路，算力瓶颈渐至 .............................................. 25 4.2. 模型日益复杂，硬件需求承压 .............................................. 27 4.3. 聚焦技术路线优化，突破模型算力瓶颈 ................................ 28 5. 投资建议 ................................................................................... 31 6. 风险提示 ................................................................................... 31 1. 大模型构筑 AI 基石，MaaS 未来可期 1.1. NLP 五级进阶，大模型应运而生从基于规则到基于人的意识，大型语言模型是技术进步的必然产物。自然语言处理发展到大型语言模型的历程可分为五个阶段：规则、统计机器学习、深度学习、预训练、大型语言模型。考虑到机器翻译是 NLP 中难度最高、综合性最强的任务，可借助该功能来论述不同技术阶段的典型特点。从 1956 年到 1992 年，基于规则的机器翻译系统在内部把各种功能的模块串到一起，由人先从数据中获取知识，归纳出规则后教给机器，然后由机器执行这套规则，该阶段为规则阶段；从 1993 年到 2012年是统计机器学习阶段，在此期间，机器翻译系统可拆成语言模型和翻译模型，该阶段相比上一阶段突变性较高，由人转述知识变成机器自动从数据中学习知识，当时人工标注数据量在百万级左右；从 2013 到 2018年，进入深度学习阶段，其相比于上一阶段突变性较低，从离散匹配发展到 embedding 连续匹配，模型变得更大，标注数据量提升到千万级；预训练阶段存在于 2018 年到 2022 年，跟之前比较，最大变化是加入了NLP 领域杰出的自监督学习，将可利用数据从标注数据拓展到了非标注数据。该阶段系统可分为预训练和微调两个阶段，将预训练数据量扩大3 到 5 倍，典型技术栈包括 Encoder-Decoder、Transformer、Attention等。