上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

百度大模型驱动下的智能代码助手提效实践-李杨.pdf

编号:153188 PDF 20页 5.71MB 下载积分:VIP专享
下载报告请您先登录!

百度大模型驱动下的智能代码助手提效实践-李杨.pdf

1、大模型驱动下的智能代码助手提效实践百度 工程效能部 李杨 百度资深研发工程师百度资深研发工程师,云端开发平台云端开发平台(iCoding)的技术负责人的技术负责人,AI编程助手编程助手(Baidu Comate)商业化负责人商业化负责人 百度一级专利发明人,名下国内外发明专利百度一级专利发明人,名下国内外发明专利1010余个,已获授权余个,已获授权 国家重点研发计划国家重点研发计划基于人机结对编程与协同进化的智能敏捷开发云基于人机结对编程与协同进化的智能敏捷开发云平台平台技术骨干技术骨干自我介绍自我介绍李杨李杨目录1.背景与趋势背景与趋势1.软件研发领域新机遇软件研发领域新机遇2.AI原生应用

2、带来软件工程形态演进原生应用带来软件工程形态演进3.A原生研发过程原生研发过程4.AI研发工具研发工具2.百度代码助手百度代码助手 Comate 的技术介绍的技术介绍1.模型预训练模型预训练2.多场景精调多场景精调3.工程能力优化工程能力优化,发掘模型潜力发掘模型潜力3.百度内应用案例及效果介绍百度内应用案例及效果介绍1.场景落地场景落地2.效果介绍效果介绍4.未来展望未来展望软件研发领域新机遇软件研发领域新机遇AI 原生应用带来的软件形态LLM 能力带来的生产力变化AI 原生的产品思维AI 原生的应用架构 AI 原生的研发过程重构研发过程AI 原生研发工具链AI原生应用带来软件工程形态演进原

3、生应用带来软件工程形态演进未来软件工程未来软件工程(AI原生软件工程原生软件工程)3.0N/A第一代软件工程第一代软件工程采用工程化的方法是从事软件系统的采用工程化的方法是从事软件系统的研发和维护的非常必要的研发和维护的非常必要的。现代软件工程现代软件工程别名别名代系代系1.02.0诞生背景诞生背景主要特征主要特征标志事件标志事件2001年年,敏捷宣言敏捷宣言发布发布,在这之后在这之后逐步形成了敏捷逐步形成了敏捷/DevOps开发模式开发模式、精益软件开发模式等形态精益软件开发模式等形态。建立在建立在SaaS(软件即服务软件即服务)、)、Cloud 之上的软件工程之上的软件工程。受互联网受互联

4、网、开源软件运动开源软件运动、敏捷敏捷/DevOps 开发模式影响开发模式影响。各种研发工具理解研发人员交待的任务各种研发工具理解研发人员交待的任务,可自主完成软件开发中各阶段工作可自主完成软件开发中各阶段工作。依赖全新的自然语言方式依赖全新的自然语言方式,广大研发人员会广大研发人员会 通过提示词通过提示词(Prompt)与工具与工具、系统交互系统交互。在软件工程在软件工程 3.0基础下的软件研发典型特征基础下的软件研发典型特征:基于人机交互基于人机交互,不断引导大模型不断引导大模型、及时纠错及时纠错、优化开发过程优化开发过程;研发人员致力于两头研发人员致力于两头(定义问题定义问题、验收结果验

5、收结果),),大模型负责完成中间开发任务大模型负责完成中间开发任务。1968年年NATO的计算机科学家在联邦的计算机科学家在联邦德国召开国际会议德国召开国际会议,讨论软件危机问讨论软件危机问题题,正式提出了正式提出了“软件工程软件工程”(Software Engineering)这一术这一术语语。随着计算能力的提高和大数据的兴起随着计算能力的提高和大数据的兴起,逐渐形成了逐渐形成了“现代软件工程现代软件工程”。受建筑受建筑、水利工程等影响的传统软件工水利工程等影响的传统软件工程程,上个世纪五上个世纪五、六十年代出现的软件危六十年代出现的软件危机迫使人们去寻找产生危机的内在原因机迫使人们去寻找产

6、生危机的内在原因,进而找出消除危机的解决方案进而找出消除危机的解决方案。随着人工智能和大模型技术的推动随着人工智能和大模型技术的推动,与软件研发生命周期的深度融合与软件研发生命周期的深度融合,重重新定义了软件研发人员构建新定义了软件研发人员构建、维护和维护和改进软件应用的范式改进软件应用的范式。现有的研发过程有以下关键特点现有的研发过程有以下关键特点:过程起点固以产品需求调研与需求设计为过程起点;以代码交付为核心;基于规则和自动化;各角色间协同边界较为固定。AI原生研发过程有以下关键特点原生研发过程有以下关键特点:需求工程是价值交付活动的起点和终点,会逐步成为研发中最关键的部分;所有的产品研发

7、都将在原先的以代码为核心的交付基础上,形成两级价值交付的驱动方式:Idea驱动和数据驱动;各角色间协同边界不再固定;大模型(LLM)、数据集(DataSet)、提示词(Prompt)等会与代码一样,成为大部分研发日常面对的一等公民。需求调研需求设计MVP开发代码开发代码评审测试/效果评估发布/上线运维Prompt开发Prompt评审数据工程模型微调在线监控/反馈价值回顾AI原生研发过程原生研发过程大模型平台产品全景图大模型平台产品全景图:定义定义AI应用新范式应用新范式百度文心大模型ERNIE Bot第三方大模型ChatGLMRWKVMPT Llama 2Stable DiffusionDol

8、lyBLOOMZFalcon大模型数据管理数据清洗数据生成数据标注模型训练Post-pretrainingSFTRLHF评估&优化大模型仓库大模型评估大模型压缩预测服务部署服务部署及托管Profile记忆在线测试器Prompt 工程Prompt模板Prompt推荐自动优化插件应用插件库插件编排数据回流训练可视化增量训练大模型安全多模型调度大模型工具链大模型训练加速端到端并行训练优化大模型场景建模大模型生产线大模型应用集成全流程 LMOps SDK自动化推理服务监控大模型预置场景训推加速稳定性保障多芯混部安全可信ERNIE-ViLG大语言模型多模态模型研发新流程与大模型驱动工具演进研发新流程与大

9、模型驱动工具演进需求调研需求设计Prompt开发Prompt评审MVP开发数据工程调研&设计需求澄清任务分解代码解释编写代码实时续写注释生成代码描述生成代码调试代码缺陷自动修复生成测试用例代码优化技术问答生成注释生成单元测试智能评审安全检查与修复API网关LLMCacheAPIGatewaySCS for Redis编排调试低俗涉政安全服务非代码内容规范价值观通用代码能力工具调用向量检索预训练数据SQLPlugins客户业务APICFCVectorDBBESEmbedding文档切分数据处理 Pipeline领域文档BOSERNIEEasyDAPToken/耗时统计Log/TraceQianf

10、anSDKCPromBLSERNIE Code2.0意图拆解静态编排(Chain)动态编排(Agent)Prompt工程ERNIE Code2.0私域知识增强PALORDS防中间劫持Baidu Comate架构图架构图模型预训练模型预训练Github私域代码原始数据Star数活跃度数据源清洗片段长度复杂度内容清洗语言分布知识覆盖分布平衡FIM结构转换多场景精调多场景精调数据分析语法解析函数调用关系分析文件依赖关系分析独立函数提取数据生产测试函数与被测函数代码片段与注释代码片段与代码解释代码问答对数据清洗高复杂度函数过滤无效注释过滤测试框架过滤与分类(单测)代码格式化什么时候生成单行 VS 多行

11、规则 VS AI环境匹配度用什么生成上文代码下文代码相关文件怎么生成Prompt调优专项SFT生成后咋用质量检测可信度后文合并不满意怎么办多条推荐更大规模模型介入工程优化工程优化,发掘模型潜力发掘模型潜力反馈驱动创新反馈驱动创新安装推荐采纳留存反馈驱动创新加入训练LLMBaidu Comate 效果展示效果展示Baidu Comate 后端案例后端案例Baidu Comate 前端案例前端案例AI结对结对,效率加倍效率加倍百度内部使用效果百度内部使用效果合作企业使用效果合作企业使用效果80%+80%+工程师使用1515万万日生成代码采纳行42%42%采纳率20%20%体感研发效率提升40%+40%+企业采纳率40%40%公有云采纳率注:15万行代码相当于1875名工程师的一天的代码产出全面AlAgent加持+原有规则引擎能力通用知识+面向研发团队的私域知识增强LLM推理与计划能力+灵活的调用工具能力更进一步更进一步,迈向全面自动化的人机协同迈向全面自动化的人机协同机遇与未来展望机遇与未来展望

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(百度大模型驱动下的智能代码助手提效实践-李杨.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部