上海品茶

代码大模型对于工程理解的探索研究-汪晟杰.pdf

编号:164029 PDF 40页 10.44MB 下载积分:VIP专享
下载报告请您先登录!

代码大模型对于工程理解的探索研究-汪晟杰.pdf

1、代码大模型对于工程理解的探索研究腾讯云 产品专家/汪晟杰 代码大模型的内核 IDE的新体验 下一代编码变革 提示词的3S原则01 编码过程的辅助 根据 survey.stackoverflow.co 统计根据 内部问卷反馈编写代码 82.55%正在或计划使用 70%代码学习者可能性更高代码测试 75.81%代码纠查 77.99%提升开发效率 48%工具智能化 24%AI新技术探索 16%经验复用 12%AI 及新技术探索诉求日益强烈及新技术探索诉求日益强烈代码本质的几大特征代码本质的几大特征秩序性0逻辑性上下文感知性代码大模型本质要解决Token/算力成本01010202

2、0303语料/意图理解质量/自动化评测代码大模型的产品赛道可见的价值数据安全=好0IDE+编码效能=快对话+工程理解=准【应用形态】打造流畅高效的编程体验【模型】探索适合代码场景的行业模型q LLaMa系的模型 token window size 有限(2048),涉及到代码理解/生成这类 prompt/output 任务,易因超出token长度限制或由于上下文信息不全导致任务中断q LLaMa 是综合模型,预训练阶段私用代码知识库仅占 6.5%,工程知识量存在天花板q LLaMa系模型 humanEval 和 MBPP 测试结果低于专用代码生成模型【企业需求】符合国内行

3、业客户诉求SMAF多模能力数据看板丰富场景代码安全Securityq 保证基础模型里用于训练的代码是安全的MaaS Analysis Fullq 保障补全出来的代码是安全的q 各部门的业务特性不同,可能需要多个性化行业模型q 根据不同业务特性,进行二次训练,补全模型q 如何保障二次训练以及行业代码的训练效果q 有哪些效能指标,可以帮助管理者观察工具对开发工作的提升q 代码补全是高频场景,优先度最高q AI 编码辅助之外,代码扫描、评审、以及DevOps上下游规划q 针对专业开发者,提升工作效率和质量,对AI辅助生成的代码存在批判性思维 q 针对代码学习钻研用户,专注代码本身,创建小的、即时使用

4、的任务型应用程序 q 具备高粘度的编程体验,及时补全将调用的函数、方法等辅助性编码实践下文 q 响应速度更快、成本更低,基于更小的模型?智能编码下衍生的智能编码下衍生的SMAF诉求诉求全链路 N+1+1 成本与体验的拉扯代码补全技术对话单元测试代码诊断训练推理管理平台模型工厂数据运营4+1+1代码生成率代码采纳率对话采纳率测试生成率耗时情况QPS全链路遥测基于混元进行大模型指令对齐和强化学习进行行业模型的训练和推理优化,提升产品响应速度与交互体验反馈真实场景下的bad base,挖掘行业场景价值体体验验成成本本用相对较低的推理成本,batch 计算,小于300ms的延迟预训练更小的代码模型SF

5、T 微调IDE+AI 打造原生效果的打造原生效果的AI辅助的辅助的IDE形态形态VSCode 实验性原生交互接口实验性原生交互接口探索如何将 AI 更深入地集成到 VS Code 中,并提出了许多很酷的想法,例如改进的重命名和重构、基于示例的代码转换以及使用创建文件 glob 模式或正则表达式的方法自然语言。-摘自 vscode 的blogchat:可能是关于聊天功能的 API 提案。inlineCompletionsAdditions:可能是关于内联补全添加的 API 提案。interactive:可能是关于交互功能的 API 提案。documentPaste:可能是关于文档粘贴的 API

6、提案。interactiveUserActions:可能是关于交互用户行为的 API 提案。chatProvider:可能是关于聊天提供者的 API 提案。codeActionAI:可能是关于代码行为 AI 的 API 提案。findTextInFiles:可能是关于在文件中查找文本的 API 提案。textSearchProvider:可能是关于文本搜索提供者的 API 提案。terminalDataWriteEvent:可能是关于终端数据写入事件的 API 提案。terminalExecuteCommandEvent:可能是关于终端执行命令事件的 API 提案。terminalSelect

7、ion:可能是关于终端选择的 API 提案。terminalQuickFixProvider:可能是关于终端快速修复提供者的 API 提案。handleIssueUri:可能是关于处理问题 URI 的 API 提案。readonlyMessage:可能是关于只读消息的 API 提案。chatVariables:可能是关于聊天变量的 API 提案。mappedEditsProvider:可能是关于映射编辑提供者的 API 提案。aiRelatedInformation:可能是关于 AI 相关信息的 API 提案。chatAgents:可能是关于聊天代理的 API 提案。chatAgents2:可

8、能是关于聊天代理2的 API 提案。chatAgents2Additions:可能是关于聊天代理2添加的 API 提案。defaultChatAgent:可能是关于默认聊天代理的 API 提案。这些 API 提案的具体含义和实现细节,通常会在项目的文档或者相关的提案文档中有详细的描述。如果你想了解更多关于这些 API 提案的信息,你可能需要查阅这些文档。以AI为内核的IDE,布局下一代开发者利器AI化的IDE体验0利用本机算力云和仓库的增值下一代编码变革提示词工程与3S原则0习惯:问+编码停顿更注重注释文档提示词工程智能编码习惯的智能编码习惯的 3T

9、NB目标目标 Tab Tab Tab No Backspaceq 根据注释生成代码q 根据函数定义,生成函数体实现q 根据上文生成下文代码q 根据当前代码行输入,补全整行代码腾讯混元大模型 1.根据注释补全函数体2.补全依赖的新函数实现3.根据上文补全下文4.根据上文补全下文5.根据上文生成测试函数提示工程在代码场景下的重要性提示工程在代码场景下的重要性Github Copilot 提示工程的示例提示工程的示例你是一名编码助理,通过澄清用户的问题并提供用户可以搜索的相关关键字列表来帮助用户回答其工作区中有关代码的问题。用户会向您提供工作区中潜在的相关信息。这些信息可能不完整。请不要提及或要求用

10、户提供更多信息。您只需澄清并提供关键字。不要试图直接回答用户的问题。#附加规则逐步思考:1.阅读用户的问题,了解他们提出的关于工作空间的问题。2.如果问题中有模棱两可的词语,例如它、那个、这个,请查看对话历史记录来理解这些词语。3.输出问题的澄清版本,并解决所有歧义。在澄清问题时,请务必保留问题的意思。4.然后输出相关关键词的简短标记符列表,用户可以尝试搜索这些关键词来回答他们的问题。这些关键词可以用作文件名、符号名、缩写或相关代码中的注释。将与问题最相关的关键词放在前面。不要包含过于通用的关键词。5.对于Markdown相关关键字列表中的每个关键字,如果适用,请在其后添加一个逗号分隔的变体列

11、表。例如:对于encode,可能的变体包括encoding、encoded、encoder、encoders。考虑同义词和复数形式。#示例用户:base64编码的代码在哪里?回复:base64编码的代码在哪里?-base64encoding,base64encoder,base64encode-base64,base64-encode,encoded,encoder,encoders提示工程的准度的提示工程的准度的3S准则准则提示工程的基本原理,可以总结为3个个S如下。这些核心规则是创建有效提示的基础。单个单个 Single:始终将提示集中在单个、定义明确的任务或问题上。具体具体 Specif

12、ic:确保说明明确且详细,最好能附带一个示例或者模拟信息结构。具体且具象带来理解会带来更精确的代码建议。简短简短 Short:在具体的同时,保持提示简明扼要。这种平衡确保了清晰度,而不会使腾讯云AI代码助手超载或使交互复杂化。六大定律六大定律 定律一:有想法的程序员无法替代。智能编码目前代码速写辅助,依然需要你有开发思路。定律一:有想法的程序员无法替代。智能编码目前代码速写辅助,依然需要你有开发思路。定律二:学会引导定律二:学会引导AI,学会提示词,学会提示词,AI是你记忆存储。是你记忆存储。定律三定律三:每个模型的习性不同,提示词会不同,你要像训练小狗一样摸透他,即使你不懂大模型每个模型的习

13、性不同,提示词会不同,你要像训练小狗一样摸透他,即使你不懂大模型原理。原理。定律四:好好做好架构复用,不然你的代码里都是重复代码定律四:好好做好架构复用,不然你的代码里都是重复代码 定律五:用上手了,代码补全留存高于对话。定律五:用上手了,代码补全留存高于对话。AI理解工程代码,还需要传统方式相结合。理解工程代码,还需要传统方式相结合。定律六:软件工程不会被定律六:软件工程不会被AI颠覆,流程但会被简化,被智能化。学会定义上层提示词颠覆,流程但会被简化,被智能化。学会定义上层提示词DSL,编排,编排是未来开发者的技能之一。是未来开发者的技能之一。智能编码辅助实战智能编码辅助实战 工程场景的代码

14、语义增强搜索 对话:企业知识库RAG 补全:跨文件能力 特性提示词扩展02 工程理解的辅助 工程场景下的项目创建开始工程场景下的项目创建开始workspace/new语义增强检索的几大特征语义增强检索的几大特征Codebase Indexing0强化搜索Embedding&速度企业知识库RAG扩展上下文感知能力workspace#codebase本质上是在完成提示词的精简化工程的上下文补全引入更多的工程策略可行性方案打开过的文件0基于语法特性目录相关性相邻选项卡不同语言同包下代码补全代码补全+跨文件跨文件 实战实战特性提示词扩展特性提示词扩展Prom

15、pt as Code 单元测试增强探索 智能体 Devin&Copilot Workspace03 AISE的探索与挑战软件工程软件工程3.0迈入迈入AI时代时代研发流程研发流程+AI :艰巨但一步步,未来可期艰巨但一步步,未来可期AI 辅助的端到端软件研发过程q自动/辅助完成项目计划制定和排期q辅助完成需求细化、拆分以及分解到用户故事和任务q自动生成验收标准q代码反向工程生成项目文档q基于AI给出代码评审意见,辅助完成源代码评审,打破技术鸿沟产品/项目经理开发人员市场人员市场人员q用户行为分析q大量用户反馈数据处理q提取并生成高质量产品需求、改进点市场人员设计师(UI/UX)q自动生成UI原

16、型q基于原型自动生成可用的界面代码(html/CSS)组件测试人员技术支持q海量日志分析和关键信息提取q自动分析运维问题并定位到代码q根据内部知识库快速检索和响应用户问题,提高用户满意度qAI辅助结对编程q代码补全和生成q代码分析和交互式代码生成q辅助调试,安全问题监测和性能改进q基于用户故事生成测试用例、测试步骤和预期结果q从代码自动生成测试脚本q根据数据结构描述自动生成大量场景化测试数据q自动执行生成的测试自动化脚本为什么说单元测试做的好,很难为什么说单元测试是软件工程3.0 必须要解决的测试方法种类多0项目本身不具备可单测生成质量难以运行框架多难以mock无标准最佳

17、实践大模型的单元测试可行性增加示例代码感知框架0语法树找相关跨文件策略感知Mock对象生成完成可执行单测依赖文件的调用链CoT 与 智能体在开发中的价值CoT0Funtion CallReAct思维树拆解业务逻辑单元推理+行动workspace/newNotebook 调研与CoT实战1.生成需求拆解的几个子任务,通过title 和 content组装。2.在组装成子任务的数据集的时候,我们给出了组装示例,以稳定大模型的生成质量。3.根据子任务,组装成子任务所需执行的提示词列表。用于用户点击创建文件后依次执行代码文件。开放话题:未来形态是怎样?开放话

18、题:未来形态是怎样?云端云端IDE加速加速AI助手为新的载体助手为新的载体 总结 腾讯云AI代码助手04 关注与总结小结一下小结一下 下一下一个个AI时代改变了编码习惯和过程。大模型提供了在开发者赛道下产品化时代改变了编码习惯和过程。大模型提供了在开发者赛道下产品化的无数新场景,但同时也存在技术挑战,中文语料、数据安全性和隐私保护的无数新场景,但同时也存在技术挑战,中文语料、数据安全性和隐私保护等问题,也需要考虑在受限资源下多模型怎么落地运转。等问题,也需要考虑在受限资源下多模型怎么落地运转。深度探索提示工程、代码模型能力和深度探索提示工程、代码模型能力和AI应用框架是应用框架是AI产品的重要组成部分,产品的重要组成部分,它们可以帮助我们更好地定义新的软件模式。它们可以帮助我们更好地定义新的软件模式。产品开发指标会作为新的效能度量,和产品改进的手段。产品开发指标会作为新的效能度量,和产品改进的手段。3TNB是产品努力方向、是产品努力方向、3S原则是提示词准则、六大定律是发现机遇的钥匙。原则是提示词准则、六大定律是发现机遇的钥匙。对话对话+RAG、补全、补全+跨文件,有效解决了企业痛点,延伸代码和知识库的理解。跨文件,有效解决了企业痛点,延伸代码和知识库的理解。面向企业及个人的腾讯云面向企业及个人的腾讯云 AI 代码助手代码助手 https:/

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(代码大模型对于工程理解的探索研究-汪晟杰.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
会员动态
会员动态 会员动态:

 137**86... 升级为高级VIP 159**79... 升级为高级VIP 

 wei**n_...  升级为高级VIP  139**22... 升级为至尊VIP

151**96...  升级为高级VIP wei**n_... 升级为至尊VIP 

186**49... 升级为高级VIP  187**87... 升级为高级VIP

wei**n_... 升级为高级VIP  wei**n_... 升级为至尊VIP  

 sha**01... 升级为至尊VIP   wei**n_...  升级为高级VIP

139**62...  升级为标准VIP wei**n_... 升级为高级VIP 

 跟**... 升级为标准VIP 182**26... 升级为高级VIP 

wei**n_...  升级为高级VIP 136**44...   升级为高级VIP

136**89...  升级为标准VIP wei**n_...  升级为至尊VIP 

 wei**n_... 升级为至尊VIP   wei**n_... 升级为至尊VIP

  wei**n_... 升级为高级VIP wei**n_...  升级为高级VIP

177**45... 升级为至尊VIP  wei**n_... 升级为至尊VIP

wei**n_...  升级为至尊VIP   微**... 升级为标准VIP

 wei**n_... 升级为标准VIP wei**n_...  升级为标准VIP

 139**16... 升级为至尊VIP  wei**n_... 升级为标准VIP

 wei**n_...  升级为高级VIP 182**00...   升级为至尊VIP

wei**n_... 升级为高级VIP  wei**n_...  升级为高级VIP

 wei**n_... 升级为标准VIP 133**67...  升级为至尊VIP 

 wei**n_... 升级为至尊VIP  柯平 升级为高级VIP 

 shi**ey... 升级为高级VIP 153**71... 升级为至尊VIP 

 132**42... 升级为高级VIP   wei**n_... 升级为至尊VIP

178**35... 升级为至尊VIP wei**n_...  升级为高级VIP

  wei**n_... 升级为至尊VIP wei**n_...  升级为高级VIP 

wei**n_...  升级为高级VIP 133**95... 升级为高级VIP 

188**50... 升级为高级VIP  138**47...  升级为高级VIP

187**70...  升级为高级VIP  Tom**12... 升级为至尊VIP

 微**...  升级为至尊VIP wei**n_... 升级为至尊VIP 

156**93...  升级为至尊VIP wei**n_...  升级为高级VIP

 wei**n_... 升级为至尊VIP   wei**n_... 升级为标准VIP

小敏 升级为高级VIP  hak**a9...  升级为至尊VIP

185**56...  升级为高级VIP  156**93...  升级为标准VIP

 wei**n_...  升级为至尊VIP wei**n_...  升级为至尊VIP

 Br**e有...  升级为至尊VIP  wei**n_...  升级为标准VIP

 wei**n_...  升级为高级VIP wei**n_...  升级为至尊VIP 

 156**20... 升级为至尊VIP  wei**n_...  升级为至尊VIP

微**...   升级为标准VIP  135**45... 升级为标准VIP

wei**n_...  升级为至尊VIP  wei**n_...  升级为高级VIP

157**60...  升级为高级VIP 150**45... 升级为至尊VIP

wei**n_... 升级为标准VIP   wei**n_...  升级为至尊VIP

 151**80... 升级为高级VIP  135**10... 升级为标准VIP

wei**n_...  升级为高级VIP  wei**n_...  升级为高级VIP

 wei**n_... 升级为至尊VIP wei**n_... 升级为标准VIP 

 wei**n_...  升级为高级VIP wei**n_...  升级为高级VIP

 135**22...  升级为高级VIP   wei**n_... 升级为至尊VIP

181**62...  升级为至尊VIP  黑**...  升级为至尊VIP

wei**n_...  升级为至尊VIP  178**61... 升级为高级VIP

186**20...  升级为高级VIP wei**n_... 升级为标准VIP 

 wei**n_... 升级为高级VIP  wei**n_... 升级为标准VIP 

 wei**n_... 升级为至尊VIP wei**n_... 升级为标准VIP