《朱少民-AIGC时代软件研发组织如何构建AI战略?.pdf》由会员分享,可在线阅读,更多相关《朱少民-AIGC时代软件研发组织如何构建AI战略?.pdf(35页珍藏版)》请在三个皮匠报告上搜索。
1、AIGC时代,软件研发组织如何构建AI战略?主讲人:朱少民演讲嘉宾介绍朱少民“软件工程3.0”定义者、CCF质量工程SIG主席 CCF质量工程SIG主席 软件绿色联盟标准评测组组长 30+年一直从事软件测试、质量管理等工作,先后获得多项省、部级科技进步奖 出版了二十多部著作和4本译作,代表作主要有软件测试方法和技术、全程软件测试、敏捷测试等 曾任思科(中国)软件有限公司QA资深总监、IEEE ICST2019工业论坛主席、IEEE多个国际学术会议的程序委员、软件学报审稿人等。人们对于AI的重视程度并不够,AI还是被低估了。从长远角度来看,它与火、电以及书写对人类产生的影响不相上下,具有变革的力
2、量。凯文凯利ChatGPT一发布就抓住了人们的想象力,像iPhone推出时一样,使其能够非常迅速地扩展。这意味着AI的解锁时刻已经到来,而且比我们过去所看到的更为激烈 Eric Sheridan 微软将GPT技术融入每一个产品之中成为企业战略要素微软 将AI 视为这个时代的决定性技术并计划将AI和GPT应用于一切领域软件研发组织重构AI战略三部曲先易后难、循序渐进研发组织构建AI战略的第一步改变对AI认知、重新定位AI过去,AI辅助编程Visual Studio CodeJetBrains Resharper例如代码分析、类型检查、函数名称/代码行补全过去,AI只解决自动化测试中的一些点优化遍
3、历算法今天,借助LLM生成、评审和重构代码推断(生成)自然语言代码代码大模型精调/微调Fine-TuningGitHub 开源代码真实项目的代码编程竞赛题目代码数据基础大模型今天,借助LLM生成测试用例、脚本从X+AI 转为 AI+X:AI成为核心从企业运行系统的支撑工具转化为数字化业务系统的核心技术计算机技术企业业务运行信息化计算机技术企业业务运行数字化AI技术企业业务运行智能化软件工程进入3.0时代“传统软件工程”“现代软件工程”软件产生了新形态:SaaM,软件开发有了新的范式AI+X在研发中体现:AI驱动开发模型驱动开发、模型驱动运维MLDevOps未来会有更多的:AI原生开发 一切皆为
4、上下文:技术上下文、业务上下文 AI原生架构:如将服务分解为小型单元,建立稀疏关系 支持提示工程,如提示知识共享、协同提问等 AI可读的文档:如Markdown等格式旨在表示结构化信息 AI可读的命名规则:使用类似于自然语言的变量表达式、描述性名称 创建上下文字典:有必要在相邻的选项卡中只打开适当数量的相关文件 https:/www.ai-native.dev/docs/研发组织构建AI战略的第二步引入LLM重构现有工具、平台并加大对数据的投入首先我们要构建大模型的能力 从头开始训练一个自定义模型(难度最高),如使用Hugging Face和其他开源工具的资源训练出金融大模型Bloomberg
5、GPT 微调一个基础模型(难度中等),通过进一步的专有或特定领域数据的额外训练来更新预训练模型的权重 使用预先训练好的模型并检索相关背景(难度最低),通过收集数据将其转化为嵌入,将其存储在一个矢量数据库中,当查询发生时,搜索这些嵌入数据以获得最相关的背景,并将其提供给模型 直接使用第三方的LLM API(没有难度,只要花钱,但有安全风险)优先引入/开发LLM编程/测试助手其次,引入/开发LLM BA/Ops助手再引入/开发LLM调度/任务管理工具LLM作为一个控制器,连接众多AI模型,管理和组织这些模型,如计划、选择模型、任务分配等详见:2303.17580.pdf(arxiv.org)最终长
6、出基于LLM的工程平台大模型自我反思任务分解思维链:逐步思考、拆解任务思维树:搜索多种推理可能性扩LLM性能ReAct fromAutoGPTReflexionChain of HindsightAlgotithm Distillation任务规划最大内积搜索MIPS记忆类型短期记忆长期记忆显式/陈述性记忆内隐/程序记忆记忆HuggingGPTTestPilotGitHub CopilotMRKL架构CoDesigner工具使用InsightPilot形成基于LLM应用的E2E框架数据源层(Data Source layer)数据工程层(Data Engineering layer)大模型层(
7、LLMs layer)应用层(Application layer)数据是AI、LLM的命脉,整个组织的AI战略需要关注数据的质量。随着AI成为核心、规模化,管理、维护和利用数据变得越来越重要加大对数据的投入业务知识数据源层行业动态信息需求文档设计文档代码缺陷报告测试件运行日志数据可以为训练(微调)模型服务,也可以采用embedding方式,收集数据将其存储在一个矢量数据库中,当查询发生时,搜索这些嵌入数据以获得最相关的背景,并将其提供给模型。数据源层是LLM应用基础数据工程层体现了数据治理能力 数据清洗 标记化 词干提取和词形还原 特征提取 提示工程(只是一个示例)研发组织构建AI战略的第三步
8、组织与流程优化 组织需要优化,团队规模缩小 组织可分解为更多、更小的特战队 多数角色都在,但Junior岗位基本可以消除 招聘一些高端的AI专业人才组织重构人始终是决定的因素,需要高度重视组织重构和人才培养一键发布一键配置技术支持助手客户服务助手大模型测试助手编程助手UI设计助手架构咨询BA助手AIOps全栈式工程师、多面手更有价值团队更小但更能打胜战全功能的特性团队小团队能搞定大项目角色基本没变化,但每个人更强大AI超级队员和人类不同角色协同工作助手伙伴从主导从主主软件工程师人类与大模型协同工作,产生远大于1+1的效能构建新的平台加强它们的协作软件工程师Prompt engineering您的组织,也可以什么都不做因为多数企业十年后将不复存在了如果想活下来,就搭乘下一趟航班THANKS