《vivo 一站式 AI 智能体构建平台演进实践-张硕.pdf》由会员分享,可在线阅读,更多相关《vivo 一站式 AI 智能体构建平台演进实践-张硕.pdf(35页珍藏版)》请在三个皮匠报告上搜索。
1、vivo一站式AI智能体平台的演进实践vivo互联网产品平台架构团队负责人/张硕行业PPT模板http:/ B行业PPT模板http:/ 系统间集成通信、数据管理、非结构化文本解析、测试度量、运营管理等等能力如何解决?l不舒适区:不舒适区:整体技术生态处于发展早期,发展早期,不确定性高,有较高试错成本,需要大量不确定性高,有较高试错成本,需要大量的学习探的学习探索。如何高效带领团队达成目标?l资源依赖:资源依赖:算力日渐昂贵,使用量级增长还要不停追加算力投入。ROIROI如何保障?如何保障?l业务应用:业务应用:对生成式人工智能的期望过高,有需求但是不知道如何高ROI应用。如如何助力各个业务创
2、造可量化的价值?何助力各个业务创造可量化的价值?把一类诉求抽象归纳、系统化,满足一系列需求,并持续沉淀为资产,能够对各部门、对公司持续提供稳定服务。平台化演进降低技术难度、减少沟通成本、屏蔽使用复杂度,配套较完备的在线业务使用能力。一站式开箱即用基于平台构建各个方向垂类bots应用,管理数据集,并对这些应用进行迭代运营垂类私域数据挑战为什么为什么?“照我做的做”效果会好于“照我说的做”才能领跑赋能,带团队指明方向、解决难题、带团队指明方向、解决难题、扫除障碍,承担使命与压力扫除障碍,承担使命与压力,最终拿到结果。面对挑战,求责于己,身教胜于言传及时反馈,及时say YesNO团队避免务虚,聚焦
3、创造价值本身。增效降本思考思考&学习学习明确方向竞品调研roadmap大量学习大量学习(60+60+论文、论文、国内外竞品分析、国内外竞品分析、开源技术方案开源技术方案)功能点检、体验交互复杂测试方案体验体验&测试测试核心方案技术评审疑难攻关技术实现技术实现业务落地接入交流合作接入接入&合作合作蓝心九问蓝心九问创造性、突破式场景,躬身入局、以身作则是务实领导力的关键公司我做了什么我做了什么?领跑,深入关键环节,决策才能及时、有效新的起点,如何带领团队高效学习,敏捷落地?技术方案technicaltechnicaltechnicaltechnicalT T行业PPT模板http:/ or Ret
4、rieval?Comparing Knowledge Injection in LLMs https:/arxiv.org/abs/2312.05934RAG VS FINE-TUNING:PIPELINES,TRADEOFFS,AND A CASE STUDY ON AGRICULTURE https:/arxiv.org/pdf/2401.08406技术选择 RAG vs SFT?类别RAGRAGSFTSFT外部知识源改变模型行为减少幻觉训练数据集动态数据更新可解释性以RAG为主的技术路线RAGRAG的演进的演进 N Naiveaive RAGRAGRetrieval-Augmented
5、Generation for Large Language Models:A Survey https:/arxiv.org/abs/2312.10997幻觉明显减少,回答更加可靠为不同领域提供专业的知识支持,保证信息的及时性、有效性可解释,可追溯问题并迭代改善安全性和隐私管理方面,实现了数据的权限控制、安全管理等NaiveNaive RAGRAG 荆棘丛生荆棘丛生040302011、Unstructured IO 2、表格+图片解析 3、语意+规则 Chunk1、混合检索(Sparse+Dense)2、Auto Merge Retrieval 3、Query transformation(R
6、ewrite)Retrieval准确率提升1、RAG Evaluation 2、Retrieval 过程可视化1、图文并茂输出 2、参考文档来源展示 3、幻觉控制RAGRAG的演进的演进 AdvancedAdvanced RAGRAG Fine-grained Data Clean Query Transfmation HyDE Q2Q、Q2P Hybrid Search+Rerank Small2BigRAGRAG的演进的演进 AdvancedAdvanced RAGRAGFine-grained Data CleanUnStructured DataQuery TransfmationHy
7、DEQ2QHybrid Search+RerankSmall2BigMetadatafilterPrecise Zero-Shot Dense Retrieval without Relevance LabelLarge Language Models are Strong Zero-Shot RetrieverGenerative and Pseudo-Relevant Feedback for Sparse,Dense and Learned Sparse RetrievalGRM:Generative Relevance Modeling Using Relevance-Aware Sa
8、mple Estimation for Document RetrievalChunkingChunking 递归分割:通过分治的方法,用递归切分到最小单元的一种方式;特殊分割:还有很多不常见的,用于特殊场景,这里就不提了。X Flip 产品颜色菱紫,绸金,钻黑物理规格高度:166.42mm(展开)86.40mm(折叠)宽度:75.25mm厚度:菱紫:8.19mm(展开)、17.56(折叠)钻黑:7.75mm(展开)、16.62(折叠)绸金:7.84mm(展开)、16.80(折叠)重量:菱紫、钻黑:198g 绸金:199g上市价格全网通(V2256A):(12GB+256GB):5999.00
9、元(12GB+512GB):6699.00元固定大小固定大小+常见符号常见符号的分块方式的分块方式简单意图的分块方式(句分割简单意图的分块方式(句分割 递归分割)递归分割)“天气很好,我们一起”|“去郊外游玩”必要语境词语遗失,如chunk示意图ChunkingChunking 基于元素的分割基于元素的分割 结构化处理结构化处理 按结构合并按结构合并 新增新增chunkchunk规则(超规则(超tokentoken或者某元素变动)或者某元素变动)主动合并过小主动合并过小chunkchunk,多合一,多合一hybrid searchhybrid search+metadata+metadata
10、filterfilter 混合检索混合检索 metadatametadata来源:如url、文件名、组织、上传人类型:tag、fileType、作者日期:年月日语义检索的局限性语义检索的局限性如:对拼写错误、同义词和措辞差异不太敏感。精确的、短小内容匹配搜索机型、名称、缩写短语(例如 vivoX100 pro、SWTO、蓝心LLM-pro-1.0)效果显著不同数据集类型提升明显hybrid searchhybrid search+metadata+metadata filterfilter高质量块的查询百分比Small to Big RetrievalSmall to Big Retrieva
11、lSmall to Big RetrievalSmall to Big RetrievalRAGRAG EvaluationEvaluation从人工到自动化从人工到自动化检索和生成模块Benchmarking Large Language Models in Retrieval-Augmented Generationhttps:/arxiv.org/pdf/2309.01431.pdfRAGAS:Automated Evaluation of Retrieval Augmented Generationhttps:/arxiv.org/pdf/2309.15217三元组相互牵制问题:viv
12、o的总部在哪里?它的主要是做什么的?答案A:vivo 总部位于广东省东莞市。(low Relevance)答案B:vivo 总部位于广东省东莞市,它是一家全球领先的智能终端和智能服务提 供商(high Relevance)上下文相关性(Context Relevance)答案真实性(Answer Faithfulness)答案相关性(Answer Relevance)ground_truths(GPT4 Q2A)上下文召回(context Recall)上下文精准度(Context Precision)答案正确性(Answer Correctness)RAGRAG EvaluationEval
13、uation从人工到自动化从人工到自动化1.问答对生成2.自动化运行3.效果评估分析RAGRAG还不够还不够AgentAgentRAGRAG聚焦聚焦“知识的精确性相关问题知识的精确性相关问题”比如:“对比下A、B两个项目的人员数量?”“近6年某部门人力投入变化,柱状图表示出来”(复杂)AgentAgent方式方式任务拆解,按顺序排列执行,Agent分头执行等(独立与LLM交互,执行工具、RAG等等)比如:“请给我总结下有关xxx的文章核心内容”(topk?)AgentAgent 概述概述代理(代理(AgentAgent)这个词来源于拉丁语“agere”,意为“行动”。各个领域能够独立思考和行动
14、的概念。感知环境,自主采取行动以实现目标,并可以通过学习或获取知识来提高其性能。PreceptionPreceptionContext 听觉、视觉等知觉BrainBrainknowledgereasoning 记忆、决策ActionAction(基于知觉、决策的反应)output txtimage(Tools)具身化The rise and potential of large language model based agents:A survey.arXiv preprint arXiv:2309.07864.lilianweng.github.io/posts/2023-06-23-ag
15、ent组件化理解任务拆分:把一个复杂的问题分解成更小的问题任务拆分:把一个复杂的问题分解成更小的问题工具使用:选择要使用的外部工具工具使用:选择要使用的外部工具 +提出调用工具的参数提出调用工具的参数计划:计划出一组任务计划:计划出一组任务存储:存储以前完成的任务相关信息存储:存储以前完成的任务相关信息自动化从日常任务、重复劳动中解脱出来,减轻工作压力,提高效率。半自主性规避人工低级指令,一定程度的自主分析、规划、达成目标创造性具备足够自主性,思考规划能力,自主完成创新性的、探索性的复杂工作AgentAgent 演进方向演进方向业务应用类 业务系统工具 OA流程类 devOps工具内容生成类
16、热点新闻 文本翻译常用工具类 Google搜索 OCROCR文本识别文本识别 数学工具生产力工具 办公日程 短链工具图片视频 图片理解 AI绘画 抠图工具插件集市-我的插件-插件-工具-API或函数AgentAgent ToolsTools 节点元素:大模型 代码执行器 知识库 选择器 插件 工作流AgentAgent WorkflowWorkflow 四种模式:ReflectionReflection Tool UseTool Use PlanningPlanning Multiagent Multiagent CollaborationCollaboration将复杂任务分解为一组简单Agent,Agent之间通过消息的方式进行通信AgentAgent MultipleMultiple AgentsAgents应用落地应用落地CRM聊天总结(800+人天)应用落地应用落地测试报告总结(600+人天)应用落地应用落地硬件指令生成等(1000+人天)应用落地应用落地知识客服场景(200+Bots)