海之翼-周旭辉-chatKnowHow：大模型和企业专门数据结合进行知识管理的案例.pdf

编号：155740

PDF 31页 2.51MB 下载积分：VIP专享

下载报告请您先登录！

海之翼-周旭辉-chatKnowHow：大模型和企业专门数据结合进行知识管理的案例.pdf

1、chatKnowHow:大模型与行业知识案例周旭辉北京海之翼科技创始人&CEO 个人简介周旭辉北京海之翼科技创始人&CEO 人生发财靠康波：3波机会互联网：百度大数据用户画像；金融、汽车投资：15倍辉，西二旗马斯克 AIGC：ALL IN，正在赶正在做3件事情 HaiGPT：大模型基座 chatKnowHow：大模型行业数据中间层 chatStock：大模型应用-投资助手基本情况 AI算法专家，目前ALL IN大模型方向曾任百度车联网首席架构师、腾讯T12 国际顶会IJCAI2019 论文，专利10+件目录 01 内容概述 02 3个案例 03 技术实现 04 总结听

2、众收益大模型应用案例 3个案例商业价值新方式 PDF、Word、Excel 如何通过chat的方式获取想要的答案关键技术 3种技术选型细节打磨优化内容概述专门知识、诀窍 KnowHow 文档、数据库机密性搜索传统方式文档网盘搜索知识图谱存在问题知识不易获取成本高知识孤立数据安全 Chat助手思路智能提示目录 01 内容概述 02 3个案例 03 技术实现 04 总结案例一：汽车使用说明书智能助手场景某汽车品牌说明书-503页某新能源汽车说明书-1268页案例一：汽车使用说明书智能助手痛点太长了，很少看打电话给客服客服65%的问题都是说

3、明书案例一：汽车使用说明书智能助手数据与挑战数据来源说明书客户问题历史库挑战语义理解：仪表盘有个人背个大宝剑是怎么回事？安全带指示灯亮了案例一：汽车使用说明书智能助手解决思路说明书历史客户问题大模型技术 APP，客服机器人智能说明书目录 01 内容概述 02 3个案例 03 技术实现 04 总结 3种技术方案大模型技术基座模型+ptuning等微调资源消耗尚可效果难控制胡说八道（幻觉）技术方案特点 Pretrain+全量SFT/指令学习资源消耗大效果有保证对Pretrain要求高不方便小调整 Embeddings，langChain 资源消耗小效果

4、有保证方便做后续控制技术实现初版技术实现改进版内容融合文本转向量模型答案生成与优化最终答案结果修正数据获取适配 PDF EXCEL PPT TXT DB 智能文档分割段落分割内容总结超长处理引用位置位置去重位置合并链接添加应用使用流量控制多轮对话流式接口人工标注迭代优化内容向量基座模型适配 Attr权限域向量数据库深度平均网络编码器问题向量问题推荐 embeddings 语义检索召回排序权限过滤敏感过滤排序算法向量召回向量数据库向量距离计算工作原理向量数据库 Faiss：是一个用于高效相似性搜索和密集向量聚类的开源库

5、 Elasticsearch：knn search底层其实使用的是HNSW PostgreSQL：可通过扩展 pgvector 实现一些简单的向量计算 Redis：可通过一些扩展模块，如RedisAI和RediSearch，实现一定程度的向量数据处理和计算功能向量数据库向量检索算法基于树(Kdtree、Annoy)基于图（NSW、HNSW）基于量化（SQ、PQ）倒排索引问题推荐句向量 k获取技巧tokens/per 座椅问题空调问题车内娱乐问题其他问题信息增益加权聚类计算 tf-idf，左右信息熵计算怎么调节前排座椅？后排怎么放倒？怎么使用视频投屏？推荐问题生成产品技术

6、架构效果示例社会价值生产一吨纸需要3立方米木材每本书按0.5公斤，1000本书=1.5棵树每年有多少辆车？2000万 1.5*2000万/1000 3万棵树案例二：智能销售助手案例二：智能销售助手示例案例三：质量防火墙项目背景某汽车品牌漏油事件发酵查找系统发现2个月前就有反馈客户意图理解的能力，颠覆案例三：质量防火墙数据调研车联网数据 E-call 保修数据懂车帝汽车之家论坛抱怨投诉数据 400客服数据汽车质量官网线上线下主动被动公域私域客户之声客户之声案例三：质量防火墙产品示例目录 01 内容概述 02 3个案例 03 技

7、术实现 04 总结总结&下一步展望 3个实际的案例，非常大的商业价值 Embeddings技术是个非常好的方向图片、远程读取、Auto 交个朋友，Q&A Q&A 欢迎大模型项目合作附录一 Step1Step1 收集演示数据并训练监督策略。收集演示数据并训练监督策略。从提示数据集中采样提示内容标记器演示所需的输出行为通过监督学习行为的数据对GPT-3.5进行调整 Step 2Step 2 收集比较数据并训练奖励模型。收集比较数据并训练奖励模型。采集一个提示和多个模型输出贴标机将最佳到最差进行排名并输出这些数据用于训练奖励模式 Step 3Step 3 使用使用 PPO 强化学习算法针对强化学习算法针对奖励奖励模型优化策略模型优化策略。从数据集中采样新提示通过受监督策略对PPO 模型进行初始化生成策略并输出奖励模型计算需要输出的奖励奖励用于使用 PPO 更新策略我们通过给与奖励和惩罚来训练写一个关于水獭的故事很久以前.向6岁的孩子解释强化学习向6岁的孩子解释强化学习 A A B B C C D D D D C C A A B B PPO RM SFT RM 附录二：DAN深度平均网络编码器

友情提示

1、下载报告失败解决办法
2、PDF文件下载后，可能会被浏览器默认打开，此种情况可以点击浏览器菜单，保存网页到桌面，就可以正常下载了。
3、本站不支持迅雷下载，请使用电脑自带的IE浏览器，或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩，下载后原文更清晰。

本文（海之翼-周旭辉-chatKnowHow：大模型和企业专门数据结合进行知识管理的案例.pdf）为本站（张5G）主动上传，三个皮匠报告文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即通知三个皮匠报告文库（点击联系客服），我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。