上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

海之翼-周旭辉-chatKnowHow:大模型和企业专门数据结合进行知识管理的案例.pdf

编号:155740 PDF 31页 2.51MB 下载积分:VIP专享
下载报告请您先登录!

海之翼-周旭辉-chatKnowHow:大模型和企业专门数据结合进行知识管理的案例.pdf

1、chatKnowHow:大模型与行业知识案例 周旭辉 北京海之翼科技 创始人&CEO 个人简介 周旭辉 北京海之翼科技 创始人&CEO 人生发财靠康波:3波机会 互联网:百度大数据用户画像;金融、汽车 投资:15倍辉,西二旗马斯克 AIGC:ALL IN,正在赶 正在做3件事情 HaiGPT:大模型基座 chatKnowHow:大模型行业数据中间层 chatStock:大模型应用-投资助手 基本情况 AI算法专家,目前ALL IN大模型方向 曾任百度车联网首席架构师、腾讯T12 国际顶会IJCAI2019 论文,专利10+件 目录 01 内容概述 02 3个案例 03 技术实现 04 总结 听

2、众收益 大模型 应用案例 3个案例 商业价值 新方式 PDF、Word、Excel 如何通过chat的方式 获取想要的答案 关键技术 3种技术选型 细节打磨优化 内容概述 专门知识、诀窍 KnowHow 文档、数据库 机密性 搜索 传统方式 文档网盘 搜索 知识图谱 存在问题 知识不易获取 成本高 知识孤立 数据安全 Chat助手 思路 智能提示 目录 01 内容概述 02 3个案例 03 技术实现 04 总结 案例一:汽车使用说明书智能助手场景 某汽车品牌说明书-503页 某新能源汽车说明书-1268页 案例一:汽车使用说明书智能助手痛点 太长了,很少看 打电话给客服 客服65%的问题都是说

3、明书 案例一:汽车使用说明书智能助手数据与挑战 数据来源 说明书 客户问题历史库 挑战 语义理解:仪表盘有个人背个大宝剑是怎么回事?安全带指示灯亮了 案例一:汽车使用说明书智能助手解决思路 说明书 历史客户问题 大模型技术 APP,客服机器人 智能说明书 目录 01 内容概述 02 3个案例 03 技术实现 04 总结 3种技术方案 大模型技术 基座模型+ptuning等微调 资源消耗尚可 效果难控制 胡说八道(幻觉)技术方案 特点 Pretrain+全量SFT/指令学习 资源消耗大 效果有保证 对Pretrain要求高 不方便小调整 Embeddings,langChain 资源消耗小 效果

4、有保证 方便做后续控制 技术实现 初版 技术实现 改进版 内容融合 文本转向量模型 答案生成与优化 最终答案 结果修正 数据获取适配 PDF EXCEL PPT TXT DB 智能文档分割 段落分割 内容总结 超长处理 引用位置 位置去重 位置合并 链接添加 应用使用 流量控制 多轮对话 流式接口 人工标注 迭代优化 内容向量 基座模型适配 Attr权限域 向量数据库 深度平均网络编码器 问题向量 问题推荐 embeddings 语义检索 召回排序 权限过滤 敏感过滤 排序算法 向量召回 向量数据库 向量距离计算 工作原理 向量数据库 Faiss:是一个用于高效相似性搜索和密集向量聚类的开源库

5、 Elasticsearch:knn search底层其实使用的是HNSW PostgreSQL:可通过扩展 pgvector 实现一些简单的向量计算 Redis:可通过一些扩展模块,如RedisAI和RediSearch,实现一定程度的向量数据处理和计算功能 向量数据库 向量检索算法 基于树(Kdtree、Annoy)基于图(NSW、HNSW)基于量化(SQ、PQ)倒排索引 问题推荐 句向量 k获取技巧tokens/per 座椅问题 空调问题 车内娱乐问题 其他问题 信息增益加权 聚类计算 tf-idf,左右信息熵计算 怎么调节前排座椅?后排怎么放倒?怎么使用视频投屏?推荐问题生成 产品技术

6、架构 效果示例 社会价值 生产一吨纸需要3立方米木材 每本书按0.5公斤,1000本书=1.5棵树 每年有多少辆车?2000万 1.5*2000万/1000 3万棵树 案例二:智能销售助手 案例二:智能销售助手示例 案例三:质量防火墙 项目背景 某汽车品牌漏油事件发酵 查找系统发现2个月前就有反馈 客户意图理解的能力,颠覆 案例三:质量防火墙 数据 调研 车联网数据 E-call 保修 数据 懂车帝 汽车 之家 论坛 抱怨 投诉 数据 400客服数据 汽车质量官网 线上 线下 主动 被动 公域 私域 客户之声客户之声 案例三:质量防火墙 产品示例 目录 01 内容概述 02 3个案例 03 技

7、术实现 04 总结 总结&下一步展望 3个实际的案例,非常大的商业价值 Embeddings技术是个非常好的方向 图片、远程读取、Auto 交个朋友,Q&A Q&A 欢迎大模型项目合作 附录一 Step1Step1 收集演示数据并训练监督策略。收集演示数据并训练监督策略。从提示数据集中采样提示内容 标记器演示所需的输出行为 通过监督学习行为的数据对GPT-3.5进行调整 Step 2Step 2 收集比较数据并训练奖励模型。收集比较数据并训练奖励模型。采集一个提示和多个模型输出 贴标机将最佳到最差进行排名并输出 这些数据用于训练奖励模式 Step 3Step 3 使用使用 PPO 强化学习算法针对强化学习算法针对奖励奖励模型优化策略模型优化策略。从数据集中采样新提示 通过受监督策略对PPO 模型进行初始化 生成策略并输出 奖励模型计算需要输出的奖励 奖励用于使用 PPO 更新策略 我们通过给与奖励和惩罚来训练 写一个关于水獭的故事 很久以前.向6岁的孩子解释强化学习 向6岁的孩子解释强化学习 A A B B C C D D D D C C A A B B PPO RM SFT RM 附录二:DAN深度平均网络编码器

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(海之翼-周旭辉-chatKnowHow:大模型和企业专门数据结合进行知识管理的案例.pdf)为本站 (张5G) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部