上海品茶

您的当前位置:上海品茶 > 报告分类 > PDF报告下载

2019年大数据心建设的再认识.pdf

编号:98069 PDF 20页 881.06KB 下载积分:VIP专享
下载报告请您先登录!

2019年大数据心建设的再认识.pdf

1、CHIMA 2019(一)建设什么样的大数据中心 大数据利用是个性化的数据研究服务,简单例子:数据检索:化疗后白细胞数下降的患者30天内二次住院的患者 数据分析:65岁以上老年人患两种以上疾病的排名前三的共病组合老年下肢关节手术麻醉方式与术后肺部感染的相关性 大数据中心的职责是服务,与传统的信息中心有所不同信息中心大数据中心信息系统建设与运维数据服务大数据应用系统CHIMA 2019之一:数据管理中心 职责 数据采集、整合 数据存储管理 数据访问授权 工作平台 数据整合平台(ETL)数据检索系统 数据浏览系统 数据在线使用(虚拟桌面)所需人才 IT工程师数据存储数据检索数据浏览虚拟桌面数据整合

2、平台数据管理授权提取CHIMA 2019之二:数据加工中心 职责 根据用户需求,从原始数据加工生成特征数据 工作平台 自然语言处理工具 专病数据库平台 组学等专业数据处理平台 SQL 所需人才 IT工程师原始数据结构化处理、SQL、组学数据平台特征数据特征数据特征数据专病数据库平台CHIMA 2019之三:数据分析中心 职责 为用户提供数据分析服务 工作平台 各类建模工具 数据可视化工具 深度学习平台 所需人才 IT工程师 数据分析工程师数据存储SAS、SPSS、R、深度学习人工服务CHIMA 2019大数据中心的职能定位 大数据中心的三种职能定位数据管理数据加工数据分析全功能的大数据中心+C

3、HIMA 2019(一)建设什么样的大数据中心观点认识:“大数据中心”是数据服务中心而不是系统建设中心,“服务”有不同的内涵,不同的职能定位对应不同的技术平台与人才团队建设内容。在提出建设大数据中心规划时,首先要明确大数据中心的职能定位。CHIMA 2019(二)数据是否要做整体预处理数据整合结构化归一化清洗后数据分析数据整合原始数据分析结构化结构化归一化归一化分析分析VS整体预处理针对应用的预处理大数据中心数据处理的两种流程数据治理可以一次性完成吗?CHIMA 2019(二)数据是否要做整体预处理 信息的损失 病历文本结构化的结果不能完整表达原病历文本的语义 标准化(归一化)可能导致特定信息

4、丢失,如药品名称转换:诺欣、铂龙、顺铂顺铂 技术上的困难 历史数据的不一致,如疾病编码 ICD-9与ICD-10由于编码原则可能不同导致转换难以自动对照完成 整体结构化的困难,如不同病种的病历文本有不同的特点,目前尚难以做到泛病种的结构化处理CHIMA 2019(二)数据是否要做整体预处理 病历结构化不能完整反映文本语义,如症状之间的顺序关系CHIMA 2019(二)数据是否要做整体预处理 如,判断不同肿瘤分期的结构化处理方法不同肺癌N分期判定胃癌N分期判定N0:无区域淋巴结转移N1:同侧支气管或肺门淋巴结转移N2:同侧纵隔和/隆突下淋巴结转移N0:无区域淋巴结转移N1:区域淋巴结转移12个N

5、2:区域淋巴结转移36个N3:区域淋巴结转移715个N4:区域淋巴结转移16个以上格式:阳性个数/送检个数CHIMA 2019(二)数据是否要做整体预处理观点认识:在大数据中心数据资源建设中,预先将数据整体进行预处理的过程会带来信息丢失,技术上也存在较大困难,一次性的数据治理难以满足数据后续利用需求。采用“数据湖”概念,保留数据的原始性,针对特定研究问题开展数据预处理是更好的选择。CHIMA 2019(三)临床数据研究的两种路径 专病数据库路径:按病种设置特征,建立数据模型,预先整理加工 随机特征提取路径:按照研究问题抽取和处理特征,在分析时进行原始数据建立专病库抽取数据/特征提取选择特征数据

6、分析预先分析时分析时建立科研病种数据库是临床数据研究的必然选择吗?CHIMA 2019科研数据库的局限性 泛研究目的的科研病种数据库 以收集准备病种数据为目的,用以支持本病种不同目的的研究 数据库涉及数据项多,结构复杂,人工加工工作量巨大,持续难度大 针对问题分析时需要二次加工 难以满足所有研究需求 例:糖尿病视网膜病变专病数据库(片段)是否是否接受过降糖治疗、降糖治疗类型、胰岛素注射、目前规律口服降糖药、一年内服用降糖药物接受过降糖治疗、降糖治疗类型、胰岛素注射、目前规律口服降糖药、一年内服用降糖药物或注射胰岛素;或注射胰岛素;磺脲类促泌剂是否使用、磺脲类促泌剂药物剂量磺脲类促泌剂是否使用、

7、磺脲类促泌剂药物剂量、开始、开始日期日期、服用、服用时程(月);时程(月);非磺脲类促泌剂是否使用、非磺脲类促泌剂药物剂量非磺脲类促泌剂是否使用、非磺脲类促泌剂药物剂量、开始、开始日期日期、服用、服用时程(月);时程(月);双胍类是否使用、双胍类名称双胍类是否使用、双胍类名称、剂量、开始、剂量、开始日期日期、服用、服用时程(月);时程(月);糖苷酶抑制剂是否使用、糖苷酶抑制剂名称糖苷酶抑制剂是否使用、糖苷酶抑制剂名称、剂量、开始、剂量、开始日期日期、服用、服用时程(月);时程(月);噻唑烷二类酮是否使用、噻唑烷二类酮名称噻唑烷二类酮是否使用、噻唑烷二类酮名称、剂量、开始、剂量、开始日期日期、服

8、用、服用时程(月);时程(月);目前目前是否是否规律使用胰岛素、普通规律使用胰岛素、普通胰岛素名称胰岛素名称、剂量、开始、剂量、开始日期日期、服用、服用时长(月)时长(月);长效胰岛素是否使用、长效胰岛素名称长效胰岛素是否使用、长效胰岛素名称、剂量、开始、剂量、开始日期日期、服用、服用时长(月)时长(月)是否降血压药物、服用降血压药物种类数量是否降血压药物、服用降血压药物种类数量、开始、开始日期日期、服用、服用时长(月)、目前规律服用降血压时长(月)、目前规律服用降血压药物;药物;钙离子拮抗剂降压药是否使用钙离子拮抗剂降压药是否使用、药物药物名称、剂量、开始名称、剂量、开始日期日期、服用、服用

9、时长(月);时长(月);受体阻滞剂降压药是否使用受体阻滞剂降压药是否使用、药物药物名称、剂量、开始日期、服用时长(月名称、剂量、开始日期、服用时长(月););血管扩张药是否使用血管扩张药是否使用、药物药物名称、剂量、开始日期、服用时长(月)名称、剂量、开始日期、服用时长(月);AngAng受体阻滞剂是否使用受体阻滞剂是否使用、药物药物名称、剂量、开始日期、服用时长(月)名称、剂量、开始日期、服用时长(月);CHIMA 2019科研数据库的局限性 单一研究目的的科研病种数据库 以特定问题为导向收集病种数据 数据库涉及数据少,人工加工工作量小 难以满足特定问题以外的研究需求 例:肺癌患者生存研究数

10、据库性别、年龄、吸烟史、是否戒烟、家族史、性别、年龄、吸烟史、是否戒烟、家族史、ABOABO血型、血型、RhDRhD血型、基础疾病、合并症、病理类型、血型、基础疾病、合并症、病理类型、分化程度、基因检测方法、基因突变状态、分化程度、基因检测方法、基因突变状态、PDPD-L1L1(阳性(阳性/阴性)、阴性)、MMR/MSIMMR/MSI、TNMGTNMG分期、手术、分期、手术、辅助治疗(化疗、放疗)、一线治疗、疗效评估、副反应、辅助治疗(化疗、放疗)、一线治疗、疗效评估、副反应、PFSPFS、二线治疗、二线治疗、生存状态、随访、生存状态、随访时间、总生存时间、最后一次随访时间、是否存活、是否复发

11、时间、总生存时间、最后一次随访时间、是否存活、是否复发/进展、复发进展、复发/进展位置、复发进展位置、复发/进进展时间展时间CHIMA 2019(三)临床数据研究的两种路径观点认识:通过建立专病数据库和直接基于原始数据库开展临床数据研究是大数据中心两种数据研究路径。依托专病数据库的路径有较大的局限性。在现实研究实践中,特别是在回顾性研究中,更多地采用直接依托原始数据的方式。CHIMA 2019(四)对医疗大数据平台的认识 面向一线临床研究人员的需求 数据检索与浏览系统 科研专病数据库管理系统 多中心数据采集系统 数理统计工具 院后随访系统 深度学习数据标注工具问题:医疗大数据平台是什么?是一体

12、化的产品吗?技术形态是什么?面向数据处理分析人员的需求 数据处理工具SQL、ETL工具 自然语言处理及结构化工具 去隐私工具 各类建模工具:R、Matlab、SAS、SPSS 可视化分析工具 深度学习平台 组学数据处理分析平台功能形态CHIMA 2019(四)对医疗大数据平台的认识 数据形态 数据检索:列数据库(结构化数据),文本分布式索引(病历文本)数据处理:传统关系数据库 数据分析:传统关系数据库 专病系统:传统关系数据库/XML 多重数据存在 针对不同的用途,数据以适宜的多种形态存在 源数据+多个不同形态拷贝 数据管理技术选择要考虑生态避免生搬硬套数据资源库列数据库RDBRDBXML检索处理分析专病CHIMA 2019(四)对医疗大数据平台的认识观点认识:医疗大数据平台是一个多种技术形态并存、多样化功能协作的异构系统。CHIMA 2019CHIMA 2019

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(2019年大数据心建设的再认识.pdf)为本站 (云闲) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
会员购买
客服

专属顾问

商务合作

机构入驻、侵权投诉、商务合作

服务号

三个皮匠报告官方公众号

回到顶部