《【2023数栖大会】陈浩-人工智能和大数据赋能法治创新(杭州会议).pdf》由会员分享,可在线阅读,更多相关《【2023数栖大会】陈浩-人工智能和大数据赋能法治创新(杭州会议).pdf(42页珍藏版)》请在三个皮匠报告上搜索。
1、让 数 据 用 起 来人工智能和大数据人工智能和大数据赋 能 法 治 创 新赋 能 法 治 创 新演 讲 者:陈 浩法意科技常务副总经理目录目录C O N T E N T S让 数 据 用 起 来人工智能和大数据在法律领域的能力人工智能和大数据在法律领域的能力01人工智能和大数据支持智慧立法人工智能和大数据支持智慧立法02法法律律科技科技企业在法治科技创新中的作用企业在法治科技创新中的作用07人工智能人工智能和大数据支持智慧司法和大数据支持智慧司法04人工智能人工智能和大数据支持智慧守法和大数据支持智慧守法05人工智能人工智能和大数据支持法学研究和大数据支持法学研究06人人工智能工智能和大和大
2、数据数据支持智慧执法支持智慧执法03让数据用起来01人工智能和大数据人工智能和大数据在法律领域的能力在法律领域的能力让 数 据 用 起 来让数据用起来人工智能和大数据在法律领域的能力人工智能和大数据在法律领域的能力 数据:信息-法律信息(文本)-法律知识(知识图谱)算法和模型:NLP技术(规则语义理解/机器学习/深度学习)-领域模型-专家系统 算力:芯片-分布式系统 三要素在法律领域的对照 对法律文本的解构能力 对法律知识的构建能力 对涉法数据之间规律的挖掘能力 面向法律问题的分析模型能力 赋能法律领域让数据用起来02人工智能和大数据人工智能和大数据支 持 智 慧 立 法支 持 智 慧 立 法
3、让 数 据 用 起 来让数据用起来人工智能和大数据支持智慧立法人工智能和大数据支持智慧立法立法辅助起草草案审查法规清理立法后评估.利用法律法规和政策文件大数据来辅助立法裁判文书对法律适用的情况裁判文书补充“其他”的常见情况.利用司法案例、执法案例大数据来辅助立法让数据用起来裁判文书对法律适用的情况裁判文书对法律适用的情况:法规实施效果评价法规实施效果评价范例范例:最高人民法院关于审理民间借贷案件最高人民法院关于审理民间借贷案件适用法律若干问题的规定适用法律若干问题的规定实施情况分析实施情况分析法律法规在颁布实施后实施效果如何?研究研究目的目的让数据用起来如何切入如何切入?哪些数据哪些数据可以体
4、现可以体现?指标指标“引用率引用率”裁判文书裁判结果中引用法律依据时间规律时间规律(裁判年月)设想设想模型设计模型设计让数据用起来各年月民间借贷案件数各年月民间借贷案件数量量各年月各年月引用引用民间借贷民间借贷规定规定案件数量案件数量各年各年月月引用率引用率=模型设计模型设计模型设计模型设计让数据用起来结果分析结果分析规定规定实施情况实施情况:引用率按月的时间趋势引用率按月的时间趋势从最高法院颁布实施到从最高法院颁布实施到区县法院进入全面稳定区县法院进入全面稳定适用历经适用历经8-98-9个月个月让数据用起来法规清理法规清理:违反上位法的法规的识别和清理违反上位法的法规的识别和清理范例范例:关
5、于地方物业管理条例限制业主共同管关于地方物业管理条例限制业主共同管理权有关规定的审查理权有关规定的审查对未按时交纳物业服务费等未履行业主义务的业主,能否直接剥夺其业主委员会参选资格?全国人大常委会法制工作委员会:未加区分地将业主未按时交纳物业服务费、专项维修资金等不履行业主义务行为与业主共同管理权挂钩,不适当地限制了业主的建筑物区分所有权,超越了立法权限,混淆了物权关系与合同关系,与中华人民共和国民法典、国务院物业管理条例的有关规定不符,应予以纠正研究研究目的目的让数据用起来模型设计模型设计让数据用起来成效输出成效输出让数据用起来03人工智能和大数据人工智能和大数据支 持 智 慧 执 法支 持
6、 智 慧 执 法让 数 据 用 起 来让数据用起来人工智能和大数据支持智慧执法人工智能和大数据支持智慧执法执法事项清单体系梳理、清理执法自由裁量权体系构建和约束执法个案 利用政策法规和人工智能技术来规范执法执法案件线索挖掘执法案件信息的采集执法文书的智能制作执法结果的类案辅助执法合规管理 利用执法案例和大数据人工智能技术来辅助执法执法大数据监督 利用执法案例+政策法规和大数据人工智能技术来辅助执法监督让数据用起来执法合规管理执法合规管理:执法案件节点上的合规和风控执法案件节点上的合规和风控范例范例:烟草执法案件中的合规风控烟草执法案件中的合规风控针对烟草执法办案中的每个环节,如何确保依法行政,
7、合规执法?研究研究目的目的让数据用起来根据烟草执法办案的立案、调查取证、审查决定、送达与执行、结案等环节梳理并形成的分阶段、分岗位、分材料的合规风控体系。提供烟草专卖执法人员、案审员、法规员等岗位执法风险预警功能,便于在烟草执法案件中进行合规风控。案卷识别将烟草执法办案的立案、调查取证、审查决定、送达与执行、结案等各个环节中涉及的不同阶段的卷宗、文书材料数据作为合规审查对象,纳入待分析数据范围。案卷解析通过文书智能分析引擎技术,对文书、卷宗的内容根据专业语言进行理解并提取为结构化数据,供合规校验使用。风险校验按照烟草执法办案的工作环节及对应文书、案卷,进行合规风控规则体系的梳理。涵盖自由裁量合
8、法性、程序时限合法性评查、拼写语法、关联文书信息比对等合规风控检查要点,从执法办案专业角度评查案卷质量。将文书、案卷的数据解析成果依照合规风控规则体系进行自动校验,输出规则的匹配结果。风险提示将风险校验的结果在对应的办案流程环节中对烟草专卖执法人员、案审员、法规员等岗位人员进行执法风险预警提示,由人工二次分析,确认触犯规则的情况是否属于风险内容。模型设计模型设计让数据用起来关联文书信息比对:系统可对同一案件产生的多个文书之间、不同程序阶段间的相关信息点的一致性进行校验,具有逻辑关系的信息项之间进行是否符合逻辑进行人工和自动校验风险提示风险提示原文错误回原文错误回溯高亮溯高亮成效输出成效输出让数
9、据用起来自由裁量合法性审查:系统可依据法律、法规、规章对自由裁量合法性的要求,综合考虑违法行为性质、情节、手段和社会危害后果等因素,对案件作出行政处罚种类、幅度的权力是否合法进行人工和自动校验。风险提示风险提示原文错误回溯高亮原文错误回溯高亮成效输出成效输出让数据用起来以罚代刑以罚代刑范例范例:烟草非法经营活动以罚代刑大数据监督烟草非法经营活动以罚代刑大数据监督对违法行为严重构成犯罪的行为应移送司法机关处置研究研究目的目的让数据用起来分析分析发现案件发现案件烟草类行政处罚决定书烟草专卖经营类活动违反刑法第二百二十五条,构成非法经营罪给与行政处罚符合关于公安机关管辖的刑事案件立案追诉标准的规定(
10、二)中的刑事案件立案追诉标准违法行为种类为倒卖国家规定的专营或者专卖物资、物品且且分析维度:案件数、刑事前科数量、曾受行政处罚数量、非法经营总额达到了追诉的数额标准,但仅进行了行政处罚;虽未达到数额标准,但达到数额标准60%以上,并具有法定受过行政处罚的前科的行为。开展大数据开展大数据分析分析分析圈定监督对象分析结果模型设计模型设计让数据用起来04人工智能和大数据人工智能和大数据支 持 智 慧 司 法支 持 智 慧 司 法让 数 据 用 起 来让 数 据 用 起 来x8智 慧 司 法裁判规则汇编类案参考和比对法律适用推荐裁判尺度统一标准管控.人工智能和大数据支持智慧司法人工智能和大数据支持智慧
11、司法让 数 据 用 起 来1 1、实现方法实现方法经验总结VS.+文本挖掘业务结构分析技术思维“解读”业务结构技术实现2 2、技术辅助技术辅助“建建”的三个实现步骤的三个实现步骤裁判规则的提炼与编撰裁判规则的提炼与编撰让 数 据 用 起 来 问题-结论-理由三元结构问题:对事实或法律问题进行了完整描述,包含和问题有关的案件要素结论:对问题的法律结论的描述理由:针对问题得出法律结论的法理分析 法律依据-裁判规则上下位阶结构对对单条裁判规则进行结构分析单条裁判规则进行结构分析 基于案件裁判思维过程的知识图谱化 事实要点-法律要点二元结构 基于类案的裁判思维过程刑事案例:罪名初选-主体-主观方面-客
12、体-客观方面-罪责民事案件:案由初选-案由初选-请求权-抗辩权-争点-事实认定-法律责任行政案件:案由初选-主体-客体-行政行为(行政主体-行政权限-行政目的-行政程序-行政证据-行政法律)-法律责任对对多条判判规则进行体系分析多条判判规则进行体系分析裁判规则的业裁判规则的业务结构分析务结构分析裁判规则的提炼与编撰裁判规则的提炼与编撰让 数 据 用 起 来 问题的结构化:问题要素化单要素问题多要素问题 结论的结构化:结论的属性描述定性结论定量结论 理由的结构化?:法律推理过程,完整文字整体结构化 问题与结论的连接:四种裁判规则单要素定性裁判规则单要素定量裁判规则多要素定性裁判规则多要素定量裁判
13、规则 每一条裁判规则在法律知识图谱体系中进行多维度标注业务结构的技术分析业务结构的技术分析裁判规则的提炼与编撰裁判规则的提炼与编撰r例子单要素定性裁判规则:父本与母本对植物新品种生产具有基本相同价值基础时是否可以直接判令双方当事人相互授权许可并相互免除相应的许可费单要素定量裁判规则:住院伙食补助费-北京-100元多要素定性裁判规则:应当从婚姻基础、婚后感情、离婚原因、夫妻关系的现状和有无和好的可能等方面综合分析夫妻感情是否确已破裂、多要素定量裁判规则:多个量刑情节组合下的量刑结果让 数 据 用 起 来裁判规则多要素定性多要素定性裁判规则裁判规则适合采用有监督类机器学习算法适合采用有监督类机器学
14、习算法:logistics logistics回归分析回归分析例子例子:判断感情是否破裂的影响因素判断感情是否破裂的影响因素发现婚姻基础发现婚姻基础、婚后感情婚后感情、离婚原因离婚原因、夫妻关系的现状和有夫妻关系的现状和有无和好的可能等方面等每个因素对是否感情破裂的影响系数无和好的可能等方面等每个因素对是否感情破裂的影响系数,发现所有影响因素综合在一起对确定感情是否破裂的决定发现所有影响因素综合在一起对确定感情是否破裂的决定系数系数这些参数综合在一起这些参数综合在一起,形成了一个辅助法官裁判是否离婚的形成了一个辅助法官裁判是否离婚的裁判规则裁判规则理由的理由的提取提取对法官基于问题的理由文字描
15、述原文进行提取对法官基于问题的理由文字描述原文进行提取对法官引用的法律依据进行提取并进行条文聚对法官引用的法律依据进行提取并进行条文聚类类,辅助提炼裁判理由辅助提炼裁判理由单要素定性单要素定性裁判规则裁判规则单变量频次分析单变量频次分析、交叉表分析交叉表分析例子例子:父本与母本对植物新品种生产具有基本相同价父本与母本对植物新品种生产具有基本相同价值基础时是否可以直接判令双方当事人相互授权许可值基础时是否可以直接判令双方当事人相互授权许可并相互免除相应的许可费并相互免除相应的许可费问题具有确定性场景下问题具有确定性场景下,通过对结论的频次分析通过对结论的频次分析,了了解其分布解其分布,提炼裁判规
16、则提炼裁判规则问题在有多种类型场景下问题在有多种类型场景下,通过交叉表分析发现不同通过交叉表分析发现不同类型场景下的裁判结论的倾向性规律类型场景下的裁判结论的倾向性规律,基于此提炼裁基于此提炼裁判规则判规则裁判规则体裁判规则体系化系化 有监督类机器学习有监督类机器学习-分类分类-基于已有框架的自动化归类基于已有框架的自动化归类 无监督类机器学习无监督类机器学习-聚类聚类-针对海量裁判规则原文数据的自动聚类针对海量裁判规则原文数据的自动聚类,并并归入到已有知识图谱中归入到已有知识图谱中多要素定量多要素定量裁判规则裁判规则适合采用有监督类机器学习算法适合采用有监督类机器学习算法:多元线性回归多元线
17、性回归例子例子:交通肇事罪量刑标准交通肇事罪量刑标准发现每个量刑情节对量刑结果的影响系数发现每个量刑情节对量刑结果的影响系数,发现所发现所有量刑情节综合在一起对量刑结果影响的决定系数有量刑情节综合在一起对量刑结果影响的决定系数这些参数综合在一起这些参数综合在一起,形成了一个辅助法官量刑的形成了一个辅助法官量刑的裁判规则裁判规则(在北京高院量刑实施细则基础上在北京高院量刑实施细则基础上)单要素定量单要素定量裁判规则裁判规则单变量的统计描述分析单变量的统计描述分析例子例子:判断某一项赔偿费用标准判断某一项赔偿费用标准展示最大值展示最大值、最小值最小值、平均值平均值、中位值中位值、出现出现频率最高值
18、等频率最高值等算法模型算法模型裁判规则的提炼与编撰裁判规则的提炼与编撰让 数 据 用 起 来应用实例应用实例裁判规则内容不事先设定内容内容指标指标最高法院公开裁判文书中的提取率81.2%,提准率85%全国各级法院公开裁判文书中提取率25%,提准率75%,针对800多万裁判文书有效提取了150多万条裁判规则原文裁判规则体系归类完整率75%,准确率90%裁判规则的提炼与编撰裁判规则的提炼与编撰让数据用起来05人工智能和大数据人工智能和大数据支 持 智 慧 守 法支 持 智 慧 守 法让 数 据 用 起 来让 数 据 用 起 来人工智能和大数据支持智慧守法人工智能和大数据支持智慧守法1企业合规2公共
19、法律服务让 数 据 用 起 来交易合规监督交易合规监督范例范例:通过合同大数据碰撞发现违规风险通过合同大数据碰撞发现违规风险研究目的研究目的集团公司中各级子公司的采购是否存在违规现象?让 数 据 用 起 来智能解析:采购标的、规格、采购数量、单价、供货方、采购时间等要素合同筛选合同筛选分析目的:发现异常价格交易价格均衡碰撞价格均衡碰撞筛选条件-采购标的、规格、采购时间合同库模型设计模型设计让 数 据 用 起 来成效输出成效输出2022年采购联想(Lenovo)启天M435商用办公台式电脑单价分布散点图散点图中明显分散在高位的单价,可能存在廉政问题散点图中明显分散在低位的单价,可能存在商品质量问
20、题让数据用起来06人工智能和大数据人工智能和大数据支 持 法 学 研 究支 持 法 学 研 究让 数 据 用 起 来让 数 据 用 起 来人工智能和大数据支持法学研究人工智能和大数据支持法学研究定性研究定性研究定量研究定量研究让 数 据 用 起 来法律领域的因果关系定量研究法律领域的因果关系定量研究范例范例:基于法官集体经验的量刑预测研究基于法官集体经验的量刑预测研究研究目的研究目的影响交通肇事量刑的法定情节和酌定情节是清晰的,其他影响因素在量刑理论上也是边界明确的,但具体化则需要进一步观察每个情节在量刑影响的显著性、方向、程度则需要通过研究来论证。让 数 据 用 起 来模型设计模型设计自首立
21、功赔偿损失逃逸.有期徒刑刑期对影响量刑的情节拆解与提取 研究方法对量刑结果的解析与提取多元线性回归模型引入让 数 据 用 起 来成效输出成效输出交通肇事罪量刑规则研究回归确定系数回归确定系数 R R平方平方各个自变量的标准化回归系数各个自变量的标准化回归系数实际刑期与预测刑期的残差实际刑期与预测刑期的残差回归确定系数 平方:0734,表述当前模型在样本范围内的解释力达到73.4%让 数 据 用 起 来成效输出成效输出各个自变量的标准化回归系数让数据用起来07法律科技企业在法治法律科技企业在法治科 技 创 新 中 的 作 用科 技 创 新 中 的 作 用让 数 据 用 起 来让 数 据 用 起 来法律科技企业在法治科技创新中的作用法律科技企业在法治科技创新中的作用 问题引领 模型研究 要素体系搭建 产业落地让 数 据 用 起 来感谢聆听,敬请指导!演 讲 者:陈 浩 法 意 科 技 有 限 公 司 常 务 副 总 经 理