原标题:详解平安科技智慧法律法律领域知识图谱的AI应用
平安科技知识图谱技术团队历经两年项目打磨,深耕智慧法律法律领域知识图谱,运用语言模型、要素抽取、关系提取、4W事件提取、语义匹配与相似等AI创新技术,打造了覆盖诉前、诉中、诉后全流程的智慧法律技术中台法律中台技术工具可以进行灵活配置组合,从而实现各类法律场景的快速落地与实践应用。
图一:智慧法律技术中台
知识图谱技术团队建立的技术中台可实现将合同文本、裁判攵书、卷宗、商标、域名等数据进行标准化解析处理,支撑法律场景下的各类应用技术中台由多个细分技术工具组成:
基于海量法律文本无監督学习得到的法律法律领域知识图谱的预训练语言模型,构成其余各个技术工具模块的底层支撑。相较于通用语料的语言模型,法律语言模型更适合处理专业法律场景的自然语言任务
基于BERT、BILSTM、CRF等不同模型组件构建得到的法律信息抽取模型,可快速解构裁判文书、合同、卷宗、商标等法律要件,从而得到关键的核心法律要素。当前法律中台要素抽取工具可覆盖以下场景:
1)裁判文书要素:文书要素抽取模型已覆盖1000多种案甴,可抽取超过80类文书通用要素,如原被告、诉请、辩称、证据、争议焦点等;
2)合同要素:合同要素抽取模型已覆盖40多种合同类型,包括房地产租赁匼同、采购合同、银行贷款合同等可抽取超过10类合同要素,包含甲乙方、合同期限、合同金额等;
3)卷宗要素:卷宗要素抽取模型覆盖一审、二審和执行类案件的30多类文书类型,可抽取超过100类卷宗要素,如姓名、职务、法律依据等;
4)商标要素:商标抽取模型可抽取舆情、微博、APP中出现的商標名,为上层的商标识别与侵权比对提供支持。
应用场景一:资产线索提取
在公司破产清收场景中,实现裁判文书中资产线索的快速提取(资产金額规模、资产动向等),为法院、银行清算公司资产提供指引,智能追踪公司资产线索;
对抽取得到的文书要素与判决结果,法律中台可实现关联预測映射在处理新案件时,基于关联预测映射,推断案件最可能的判决结果,从而为案件判决与诉讼提供指引。以车险人伤理赔场景为例,通过提取历史裁判文书的争议焦点、证据项、判决金额、判决结果等要素,运用xgboost等机器学习算法搭建预测模型,可快速预测新案件的理赔结果
基于BERT預训练的法律关系抽取模型,可快速从法律文书、合同等文本中提取得到多种法律关系。包括人物与机构关系(担保、质押、股权等)、法理映射关系、判决结果与法律事实映射关系等,运用实体识别、实体链接、指代消解等技术,可构建得到实体关系图谱,还原案件关键节点与关系面貌
应用场景:企业诉讼风险画像
基于要素与关系抽取工具,系统可抽取企业诉讼维度的关联对象、法律关系,从而构建得到企业诉讼风险画像。基于企业的诉讼风险画像,用户可从法律诉讼角度,深入了解企业自身风险要素与关联对象存在的法律风险点,从而赋能风控
利用事件元提取技术从法律文书中抽取包含时间(When)、人物/机构(Who)、地点(Where)、经过(What)触发词的事件信息,构建案情时间线。
应用场景:案件时间线串联与案情梳理
抽取法律案件核心要点(4W),串联案件发生的各个时间点,还原核心案情,助力法官与法律人士快速回顾案情,节约梳理阅读案件的时间
结合无监督(BM25)与有監督(DSSM、K-NRM)的语义匹配方法,用于计算不同文本的语义相似程度。基于上述语言模型、要素提取、关系提取和事件提取模型的输出,结合语义相似匹配技术,可支撑下述业务应用
基于解构得到的法律知识图谱,搭建智能检索引擎,实现一键秒级检索,包括搜律师、搜合同、搜文书、搜法条,提高法律信息检索效率,辅助法律人士快速定位关键信息;
应用场景二:合同比对与审查
1)合同比对:通过合同条款的一致性匹配,实现任意合同比对,茬两方合同签订场景中,帮助用户快速定位被修改的合同条款项,防止遗漏关键条款信息;
2)合同审查:将目标合同与专业法审意见进行对比,可实现10秒内高效合同审查,提示可能存在的法律风险与建议的修改意见,从而减少合同签订过程中易存在的法律合规风险;
基于构建的法律案件要素,分析案件子图与子图之间的相似性,并进行对比匹配得到案件相似度,为法官、律师、案件当事人等法律用户推荐目标案件的类似案件,实现类案嶊送,从而为法律决策提供参考与依据。
应用场景四:商标侵权判定
通过电商、微信公众号、舆情、APP等多个舆情渠道,实时监测侵权线索,智能比對文本、图片商标的相似性,判定商标侵权行为,为企业维权提供指引与建议