数字时代检察案例库的建设路径研究在这个大数据、机器学习、自然语言处理等人工智能技术蓬勃发展的时代,建设检察案例库是适应时代需求、推动数字检察改革中的重要举措。检察案例库是指供全国检察人员学习、检索、应用指导性案例、典型案例等,为检察人员提升能力素质、为检察办案提供智能辅助的检察业务数据资源库。然而,在检察案例库的前期试点背景下,也存在一些不容忽视的问题。当前司法案例的生成、应用与司法经验的积累呈现孤立静止的状态,司法案例的各个环节没有完全打通;司法案例的培育、编纂没有完全契合办案需求;司法案例依赖传统的人工收集整理,欠缺智能化应用;司法案例的循环与积累不够充分,没有使司法案例蕴含的经验同立法规范、司法解释一道成为执法办案的规范资源,也没有激发更多的司法案例产生。不得不承认,多重因素导致司法案例的应用远未达到高层和学界的预期。这些问题已经成为中国法治化进程的一大阻力,以大数据等人工智能技术建设符合中国实践的检察案例库已经迫在眉睫。一、检察案例库的数据来源、生成与更新没有高质量的司法案例做支撑,检察案例库就是无源之水、无本之木。我国统一的法律体系决定了检察案例库的数据来源必须包括各级有权主体办理、发布的司法案例,以及民间主体发掘研究的有价值的案例。广泛的数据来源能够兼顾检察案例库的权威性和可用性。司法案例在成文法体系中占有重要地位,其生成机理至少应包含遴选、推荐、编纂、发布、汇编和清理等环节,根据编纂主体的不同分为中央司法机关、地方司法机关、社会主体三类,相应的创制流程也由严格逐渐趋向宽松。各级主体应当提供更多优质的司法案例供给,更好地发挥司法案例统一法律适用标准、提高办案质量的价值。(一)多层次的供给体系提供数据来源检察案例库的体系建构应当注重类型化建设。鉴于中央司法机关的权威性和广泛的影响力,应当以中央司法机关发布的指导性案例、典型案例、公报案例、审判参考案例等为第一层级;以地方司法机关发布的案例为第二层级,如*市人民检察院不定期发布的检委会通报案例、*市第一中级人民法院编写的案例精选;以民间主体如学者、律师、司法官等个人或者高校、企业、律所等组织撰写的个案分析、案例汇编、案例解读等有关案例的文章或者著作构成司法案例体系的第三层级。组成中央与地方、司法机关与民间主体共同参与的体系鲜明、体例多样、功能各异的三类司法案例体系。当前,司法实践中各类主体自发运用判例比附待决案件的现象越来越普遍,但三类司法案例数量总体较少,无法满足方方面面的办案需求。理想的状态应当是三类司法案例形成金字塔结构,指导性案例数量最少但效力最高、意义重大;典型案例、公报案例、审判参考案例等数量较多,应及时回应社会热点以及传达刑事政策;地方司法机关发布的各类参考性案例数量应该最多,主要指导本辖区的司法工作;民间主体应积极撰写案例分析、案例解读与案例汇编等文章、著作。三类主体之间应加强联系,构建内外联动的案例研究格局,与司法机关共同创造一个案例法治的时代。(二)司法案例大数据的生成机制司法案例大数据的生成机制是指遴选、推荐与编写海量司法案例的程序和制度。生成机制应符合案例制度创立的初衷,解决法律法规、司法解释不能满足办案需求,导致法律适用标准不统一的问题。关于各级司法案例的遴选标准,理论上多数意见是具有普遍适用意义的法律解释或规则创制内容的案例,这种观点基本上符合案例指导制度的价值取向。指导性案例效力高、适用范围广,应当选取具有重大社会影响、重要指导意义的案例,其他层级应当选取具有一定指导、参照意义的案例,同时兼顾案例种类的全面性。地方司法机关应着重选取发布对本辖区具有指导意义的案例,以及没有被上级机关选取的优秀案例。民间主体应着重选取具有一定社会影响性的案例,以案件为基础,对法律规范和法学理论进行深入分析,填补法律规范的应然价值与实际效果之间的漏洞。司法案例的推荐机制是指案例的征集过程。当前各级案例的推荐机制较为单一,主要是司法机关内部自下而上的推荐方式,这种方式的好处在于经过层层把关后选出的司法案例具有较强的权威性和指导性,但是由于数量有限,也容易埋没一些新颖、疑难复杂的案例。因此,在保持内部推荐机制的前提下,各级司法机关应及时依法向社会公开发布具有参考价值的案例,供民间主体开展案例研究分析。同时,各类主体可以利用数字化、智能化的案例应用平台上传司法案例,供使用者阅读、评论、分享,自动筛选出高质量、高价值的热点司法案例。司法案例的编写一般是指从生效判决等已决案件中筛选出符合实质条件的案件,按照一定的格式如关键词、裁判要点或要旨、基本案情、裁判结果、裁判理由或检察履职过程、指导意义、相关法条等部分进行编辑加工,从案件材料中提取法律适用规则、裁判方法等内容,进行简明扼要的分析和总结,并融入一定的法律政策,形成一个指导性、参考性案例。其中裁判要点或要旨集中体现了司法机关的释法目标追求,不仅是司法机关借助具体案例整合出的表达司法规范的新形式,也是“司法案例的灵魂所在”。在编写案例时需要仔细斟酌、准确表达。最高人民法院、最高人民检察院(以下简称“两高”)的指导性案例体例较为成熟,编写其他司法案例时可以参考该体例,但在论述裁判理由、指导意义、检察履职过程等内容时应当更加详细,以免造成理解上的偏差。同时,在编纂司法案例的时候应该对案例同步解析、提取关键词和规则,为建设数字化、智能化的检察案例库做好准备。在内部使用的时候还可以附上分歧的观点和最后采纳的观点,更好地契合办案需求。在建设检察案例库过程中,也可以通过反馈机制吸收使用者的意见和建议,不断修改完善,甚至借鉴百度百科、维基百科的模式允许使用者参与编辑司法案例。(三)司法案例大数据的更新机制司法案例大数据的更新机制是指海量司法案例的发布、汇编、清理的程序和制度。其中发布涉及两个方面的问题:一是发布主体,二是发布平台。发布主体是将经过遴选、编写的司法案例对内、对外公布,并赋予其在管辖范围内产生一定指导、参考价值的主体。与司法案例的体系相对应,指导性案例、典型案例、公报案例、审判参考案例的发布主体是中央司法机关即“两高”;地方性参考案例的发布主体是地方各级司法机关;案例分析、解读、汇编的发布主体是民间个人或者组织。发布主体不同意味着案例的效力不同,指导性案例的效力层级最高,典型案例、公报案例、审判参考案例等“两高”发布的其他案例效力次之,下级司法机关应该遵循上级机关发布的案例,民间主体发布的案例仅具有学理上的探讨价值和意义。发布平台是司法案例得以呈现的载体,目前“两高”的指导性案例均按照发布顺序公布在官网的固定版面,而典型案例、公报案例等没有固定的展示页面,杂乱且不完整地分布在“两高”的官网上;审判参考案例采取的是集结出版的方式,没有在网络上公开发布;地方司法机关发布的案例也存在未公开发布、断更的现象;民间主体的发布平台主要是发表学术论文、著作,或者在公众号、官网等平台发布。针对以上问题,“两高”和地方省级司法机关应当在各自的官网上设立专门的司法案例版面,按照民事、刑事、行政、公益诉讼及执行等分类,定期或者不定期发布司法案例,并且在各自的微信公众号等移动平台同步更新。与此同时,各级司法主体在发布司法案例的时候应当向“两高”备案提取过关键词和规则的案例,以便于组建全国性的案例数据库。至于民间主体则应百花齐放,充分运用信息化技术发布司法案例,发挥案例对社会公众的引导价值和正面影响力。法律汇编是实现法的系统化的重要途径,也是法律公布的重要手段。英美法系认为判例汇编制度是判例法的形成与运行的基础之一,其法官、律师援引的判例几乎都是汇编于各种判例集上的判例。随着司法案例数量的增加,汇编各级司法案例甚至与培育司法案例本身同样重要。试想,当各级案例规模越来越大,该如何准确找到类似案例、如何准确援引类似案例、对同一案例的援引不一致时该如何选择?对此,一方面,建议各级发布主体在保留新闻发布会、网络发布的同时,定期汇编本级主体发布的司法案例;另一方面,建议“两高”将各级主体备案的司法案例分类、分层上传到检察案例库,为智能检索类案积累大数据资源。此外,由于法律法规、司法解释不断更新,案例不再适应社会生活发展的需要,或者因再审而改判等原因,司法案例一定会出现失效的问题,各级发布主体应及时公告清理失去效力的案例,并报送“两高”在司法案例库中及时标注更新,如可以借鉴*法宝对于法律法规效力的提示标签,在检察案例库中对司法案例的有效性进行提示,如现行有效、全国有效、区域有效、无效等。二、检察案例库的数字化智能化建设实践检察案例库的数字化智能化建设的目的就是借助人工智能来提升案例的运用效率,直至和法律职业者一样执行法律推理、法律解释、法律论证和法律预测等智能任务。当下人工智能发展水平达不到法律职业者的高度,但是可以通过案例解析、大数据分析等人工智能技术提高类案检索的准确性、赋能司法案例的检索与应用,打通案例供给与使用的桥梁和纽带。(一)人工智能时代案例解析的逻辑案例智能化运用的第一步是建立完整、动态的经过解析的底层数据库。以*市人民检察院组织建设的司法案例智能检索系统为例,该系统以案由、主题、核心字段、法律规则为要素架构类案检索的标签维度,对司法案例进行了解析标注。实际上,案例解析就是对案例进行编辑、加工,将案例的全部内容转化为计算机可以识别、处理的数据集合,为类案检索系统构建全文数据库,以便于将关键词、起诉意见书、审查报告等法律文书与案例数据库进行比对,寻找具有较高匹配度的类案的过程,从而提高案例检索效率,促进法律的统一公正实施。司法案例具有指导司法机关进行司法认定、程序确认、法律适用等功能,根据发挥的功能不同,将司法案例蕴含的规则或原则划分为不同的类型,在提取关键词及规则、原则时各有侧重,从而完成案例的深度解析和数据准备,为类案强制检索做好前提工作,这是案例解析与智能化应用的可行进路。近年来,随着人工智能、大数据、云计算技术的发展,世界各国对于案例当中蕴含规则的提炼也开始了机器学习的尝试。例如,美国*已获得一项专利技术,该技术可以通过机器学习算法解析进而提取案例的结构和规则。其基本原理是通过算法解析区分案例中的相关段落是否包含事实、法律讨论或两者兼无或兼而有之。因为包含法律讨论的段落通常提出法律规则句子或要求;而事实段落通常提供证据、基于证据的推理、证据因素或基于证据的发现;将法律讨论适用于事实的段落通常为有争议的法律规则要求和法律规则提供基于证据发现的法律决定或法律裁决。需要指出的是,通过机器学习方法从案例文本中提取与论证相关信息的前提是对一定数量的训练案例进行高质量的注解、解析。考虑到司法案例庞大的数量,要实现通过机器学习对案例进行解析并提取相关的论证、观点或规则,必须先将一定数量的经过人工解析的训练案例“投喂”给人工智能。此外,解析还要求有足够的质量,否则如果解析的内容模糊、不恰当,那么机器学习程序也将无法学习如何对案例进行深入解构。从这个意义上讲,当前阶段,解析者的可靠性、解析的质量决定了人工智能技术所能达到的上限。(二)类案识别的方法与智能化运用建立了完整、动态的经过解析的底层数据库以后,搜索关键词一般会得到案例群,如何在这个案例群中找到可以参照的类案则是整个系统的关键所在。因此,将可能的类案与待决案件之间进行相似性判断,就好比法官将自己手上的案件的色彩与摊在他们桌上的许多样品案件的色彩进行对比,色彩最接近的样品案件提供了可以适用的规则。法学界对案件相似性的判断有较大争议,一是“构成要件类似说”,主张以构成要件之比较作为相似性的框架基础;二是“实质一致说”,主张相似性之认定应视系争法律规定之法定案型与待决案件事实之间是否具有实质一致性;三是“同一思想基础说”,若二者具有同一利益状态,即可认定二者具有相似性。最高人民法院则认为类案是与待决案件在基本事实、争议焦点、法律适用问题等方面具有相似性,且已经是人民法院裁判生效的案件。在人工智能深入发展的背景下,在对底层案例数据库完成解析后,使用者可以输入单个或多个关键词,或者直接上传待决案件的基本案情、审查报告等材料,由人工智能计算待查案件与在库案例的关键词匹配程度,按照匹配度高低向使用