今天是:
当前位置: 首页 > 法学园地
大数据背景下的司法统计分析——以台州法院司法统计分析工作为样本

大数据背景下的司法统计分析

                   ——以台州法院司法统计分析工作为样本

吴谦

 

 

2011年,麦肯锡全球研究院发布研究报告称“大数据时代已经到来”;2012年,《“十二五”国家战略性新兴产业发展规划》明确“加强以海量数据处理软件等为代表的基础软件的开发”2014年“大数据”首入中国《政府工作报告》。大数据成为时代不可逆转的洪流与趋势,意味着数据规模指数级的增长,更意味着对数据更为细致立体的分类、归纳、处理和分析。

应用于司法领域,大数据使司法实践活动每一环节中最细微的图像、文字、信息数据被立体采集分析成为可能,势必对通过大量统计数据来探寻司法实践活动现状、问题、本质和规律的调查研究活动——司法统计分析产生巨大影响。当前,充分利用、深度挖掘司法信息数据资源,做实做好司法统计分析工作是人民法院抢抓历史机遇、发展大数据战略的一项重要研究课题。

一、理论溯源:契合与应用

(一)大数据的内涵及特征

根据百度百科,大数据(big data,mega data),或称巨量资料,指的是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的实质是在数据传输、收集、储存的基础上,对数据的分析挖掘,并由此获得凭直觉难以发现的有用信息,从而揭示数据隐藏的历史规律和未来的发展趋势,为决策提供参考。

业界认为大数据具有“4V特点:Volume,数据量极大并仍在持续增大;Velocity,所需的处理速度快,实效性要求高;Variety,数据类型繁多,包括结构化数据、半结构化数据甚至是非结构化数据;Value,价值密度低,需要先进的挖掘、“提纯”技术才能实现大数据的巨大价值。

(二)司法统计分析的概念和特点

司法统计分析是根据统计学的原理和方法,运用大量统计数据来反映、研究和分析审判及司法实践活动的现状、成因、本质和规律,并作出结论,提出解决问题办法的一种统计应用文体。

司法统计分析通常具备三个基本特点:一是数据性。司法统计分析要从数据入手,用数据反映情况和问题,运用数字语言(包括统计图和统计表)描述审判现象、原因、规律,提出对策建议。二是实用性。司法统计分析不但包含大量审判信息,而且能够揭示审判规律,进行趋势预测,为领导决策提供科学依据,具有广泛的实用性。三是时效性。由于司法统计的分析对象大多是一定时期的案件数据或指标,这些信息反映的问题通常具有很强的时效性,如果不及时转化,它的实践价值将随着时间的推移而降低。

(三)大数据下的司法统计分析

大数据的“4V特点决定了大数据独特的应用方式:追求全部、整体数据而不是局部、精准数据;追求数据的相关关系而不是因果关系;追求数据的联动、无穷组合和创新而不是让数据休眠;追求数据生产者与数据应用者的互动而不是仅仅数据提供和输出等等。顺应大数据的时代潮流,司法统计分析应当以大量而全面的可量化分析的数据为对象,以依托信息化技术的多样化的数据分析方法为工具,通过对数据的整理、分析和提炼,达到从看似无关的海量数据中寻找有价值的信息的目的。

二、实证考量:机遇与挑战

近年来,浙江法院认真贯彻最高人民法院“科技强院”战略部署,全面构建了网络全互联、业务广覆盖、数据大集中、资源共享用的浙江法院信息化体系。浙江法院信息化体系,实际上就是一个大数据平台,如何从中分离出隐含的、潜在的、有用的、能够反映出司法活动特点和审判规律的信息,成为司法统计分析工作的重要任务

(一)机遇:浙江法院信息化建设为司法统计分析提供数据基础和科技支撑

2008年,浙江高院着手建立全省法院审判执行案件数据信息中心。案件立案、审判、执行及案卷归档、移送等工作流程环节全部纳入全省统一的管理系统,各个办案节点的相关数据得以实时录入,每日定时经由中级法院的数据分中心汇集到省高院数据中心,实现了对各级法院审判执行工作的全面、动态和实时监控,并确保每月上报至最高法院的统计报表数据均从数据中心自动采集,即时生成。

2010年,浙江高院创新海量数据挖掘分析机制依托全省法院数据中心,结合数据仓库和数据挖掘技术,开发了“审判执行案件信息结构化数据分析系统”(简称审判执行分析系统),并在案件裁判文书等非结构化数据分析挖掘领域取得新突破,建立起各种类型司法统计分析需要的数学统计模型,把孤立的案件联系起来,获得各种视角的统计分析结果,如可分别按法院、条线、案由、时间节点、结案方式、当事人信息等不同维度进行专题分析,用具体的数据呈现审判执行的运行状况和趋势,反映案件审判所折射的经济社会发展中出现的新情况、新问题,为大数据的“海量分析”作出了探索和尝试在2013年第五届长三角地区人民法院司法协作和发展论坛上,浙江高院通过审判执行分析系统中“离婚纠纷”主题分析模块,运行规模庞大的相关数据,得出“55岁是离婚诉讼神奇分割线”的结论,让在场的人叹为观止。

(二)挑战:台州法院司法统计分析工作的历史弊病和现实困境

在大数据的时代背景下,浙江法院的信息化建设水平蒸蒸日上,但台州法院的司法统计分析工作却没有跟上脚步,多重因素制约和影响了这项工作的发展。

一是基础数据薄弱。司法统计分析的源泉在于数据的收集,尤其是各类审判执行信息的录入和提取,否则之后的汇总、分析、利用都必然是无源之水、无本之木。虽然浙江高院从技术层面保障数据之间逻辑关系准确、从制度层面完善数据录入规定、从管理层面畅通数据差错反馈渠道,促使案件信息录入质量明显提高。但在司法实践中,数据的准确性和及时性还难以尽如人意,错报、漏报、迟报现象时有发生,“信息表不空、法综表能平”的填报思想仍未杜绝,导致有些重要司法信息未被采集、部分司法信息采集较为笼统、数据断层孤立现象屡见不鲜,造成司法统计分析基础不牢。

二是分析方法单一。司法统计分析的实质在于解读司法统计数据,探究审判活动的真相及其原因。从认识对象本身的客观逻辑来看,对象越离散、越多样化、越表现出显著的异质性,就越需要发达的统计手段才有可能把握其中的规律。而在法律世界中,从法条到案件,从实体到程序,从民事到刑事,从原告到被告,都表现出巨大的差异性和不确定性。所以,法律世界的共性和规律也需要科学的量化分析手段才能准确把握。目前的司法统计分析大都还停留在数量统计和描述性分析上,不能运用科学先进的统计学分析方法,如相关分析法、回归分析法、预测分析法等,不能满足大数据由单一分析向复合型分析转变的要求。

三是专业人才匮乏。从事综合性、技术性、专业性较强的工作,司法统计人员应当是具备统计学、法学、计算机、写作知识四位一体的复合型人才。然而,各法院统计队伍势单力薄,有些法院将年纪较大、退居二线的干警安排为统计人员,由于精力有限,他们一般较难承受繁重的司法统计工作;有些法院安排新进干警为兼职统计人员,他们身兼多职,时间不能得到充分保障;有些法院统计人员变动频繁,导致司法统计工作失去连贯性,常规的报表质量都难以保证。而且,司法统计人员普遍职业认同感缺失,真正基于兴趣而从事这项工作的人很少,人心思走,能够适应大数据应用、实现由数据统计向数据专家转变的人才十分稀缺。

四是分析能力不强。目前各基层法院司法统计分析的撰写以单兵作战的居多,组成课题组的较少。由于司法统计数据的采集、整理、分析均由一人完成,不仅工作量大,还容易产生工作思路禁锢、分析角度单一等问题,不利于全方位分析提炼统计数据。在内容上,分析报告对司法统计中的数据分析不够具体深入,不够有前瞻性和创新性,大致呈现出“四多四少”的特点:综合分析多,专题分析少;事后分析多,趋势分析少;重复分析多,创新分析少;纵向比较分析多,横向比较分析少。

五是应用意识淡薄。由于领导重视,近几年来各法院的信息化建设已经取得了重大进展,但重建设轻应用现象仍然突出。浙江高院牵头开发建设的许多系统并没有得到充分利用,这固然存在培训、推广不够到位的因素,但根本原因在于广大干警的信息化意识较为淡薄,主动向科技要司法效率和司法能力的观念尚未深入人心。目前,绝大多数审判人员仅仅停留在自觉录入审判信息系统的节点信息,能熟练应用办案助手、智能评查、统一检索等数据平台的不多,至于利用审判执行分析系统实现对审执数据的综合提取并用于司法统计分析的更是凤毛麟角。

三、路径选择:构建与拓展

党的十八大以来,我国法治建设进入了新的历史发展时期,特别是十八届三中全会全面深化改革做出了重大战略部署,也明确了司法体制改革的具体目标和任务。

面对新形势,人民法院保障国家安全服务经济发展维护社会和谐稳定的任务更加艰巨,自身改革发展的任务也更加紧迫。一方面需要通过大量审判数据的收集整理,对当前及今后工作做出客观描述和预判分析,更好地发挥司法审判职能,服务党的中心工作和国家发展大局另一方面,也需要通过周密调研和科学论证,不断推出改革措施,努力实现自身的科学发展。这些都为司法统计分析工作提供了广阔的用武之地和发展空间,加强司法统计分析工作成为应有之义

一要树立三种理念。最高人民法院周强院长在2013年8月召开的全国法院第四次司法统计工作会议上指出司法统计是人民法院一项基础性、全局性、战略性工作,新时期要树立“大数据”、“大格局”、“大服务”的司法统计新理念同样为司法统计分析工作提出了新的目标和要求。首先要树立“大数据”理念,全面采集、系统整合、深度挖掘司法信息资源,改变重定性轻定量、重观点轻数据的传统思维模式,做到用数据说话,用数据管理,用数据决策,用数据创新。其次要树立“大格局”理念,围绕司法统计分析的功能定位,实现司法统计分析与审判执行、调研信息、审判管理、队伍建设工作的有机结合,推进全面、全员、全程统计分析,形成以审判支持统计分析、以统计分析促进审判的良性互动局面,实现司法统计信息互通共享。最后要树立“大服务”理念,服务是司法统计分析的本质要求,要不断拓宽服务领域,既服务决策管理,服务法官办案使司法统计分析成为人民法院的信息咨询、决策辅助管理服务中心真正成为法院沟通社会、法官了解社会、社会理解司法的窗口和桥梁。

二要完善二项机制。一方面,为了适应大数据时代司法统计分析的需要,人民法院必须优化司法统计分析人才选拔培养机制。首先,要设置有利条件吸引高素质复合型人才参与司法统计分析工作,根据数据采集、汇总、分析、管理对知识、学历、性格等的不同层次要求,选择任用不同人才。其次,应着力于法院内部现有司法统计分析人才的培养,根据知识结构的现状进行针对性的能力提升,打造复合型人才。可尝试建立司法统计分析联络员组成课题组的制度,针对统计人员掌握大量案件数据和统计方法、办案法官具有丰富审判实践经验、调研骨干拥有深厚法律理论和文字功底的特点,着力组织协调,使三类人员优势互补、形成合力,切实提升司法统计分析质量。另一方面,要高度重视健全司法统计分析能力培养机制。通过召开司法统计数据解读会、审判运行态势分析会和举办写作技能培训等形式,从分析的方法、角度、格式、敏感度等方面,大力强化司法统计分析能力,真正做到数字实、时间快、内容精、分析深、判断准、建议活,有效增强司法决策的科学性和实效性。要围绕审判工作反映的新问题、新情况、新动向选题,认真核对、审查、评估基础统计资料,可应用案例法、观察法、分类比较法等方法准确透彻地研究、归纳、汇总、加工数据,抽丝剥茧地找出司法工作的规律和本质,并提出具体、合理、切实可行的对策建议,形成完整的、反映全局的、具有较强综合性的司法统计分析。同时,要积极拓宽司法统计分析成果转化渠道,不断加强与政府机关、高校、律师事务所等相关部门的交流与沟通,充分利用学术讨论会、研讨会、会议交流、法律宣传等平台,促成司法统计分析成果转化,并努力打造司法统计分析品牌,形成规模效应,实现良性循环。

三要依托一个平台。审判执行分析系统具有强大的数据分析功能,在数据录入完整的前提下,通过设置过滤条件,可按照审判人员个性化的需求来提取任意类型案件信息进行综合分析。这种分析模式涉及的数据量更大,涵盖的内容更广泛,获得的结论更深入。因此,熟练运用审判执行分析系统应成为司法统计分析人员必须掌握的一项基本技能。《2015年全省法院信息化工作规划》提出,采用云计算等技术,充分利用司法资源库,建立案件审理实证分析模型,探寻审判执行工作的特点和规律,为法官办案提供参考比对信息,促进法律适用的统一。借助审判执行分析系统,通过构建系统化的“探索→描述→解释”的司法统计分析基本模型,可以实现科学地运用“数”挖掘其中的“理”。第一阶段,在粗略地观察研究总体或现象特征的基础上,解决特定研究领域的司法统计分析能否构建系统化模型的问题,并提出理论上的系统化命题的初步假设。其研究目的是开发系统化命题的研究领域,发展后续研究中需要使用的方法,并确定该命题下的相关变量。第二阶段,通过精确地测量研究总体或现象的特征,完善系统化命题中变量的数理化描述。其研究目的是依据资料分析客观归纳一系列的现实问题或者描述理论的系列实践样态。即从实证研究的角度极大丰富系统化命题在特定研究领域中的变量及相互关系的数量特征,使之具有较高的现实意义。第三阶段,细致地探讨研究现象各层面之间的关系,通过对系统化命题假设的证立或证伪,完成理论对现象的诠释。其研究目的是梳理和修正特定研究领域系统化命题的变量及相互关系,完成该研究领域司法统计分析模型的系统化构建,使之成为能够较好解释现象、推断未知的实证分析工具。

作为对客观世界的记录,数据的价值在于应用。“九层之台,起于垒土”,在大数据的时代背景下,人民法院更要倚重信息化技术,充分开发、深度挖掘司法资源库里宝贵的司法资源,把加工已有的信息资源和开发新的信息资源相结合,把统计过去与预测未来相结合,把开发纵向信息资源和开发横向信息资源相结合,形成有理有据的司法统计分析,充分释放司法信息蕴含的社情民意信息、社会治安信息、经济发展信息,为科学决策和管理提供可选择的咨询建议和对策方案。

                           作者单位:台州市中级人民法院

版权所有:台州市中级人民法院 浙ICP备06050081号
地址:台州市市府大道399号 邮编:318000  访问量:50253468

浙公网安备 33100202000535号