Overton, M., Larson, S., Carlson, L. J., & Kleinschmit, S. (2022). Public data primacy: the changing landscape of public service delivery as big data gets bigger. Global Public Policy and Governance, 1-19, doi:10.1007/s43508-022-00052-z


公共数据优先:随着大数据发展而变化的公共服务提供格局

导语

“大数据”的增长正从根本上改变公共服务的提供。为了解数据增长对公共组织的影响,作者引入了公共数据优先(Public Data Primacy, 以下简称PDP)理论框架,该框架基于有关数据、技术及其在公共部门中的使用有关的四个命题,认为随着数据不断“变大”,公共部门的工作将越来越以数据为中心。最终,基于PDP的框架,作者做出关于公共部门公共服务变革的两个预测:首先,数据在公共服务交付中占据首要地位是不可避免的;其次,这将要求公务员采用数据导向的公共服务新模式。


作者简介

Michael Overton是爱达荷大学公共管理学助理教授。他的研究重点是地方政府管理和财政政策的交叉问题,并且对涉及地方政府财政状况、经济发展融资、交通和地方政府竞争等相关课题尤为感兴趣。

Sarah Larson是中佛罗里达大学的助理教授,研究领域包括中央和地方税收、营业税和定量方法等。


主旨内容

1.导言

大数据的发展深刻地改变了公共组织的决策方式及其提供公共服务的方式。随着大数据的规模变得越来越大,公共组织也面临着新的机遇与挑战。目前,公共管理领域的大数据研究更多专注于特定的数据应用,而对数据驱动型政府相关的更广泛趋势少有研究。此外,对增长的数据可用性对行政行为基础的影响的相关研究也较少。本研究在此引入公共数据优先(PDP)理论框架以解释数据增长对其在公共部门的使用的影响。

2.全新的数据化的世界

数据在社会中起到了记录、理解和分析世界的作用。本文中,数据这一概念采用的定义为“可以被捕获——测量、观察或听到——并因而被提取、分析、转化为信息,并最终可以转化为新知识的原子单位”。随着社会数据化程度提高,个人活动和社会功能被量化为可以储存和分析的格式。这一趋势是由三类数据类型的扩散引发的,即数字生活、数字痕迹以及数字化生活数据。而当下数据化发展的速度则由三个历史趋势决定,即计算能力的指数级增长、从模拟通信到数字通信技术的转变,以及数据生成和新技术之间的正反馈循环。

上述因素使“小数据”逐渐向“大数据”转变。前者数量有限、范围狭窄、获取成本高,因而为组织决策提供的信息并创造的知识也是有限的。而大数据规模庞大、用途广泛、持续产生、数字化记录,并且其生成、获取和储存的成本相对较低,进而对于公共部门的管理、服务、政策制定以及项目评估都产生了深远的影响。这些影响可以分为技术层面与概念层面两类。技术上,数据的重要性可以概括为3V,即容量(Volume)、速度(Velocity)及种类(Variety)。概念上,大数据是数据社会化及其带来的数据丰富性的最终产物,相比小数据而言,大数据更为详尽、粒度更大、关系性更强。大数据在改善政府与公民之间的理解、改善公民偏好与政府服务之间的一致性、改善响应能力以及绩效等方面都有潜在的益处。但同时,大数据的运用也存在危险性、错误处理和滥用等危险性。

数据化变革中,人工智能的自动化正在重塑政府工作管理的关键领域,给监管者带来了许多挑战,监管需求的上升则进一步使得政府对数据进行更多的收集。

3.公共数据优先(PDP)理论框架的四个命题

PDP通过四个命题描述了数据的扩张如何影响其在公共部门的使用,提供了有关数据对公共部门组织的影响的初步建议。

命题一:DATA是数据(即n=all)、数据应用和分析工具以及数据技能的全面性函数。

随着时间的推移,数据的容量、速度、种类、详尽性、粒度和关系性都在增加,使得数据更为全面/抽象。从小数据到大数据的转变可以被视为一个数据连续体:一端是单一的数据,另一端是当“n=all”时的“全部信息”。此外,需要运用数据设备以及具有数据技能的工作人员才能从数据中创造价值。前者包括从数据中提取信息或使用数据的分析方法和程序;后者则使个人能够确保恰当的数据被输入人工智能,并使其产出的决定能够被评估和理解。在此情况下全面的数据化,即n=all,可以对现象甚至现实本身,进行1:1的完美模拟。这种模拟的概念被称为DATA。


原文图1:数据连续体和DATA

命题二:随着数据向DATA接近,公共部门的工作将越发以数据为中心。

数据中心化指的是公共部门中数据使用整合的广度和深度。数据中心化的广度指的是“谁”在公共组织中使用数据,并由个人与组织的功能需求和任务目标所决定。数据中心化的深度则代指“如何”将数据运用于公共服务之中,尤其是在决策过程中。

此外,一些大数据与人工智能相关的诸如数据透明度等问题可能会破坏数据使用的结果,但这些问题往往需要更多的数据以解决。因而,这些挑战进一步激励了数据的中心化。


原文图2:数据中心性

命题三:随着数据向DATA接近,数据的便利性、工具性和权威性将改善数据的使用结果。

数据的便利性、工具性和权威性随着数据的增加而提升。这三个属性促成并制约了数据使用结果的效用,以及公共组织中数据中心化可能的广度和深度。

数据的增长降低了采集、整理和应用数据的相对成本,运营成本的降低抵消了最初的基础设施成本,进而提高了数据收集的便利性。数据的工具性指将数据运用于公共部门的问题之中,并实现预期结果的能力。此外,获取、储存、分析和可视化海量数据的能力使得认识论发生了转变,导向了数据密集型的经验主义。这一转变在公共管理中的实践使得人们越来越依赖数据为决策和公共服务提供信息。这种“大数据思维状态”提升了数据的权威性,使其成为一种可信赖的知识来源。

命题四:随着数据向DATA接近,无论是潜在的、预期的还是实际的数据使用的结果,都将激励公共部门中的数据中心化程度提高。

其一,当数据向DATA接近,公共部门将以更低的成本获得更好的公共部门绩效。大数据提高了公共组织决策的精确性和准确性,将公共管理者的约束性有限理性转化为指导性理性,进而改善决策过程及其结果的精确性。同时,AI的使用也将极大提升公共服务表现。

其二,数据的权威性和工具性将提高公共组织行动可感的合法性。将数据整合到公共部门的工作之中,提高了决策过程的透明度,从而增强了公民的信任。数据使用带来的绩效提升也进一步巩固了合法决策过程需要使用数据的观点。

其三,组织非同构的合法性将得到提升。公共组织也往往面临机构同构化的问题。公共管理者可以通过使用数据来改善结果,使边际同构效益增加,提升机构的合法性。

其四,数据的工具性可以减轻了组织决策失误的风险。数据的使用使得政府治理进程更精确、更有目的性,且随着数据工具型的增强,决策规则得以被正式化和量化,进而减少了帕累托次优的决策风险。

其五,数据可作为帮助决策者规避风险的替罪羊。由于公众认为对于数据的依赖和使用具有权威性,公共官员也得以避免因负面结果而承担选举上的失败或官僚主义的后果。

4.结论与展望

PDP及其四个关键命题的基本假设是:大数据将在容量、种类、速度、详尽性、粒度和关系性方面继续增长,直到完成对现实近乎完美的模拟,即DATA。此外,数据收集的全面性、数据设备和数据技能的增加将提高数据使用的便利性、工具性和权威性。数据融入公共服务的深度和广度可以体现出不同类型与程度的数据中心性。

该理论框架为了解数据和人工智能改变公共部门的方法奠定了基础,其中最重要的两个预测是:(1)数据在公共部门中的首要地位是不可避免的,数据最终将成为提供公共服务以及在公共部门开展工作的基本资源,甚至是关键性资源;(2)公共行政人员需要掌握数据导向的公共服务新模式,并运用特定的数据设备和数据技能以解决数据使用中的道德和伦理问题。

在未来,研究者可以对命题进行实证研究。此外,未来的研究也应当考虑数据导向的公共部门中从业人员的需求,帮助他们适应新的、数据化的世界。


编译者:徐依澜 复旦大学国际关系与公共事务学院本科生