激活公共数据要素潜能
日前,国家数据局等部门发布《“数据要素×”三年行动计划(2024—2026年)》,进一步明确和细化了激活数据要素潜能的具体方式和实践场景,扩展数据要素的高质量供给。将通过多领域、多行业的试点工作,丰富数据要素价值释放路径,创新各个产业数据要素应用的业务模式。
行动计划在“强化保障支撑”方面明确提出“加大公共数据资源供给”。之所以对公共数据资源如此关注,是因为这类数据资源所具备的庞大经济价值尚未被充分挖掘。
公共数据主要是指政府部门以及公共服务职能部门在其业务活动中所收集的数据资源,不包括个人信息和重要数据。相较于企业自行收集、整合的数据,这类数据所反映的社会运行信息更为全面,囊括了特定区域乃至全国范围内的消费动向、道路交通状况等重要社会信息。尤其是在人工智能领域,大规模算法模型的训练和优化更依赖高质量的海量训练数据支撑,公共数据的高效开放利用能够缓解现阶段人工智能产业训练数据不足的问题。因此,激活数据要素潜能的重要方式之一便是打通公共数据开放渠道,充分提高公共数据的利用效率。
然而,公共数据的开放和利用也面临着诸多难题。一方面,虽然公共数据不属于个人信息、重要数据,但是伴随着数据分析技术的提升,包含广泛社会运行状况的公共数据与其他数据结合,并不能完全排除识别到特定自然人的可能性。另一方面,现行立法尚未对数据权益归属予以明确,尤其是公共机构是否有权对数据处理者加工处理公共数据所获得的衍生数据主张权利仍存在争议。此外,公共数据本身具有较强的社会公益性,基于公共数据处理所产生的经济收益如何分配同样处于实践探索阶段。
面对这些公共数据开放的实践难题,行动计划以更为全局性、体系化的视角提出了探索解决方式,即将公共数据资源开放统筹于“提升数据供给”的框架内。既要以遵循试点先行、协同探索为发展思路,在重点领域、相关区域组织开展公共数据授权运营,探索部省协同的公共数据授权机制;也要秉持全局化观念,将公共数据开放与完善数据资源体系、引导企业开放数据、健全标准体系、加强供给激励有机整合,促成整体社会数据资源的高质量供给;还要立足于这些实践基础和我国现行的数据分级分类制度,形成具有行业性、区域性特征的公共数据安全保障机制和授权利用机制。