中国人民大学杨翰方:明晰数据定义,助力数据要素市场建设加速
近日,2023年度全国前沿交叉研究院院长联席会文理交叉论坛在中国人民大学举办,来自国内外80余所知名高校及科研院所的400余位专家学者、学生,30余家企业的代表齐聚现场。
数字经济快速发展,数据作为全新的生产要素,其重要性也逐渐凸显。我国数据要素市场建设已然按下“快进键”。去年以来,《关于构建数据基础制度更好发挥数据要素作用的意见》和《企业数据资源相关会计处理暂行规定》等文件密集发布;负责协调推进数据基础制度建设,统筹数据资源整合共享和开发利用的国家数据局也在今年组建。
本次会议也设立了数据要素分论坛,参会学者围绕数据要素价格机制、数据要素流通与资产化、数据基础概念等问题做了一系列探讨。
中国人民大学教授杨翰方在“关于数据基础概念的再思考”为主题的分享中发布了他的研究成果,首次将数据定义为可计算的记录。
“我们即将迈向了数字经济高质量发展阶段,共同面对数据要素这一时代重要命题,但各个学科、行业对数据的定义却没有达成共识。”杨翰方在接受21世纪经济报道记者采访时表示。他指出,近年来,围绕数据的新制度、新机构与新实践不断涌现,然而,人们对“数据”定义的认识尚不够充分,间接造成了理念纷争与实践挑战。他指出,基础概念如果无法明晰,后续的研究和应用也将产生很大影响。
以《数据安全法》为例,在该法中,数据的定义是“本法所称数据,是指任何以电子或者其他方式对信息的记录”。杨翰方认为,在保护性的法规中,这个描述性的定义是合适的。但他直言,“反过来讲,可能并不是每一条以电子或者其他方式记录的信息都能被视为数据。”如果数据的定义不能满足对等性原则,它的操作边界就需要进一步明确,将会受到一定影响后续的数据确权、定价、入表及入统等工作。
而如果将数据定义为可计算的记录,数据的范围和边界将变得清晰可见。杨翰方介绍道,这一定义涵盖了数据定义最重要的五项原则:能够契合历史上各个阶段的主流数据生产方式,包括结绳记事、问卷调查、实验测量及信息系统等;能够充分体现“数”与“据”在中文语境下的基本含义;能够衔接前沿技术,尤其是大型语言模型对数据概念的要求;定义项与被定义项是对等,即逻辑上可交换顺序;简洁、明确,便于各界理解并形成共识。
他认为,“可计算”对应“数”,用“记录”对应“据”。“计算”与“记录”是自古至今一贯的数据实质。数字化文本、图像及音频均具备可计算属性和记录属性,能够被纳入数据范畴,符合当代数据要素发展趋势。
“对于数据及相关概念,当前我们迫切需要完整、明确的定义或相关解释。”杨翰方指出,可操作性强的数据概念和定义,能够引导数据要素相关实践更高效地开展。“数据确权、数据资源入表、数据资产评估、公共数据授权运营等数据要素建设的核心问题都与数据定义的息息相关。具体而言,概念厘清后,一方面,能够更好地帮助数据要素市场中的各方识别边界,明晰权责;另一方面也能给各级政府的相关工作带来便利。”他告诉21世纪经济报道记者。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。