9月27日-28日,由钛媒体与ITValue共同主办的2022全球数字价值峰会深圳站在深圳星河·领创天下举行。此次峰会以“复苏与可持续发展”为主题,聚焦“数据”议题,在数字化经济大潮下,从数据驱动业务转型、数据交易、数据营销、产融结合、供应链创新等多个维度,探讨“数据掘金”的新突破口。
会上,交叉信息核心技术研究院常务副院长林常乐发表了“数据交易的理论基础”的主题演讲。
林常乐提到,前期各方在数据定价算法的研究都集中在甲乙双方,两方的角色是不对称的,数据提供方和数据使用方,在这种情况下会容易陷入非对称问题的逻辑困境,会存在各说各有理的情况。
“交叉信息核心技术研究院在姚期智院士的指导下做了大量的探索,把这个问题拆分成一个多方数据协作完成某项经济活动的问题,这样就变成了对称性问题,比较容易求解。”林常乐说。
数据流通定价与资产化算法平台是基于博弈论、人工智能模型、信息论等技术,汇总在不同业务使用场景下的数据定价机制,形成的一套公平、合理、实践性强的数据定价系统。
如此可以解决数据要素在企业内外部流通中的“定价难”的核心问题,同时,可以在企业内部实现对数据资产的价值管理、内部数据的资产化计价统筹管理(包括其生产成本、以及产生的业务价值核算),释放数据要素的价值。帮助企业从数据治理角度实现生产效率提升,赋能数字化转型的产业升级。
以下为林常乐演讲内容,经钛媒体编辑整理:
我们今天的研究成果是由姚期智院士在清华大学交叉信息学院交叉信息核心院进行的落地研究和实践,也是我们做数字经济核心价值引擎和核心技术的一部分。
数据定价,将非对称性问题转换为对称性问题
首先介绍数据定价算法理论与实践,数据、算法和算力是数字经济的三大核心要素,在数据核心应用层面需要进行数据交叉应用和流通,才能产生大规模经济价值,其中,数据定价算法就是我们需要解决的挑战,这一挑战目前已经经过了三年半的研究,实现了问题的攻克。
我们通过学习中央的文件《关于构建更加完善的要素市场化配置体制机制意见》,以及今年深改委相关的意见,都指出要对数据要进行分级授权、确权应用,建立数据持有权、数据产品经营权的产权运营机制,健全权益保护制度。
我们的数据定价算法主要解决价值分配的问题,在不同主体数据要素的交叉应用和流通过程中,以及单一主体的多部门、多来源的数据应用过程中,都会遇到数据定价的问题,如果不能解决数据定价的问题,就实现不了数据大规模应用,进而无法产生数据经济的经济学基础。
前期各方在数据定价算法的研究都集中在甲乙双方,两方的角色是不对称的,数据提供方和数据使用方,在这种情况下会容易陷入非对称问题的逻辑困境,会陷入各说各有理的情况。
我们在这方面做了大量的探索,直到明确了正确的问题框架,在姚院士的指导下,我们把这个问题拆分成一个多方数据协作完成某项经济活动的问题,这样就变成了对称性问题,比较容易求解。
各个合作方属于数据协作方,他们是相同的角色,我们就可以定义效率,也可以定义公平,从公平性分配原则入手就可以尝试解决数据定价的问题。
如果能解决刚才设定的通用框架,也就是多方数据协作的问题,其中的权益、利益分配的问题,我们自然就可以解决一开始看到的非对称性的问题,也就是数据提供方和数据使用方想支付一定利益使用数据的过程,这样的问题只不过是多方数据协作完成某项活动的特殊用例,我们可以把它转化成一个对称性问题,大家共同协作完成某项经济活动。
公平的数据定价
在这样的框架下,我们就可以基于公平性原则进行求解,这项理论已经构建出来,它包含了以下几方面的理论基础,包括信息经济学、博弈论、人工智能模型等技术。
它的原理有两个阶段,第一个阶段,我们可以通过信息经济学的原理,把业务的经济价值和模型的精度进行一一映射和对应;
第二个阶段,我们可以利用数据多方协作的场景进行求解,把模型的精度和数据的贡献进行一一分解,这样可以求出来唯一公平的权益分配,如此就比较完整地解决了这一问题。
这样的理论框架非常通用,可以应用于各类场景,在各类场景内都会有内部数据、外部数据、多方数据的协同,根据业务的价值,可以把数据提供的业务价值进行映射和计量,根据数据的价值贡献度,可以把它分配给各个数据,这种分配是符合第一性原理的,可以到原子级别。
我们在数据的价值链条上还可以层层回溯,参与一些应用的数据,它的信息源也来源于上游各种数据的分析、加工、处理,我们利用回溯的技术可以把价值向源头进行分配。
至此,我们就建立了一项经济活动的数据定价算法。
接下来再继续研究,我们也提出了数据资产入表的理论基础和落地实践。我们和一些央企合作过程中,利用数据定价算法进行了落地实践,我们去年在央企数字化转型峰会上发布了第一阶段的数据要素权益分配的算法,同时我们根据华润集团的实际情况,把产业数据和金融数据进行协同应用,在安全合规的框架下,让数据权益可以分配,同时我们基于金融服务的场景,可以看到模型的显著提升来源于多元数据的应用。
我们也提出了数据资产估值框架和落地实践,前面已经解决了数据基于某项经济活动的定价方法,数据资产可能会参与到很多的经济活动中,我们如果是理论经济学家,这个工作已经做完了,但我们是做应用的,所以我们需要有一个构建的方法,能够对数据资产进行价值的评估,我们不可能把各种各样的场景都试一遍,必须要有不断逼近的方法。
参考中国资产评估协会发布的《数据资产评估指导意见》,我们需要考虑收益、成本、市场三方面的要素,具体的指导框架如何落地,以及如何算出具体的数字呢?
数据资产有奇妙的特性,类比金融资产、实物资产的估值定价,都是由这些资产参与到活动里所有的现金流和潜在现金流的贴现加总决定的,比如说土地资产,我们称之为实物期权,可以用来参与很多的经济活动,像盖楼、盖停车场,盖好了可以出租,也可以直接卖,怎么实现价值变现取决于相应的经济活动和市场价格。
数据资产也一样,它的价值评估涉及到它可以参与的所有经济活动所分配的经济权益的加总,它有一个非常神奇的特性是可以无限可复用,它可以参与到很多的场景,这样一来就需要有一种构建技术对存在的权益分配进行探索和评估。
我们基于前面的单一经济活动的定价算法,提出了基于图谱的技术,根据数据和场景映射的数据资产图谱,不断地确定场景和数据资产之间的关系,可以将它的价值应用在各类场景里,把资产的价值进行加总,这样可以分析数据的总价值。这项技术开始在银行和央企落地,进行数字资产的价值评估。
时间有限,我就先分享这么多,也期待和各位专家、各位嘉宾进行持续交流,谢谢大家!
根据《网络安全法》实名制要求,请绑定手机号后发表评论
这个对称性太复杂了
数据提供方和数据使用方,有时候会进入非对称的逻辑问题