区块链 Programmable,我们选择的数据流通方案

现今,数据已然成为了比肩石油的基础性关键战略资源,正颠覆各个行业的发展模式。随着数字经济的建设以及数据产业市场规模的迅速扩大,数据在各行业领域不断地产生、流动、交换。

  众所周知,数据共享流通是释放数据价值的关键环节,而随着数据交换、共享力度的加大,其权属、合规性、安全性等诸多险开始显现,出现了数据共享难以及隐私无法得到保障等问题。

  如何在保证安全、隐私的前提下,实现数据的共享、流通,释放数据的价值是亟待解决的难题。

  为了解决这些问题,笔者团队从诸多方面进行了尝试和探索。

区块链、安全多方计算、流程引擎、可编程网络等技术为解决数据共享、流通过程中的问题,提供了富有启发性的解决方案。
区块链为跨组织的数据协作提供共享安全性,同时提供元信息可信存储媒介;
安全多方计算可在无可信第三方情况下,实现无信任的多个参与方进行协同计算,输出计算结果,同时保证任何一个参与方无法得到除结果之外的其他信息;
流程引擎、可编程网络技术提供了共享过程中的便捷、灵活性,保证共享结果时效以及动态性。
从以上技术切入,笔者团队构建了跨组织的、安全的数据共享平台-BitXMesh,在数据安全和隐私的前提下,发挥数据价值,实现跨机构协同创新。
基于区块链的可编程数据共享概述
一览目前的各个行业、领域,数据拥有方因为众多因素而导致无法顺利地进行数据共享。“不愿”共享,数据拥有方无法从共享数据中获益,行业缺乏数据价值评估体系,同时对各个共享参与方的激励缺失;

  其次,“不敢”共享,数据的安全性和隐私性诉求无法得到满足,数据一旦离开原使用场景变得不可控,存在不当使用或滥用风险,危害自身利益。同时,缺乏共享数据实时监测手段以及数据使用授权机制,也存在着无法获取共享范围、共享参与方合法性问题;

以及“不易”共享,各机构信息标准不统一。不能获得持续、多源的、标准化的数据资源,阻碍了数据交换以及共享效率的提升。
针对以上数据共享行业痛点,我们识别出数据共享技术实现上的需求,主要体现在相同使用场景有序互通,安全、隐私保障,全程的流转追溯审计,激励权益分配等方面。具体的,我们总结如下:
l数据共享网络可信,包括各个参与方按业务构建共享联盟,各参与方共享网络环境是对等、可信的。同时,这个共享环境必须是Blockchain-Empower的,在网络上可灵活定制共享流程;
l安全、隐私保障,包括数据加密技术,同时数据在一定范围内使用以及实施有效授权机制。通过合约颁发的凭证在一定时间、次数下获取、使用数据;
l流转可追溯,访问可审计,包括对接入平台的数据进行统一表达、标识,同时确保链上、链下锚定;各参与方的行为做到透明日志记录,能及时检测日志中出现的异常行为、快速定位异常情况,追溯到行为源头;
l权益分配,能计算各方贡献价值,高效、安全进行多方利益分配。
以区块链,安全多方计算,可编程网络等技术切入,我们提出了全新数据共享解决方案,基于Blockchain-Empower的安全网络,其上构建和实现分布式数据协作流程,辅之数据共享合约,实现数据“可用不可见”共享。

《区块链 Programmable,我们选择的数据流通方案》

通过在各机构建立BitXMesh节点,并以P2P网络的形式连接形成链下去中心化的数据共享网络。在这个网络之上,建模和实现分布式的数据协作。我们提出流程定义网络(Workflow Defined Network)的概念,共享的业务流程可以确定、定义各对等方形成的联盟网络。通过这个联盟网络,联合多方构建业务流程,实现以移动计算而不是移动数据方式,共享结果,而不是源数据方式进行数据共享。
区块链提供了共享安全性以及可信的存储,引入数据共享合约实现数据链上精准授权,以及提供数据供需撮合,记录收授、予取的流转交换记录。数据使用凭证颁发,撤销,使用过程中的纠纷仲裁。
BitXMesh节点拓展链上能力,实现平台内数据统一表达、标识,引入数据管理能力,计算管理能力。实现了异构数据的适配、数据管理功能,计算任务的协调、分派功能,业务流程定制功能,数据流转、使用记录审计留痕能力,以保障平台内流转可追溯,访问可审计能力,提供全流程监测能力。
平台SDK提供快速无侵入接入业务,提供具体业务适配,网络配置提供,共享任务定制,流程审核提交功能。
数据共享的流程

上面的描述,从宏观上了解了笔者团队打造的数据共享平台的构成,以下从共享流程展开,以流程来串起整个技术脉络。
概要地讲,以区块链提供可信元信息存储媒介,通过构建一个数据协作网络,在网络之上建模、实现业务共享流程。
通过构建业务计算模型,模型按链上元信息编程,模型随流程流转,使用本地数据执行,在流程运行、流转中完成共享目标。过程中不同机构的数据不需出库、仅计算结果进行共享和传递。

参与者角色

数据提供方,数据的所有者。
数据提供方将本地所用户的数据经过密码学处理或者对数据使用描述进行整理。发起方,共享结果需求者。向平台提供共享任务请求。负责管理和协调多个数据共享参与方协同完成共享任务,包括配置共享任务信息等。
参与方,指数据交换共享任务实际执行者,自己也提供本地数据参与计算。协调者,计算任务的协调者,调度流程,计算任务执行。在一次共享任务流转中,数据提供方,参与方各自可以有一个或多个,协调者必须参与。

共享流程

BitXMesh数据共享平台为各种数据源构建一套在Blockchain-Empower网络中协作、共享的数据表示、索引、定位、查询、交换和数据追溯审计的统一实现标准,并提供业务流程定制等能力,支持快速开发、部署和实现共享业务、开展业务合作,实现机构间数据的可信互联互通,解决数据协作过程中的安全隐私问题。
流程分为数据提供方的发布数据需求方的获取使用,整个过程分两部分描述:
数据提供方的发布流程
l导入
数据至本地BitXMesh节点。导入提供了数据管理的需求,导入过程会对数据进行统一的表示。根据导入的数据类型不同,进行不同的处理,会有分片,文件系统服务,merkle-dags表示。
l命名
通过自描述的数据结构,形成网络唯一的ID,也提供文件系统Path的概念。提供数据在网络中的定位、查找能力。
l发布
可共享数据的元信息(如数据标题、数据使用描述等)至区块链,可为某些机构设置默认的数据访问权限;计算模型这一特殊的数据形式需要单独处理,这块是非常有意思的部分,将计算模型当做数据是创新性的手段,在此不过多描述,可以自己体验。
l同步
将数据元信息同步至数据共享平台,数据共享平台是链上数据汇集的 Hub,任意方可查询,获取此处的数据。

《区块链 Programmable,我们选择的数据流通方案》

数据需求方的获取流程
业务方获取数据,编排业务流程,启动数据共享,BitXMesh节点会根据流程的指示分派共享任务,同时节点的虚拟机会加载业务计算模型利用本地数据执行计算逻辑。
l检索
通过数据共享平台检索所需的数据,还记得数据的统一描述以及链上元数据信息吧,这些信息构建了检索的索引。
l请求
请求相关数据的访问凭证Token,提供平台内的积分机制,根据数据发布方式,请求数据时会进行积分转移、数据授权记录上链。当数据是授权访问时需要向数据提供方发起数据访问申请,获得数据提供方的审核后合约颁发的Token;
l 获取
数据请求方通过自身的业务定制流程以及计算模型,根据流程流转到不同的机构,通过网络的节点ID以及获取到数据的Token向提供方获取数据,BitXMesh网络点对点传输数据或计算结果。
l 使用
计算模型会使用授权得到的或者积分购买到的数据,通过加载模型来使用本方数据,计算得到结果。

《区块链 Programmable,我们选择的数据流通方案》

点赞