本发明专利技术提出基于区块链的翻译文稿关键词修改溯源系统、基于所述系统实现的修改溯源方法、以及实现所述方法的分布式节点系统。所述系统包括外部提交终端、术语区块化节点生成系统以及区块链溯源系统,所述外部提交终端用于提交针对翻译文稿的关键词修改术语;所述术语区块化节点生成系统基于所述提交的关键词修改术语,生成区块链节点并加入到所述区块链溯源系统中,作为所述区块链溯源系统中的区块链的加入节点;所述区块链溯源系统基于所述区块链完成所述翻译文稿的关键词修改溯源;所述分布式节点系统包括所述的区块链系统中的各个数据链节点,用于识别翻译文稿的关键词修改从而实现修改溯源。
【技术实现步骤摘要】
基于区块链的翻译文稿关键词修改溯源系统与方法
本专利技术属于翻译
,尤其涉及一种基于区块链的翻译文稿关键词修改溯源系统、基于所述系统实现的修改溯源方法、以及实现所述方法的分布式节点系统。
技术介绍
数据溯源(dataprovenance)是一个新兴的研究领域,诞生于20世纪90年代。当初,某些文献将其称为数据志或数据档案,后来,大部分文献将其命名为数据起源,有追踪数据的起源和重现数据的历史状态之意。有数据库表的地方就会有针对表内数据进行追根溯源的需求,需要知道表中某一条目指定字段在何时被何人修改。在大规模语料翻译领域,通常由多个不同的翻译群体共同完成同一份翻译文稿的翻译工作,每一个翻译群体由多个不同的译者组成。将同一份翻译文稿拆分为多个不同的翻译子集,每一个翻译子集分配给一个翻译群体负责。在一个翻译群体内部,则基于译者的能力水平、翻译特长、历史翻译记录等,对同一个翻译子集执行相同或者不同的翻译分配,例如,至少两个以上的译者负责同一段内容的翻译,然后由至少两个以上的译者负责校对、修改,最终完成分配的翻译子集。在这个过程中,需要完整的记录每一位译者负责的内容,尤其是要统一记录每位修改、校对者提交的有效修改标注,并在翻译文稿交付后能够准确的溯源追踪,例如,该份翻译文稿在何时是由何人修改,某个关键词最终定稿翻译之前,有多少人提交了修改建议、哪些建议被采纳、哪些建议被丢弃等。通常情况下,可通过建立一个数据模型实现数据溯,。根据模型可以初步确定数据溯源的大体步骤和基本思路。例如,现有技术存在从数据溯源信息管理的角度出发,提出异构数据的数据溯源概念的做法。即采用横轴表示时间(t)、纵轴表示过程(p)、z轴表示数据的异构分布特性。将数据溯源信息保存到不同的数据库中,形成携带溯源信息的异构数据库。通过数据库接口以及数据转换工具汇聚成目标数据库。这个过程的逆过程所经历的路径能够实现数据溯源的各种操作,如:数据追踪、信息评估、过程重现等,从而完成数据溯源任务。目前,数据溯源模型主要有:流溯源信息模型、时间-值中心溯源模型、四维溯源模型、开放的数据溯源模型、Provenir数据溯源模型、数据溯源安全模型,PrInt数据溯源模型等,这些模型都建立在不同领域、不同行业。1、流溯源信息模型由6个相关实体构成,主要包括流实体(变化事件实体、元数据实体和查询输入实体)和查询实体(变化事件实体、接收查询输入实体,包括元数据实体)。实体间关系密切,通过这种密切的关系可以根据数据的溯源时间来推断数据溯源。2、BowersS提出的Time-ValueCentric(TVC)模型又称时间-值中心溯源模型,是一种简单有效的溯源模型。3、四维溯源模型是由YogeshL.Simmhan等人提出。此模型将溯源看成一系列离散的活动集,这些活动发生在整个工作流生命周期中,并由四个维度(时间、空间、层和数据流分布)组成。四维溯源模型通过时间维区分标注链中处于不同活动层中的多个活动,进而通过追踪发生在不同工作流组件中的活动,捕获工作流溯源和支持工作流执行的数据溯源。4、开放的数据溯源模型OPM,在首届InternationalProvenanceandAnnotationWorkshop(IPAW)会议中,与会者对数据溯源的描述产生了一些共同的观念,并提出了一种原始的数据模型。后来,南安普顿大学等组织整理了会议的主要思想并发表了题为“TheOpenProvenanceModel”文章,文中提及的模型基本形成业界信息交换标准,定义一些具体的格式和协议就能应用到实际当中。5、Provenir数据溯源模型。2008年,在由Freire和Moreau组织的第二届IPAW会议中,Sahoo等人提出了Provenir数据溯源模型,该模型使用W3C标准对模型加以逻辑描述,考虑了数据库和工作流两个领域的具体细节,从模型、存储到应用等方面形成了一个完整的体系,成为首个完整的数据溯源管理系统。用分类的方式阐明它们之间的相互关系.该模型提供对数据产生历史的元数据、原数据、修改元数据等功能,并使用物化视图的方法有效解决了数据溯源的存储问题.6、数据溯源安全模型。数据溯源技术能够溯本追源,通过其起源链的记录信息来实现追源的目的,但是记录信息本身也是数据。因此,同样存在安全隐患,为了防止有人恶意篡改数据溯源中起源链的相关信息,李秀美等2010年研究了数据溯源的安全模型,利用密钥树再生成的方法并引入时间戳参数,有效地防止某人恶意篡改溯源链中的溯源记录,对数据对象在生命周期内修改行为的记录按时间先后组成溯源链,用文档来记载数据的修改行为,当进行各种操作时,文档随着数据的演变而更新其内容,通过对文档添加一些无法修改的参数比如:时间戳、加密密钥、校验和等来限制操作权限,保护溯源链的安全。7、PrInt数据溯源模型。PrInt是一种支持实例级数据一体化进程的数据溯源模型。该模型主要集中解决一体化进程系统中不允许用户直接更新异构数据源而导致数据不一致的问题。由PrInt提供的再现性是基于日志记录的,并将数据溯源纳入一体化进程。以上七种模型是比较经典的模型,其中,对于前三种模型而言,流模型和时间-值模型没有明确指出对W7模式的支持,只有四维模型支持动态构建数据溯源图,能根据一系列溯源事件以及数据结点和服务结点所构成的数据流边来构建。存在的不足之处在于形成过程不直接,难于理解。后面几种模型是从不同的角度、不同层次、针对数据溯源的某种特性而建立起来的模型。随着时间的推移,数据溯源模型会越来越多。然而,不管是哪种溯源模型,溯源目前存在的痛点有:数据中心化存储,存在中间管理方为了自身利益而篡改数据的风险;假冒伪劣产品信息或者虚假信息出现而追责困难;信息安全管理也是溯源需要解决的痛点问题。区块链溯源实现了去中心的信任,区块链中的多方共识、加密算法、P2P网络等技术解决了在去中心的系统中如何保证数据的不可篡改问题;智能合约按照规则自动执行,去除了人为控制的风险;关键数据以链式存储,可通过安全访问方式对每笔数据进行追溯。例如,申请号为CN201910420570.9的中国专利技术专利申请提出一种面向溯源应用的区块链数据库数据管理系统及方法,该数据管理系统,可实现查询、插入和更新操作,并且使用一种类SQL语言,被称为区块链数据库查询语言(BlockchainDatabaseQueryLanguage,BDQL)。其管理方法就是构建一套BDQL语言,通过解析转换、逻辑处理、数据驱动、数据存储四个层次操作可以将BDQL解释转换为BCD可解析并执行的语句,并完成BCD操作。开发人员采用该数据管理系统及方法,直接输入BDQL语句,并对区块链数据库BCD进行增改查操作;申请号为CN201910438337.3的中国专利技术专利申请提出一种对关系型数据进行溯源的方法,在将关系型数据共享给其他人之前,根据被共享者分别形成不同的水印信息,并嵌入到关系型数据中。将嵌入水印的关系型数据分别共享给对应的被共享者。当数据泄露发生时,从泄露的数据中提取水印信息,从而确认泄露源;申请本文档来自技高网...
【技术保护点】
1.一种基于区块链的翻译文稿关键词修改溯源系统,所述系统包括外部提交终端、术语区块化节点生成系统以及区块链溯源系统,/n所述外部提交终端用于提交针对翻译文稿的关键词修改术语;/n所述术语区块化节点生成系统基于所述提交的关键词修改术语,生成区块链节点并加入到所述区块链溯源系统中,作为所述区块链溯源系统中的区块链的加入节点;/n所述区块链溯源系统基于所述区块链完成所述翻译文稿的关键词修改溯源;/n其特征在于:/n所述术语区块化节点生成系统通过多个包含正则表达式的数据链接口与所述外部提交终端通信;/n所述数据链接口接收经过正则表达式处理的所述外部提交终端提交的针对翻译文稿的关键词修改术语,并触发术语规约模块;/n所述术语规约模块接收所述正则表达式的输出判断结果,执行共识验证后生成区块信息;/n通过广播与共识模块对所述生成的区块信息进行广播,并在区块链的所有节点进行共识同步后,将当前生成的区块信息作为区块链节点加入到所述区块链溯源节点的区块链中。/n
【技术特征摘要】
1.一种基于区块链的翻译文稿关键词修改溯源系统,所述系统包括外部提交终端、术语区块化节点生成系统以及区块链溯源系统,
所述外部提交终端用于提交针对翻译文稿的关键词修改术语;
所述术语区块化节点生成系统基于所述提交的关键词修改术语,生成区块链节点并加入到所述区块链溯源系统中,作为所述区块链溯源系统中的区块链的加入节点;
所述区块链溯源系统基于所述区块链完成所述翻译文稿的关键词修改溯源;
其特征在于:
所述术语区块化节点生成系统通过多个包含正则表达式的数据链接口与所述外部提交终端通信;
所述数据链接口接收经过正则表达式处理的所述外部提交终端提交的针对翻译文稿的关键词修改术语,并触发术语规约模块;
所述术语规约模块接收所述正则表达式的输出判断结果,执行共识验证后生成区块信息;
通过广播与共识模块对所述生成的区块信息进行广播,并在区块链的所有节点进行共识同步后,将当前生成的区块信息作为区块链节点加入到所述区块链溯源节点的区块链中。
2.如权利要求1所述的系统,其特征在于,所述区块链溯源系统的区块链通过如下方式建立:
首发用户向当前通信的所有分布式用户终端广播术语规约,经所述区块链认证形成区块链创世节点;
在所述创世节点生成之后,其他区块信息加入到所述区块链作为加入节点。
3.如权利要求1所述的系统,所述区块信息包...
【专利技术属性】
技术研发人员:何征宇,
申请(专利权)人:传神语联网网络科技股份有限公司,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。