从候选数据集获取目标数据集的方法和装置以及翻译机器制造方法及图纸

技术编号：7239970 阅读：441 留言：0更新日期：2012-04-11 18:40

本发明专利技术涉及从候选数据集获取目标数据集的方法和装置以及翻译机器。其中，从目标数据样本提取特征；利用所述特征从所述候选数据集中抽取目标数据，形成目标数据集。根据本发明专利技术的实施方式，能够根据所提供的样本来从候选数据集中抽取目标数据。

全部详细技术资料下载

【技术实现步骤摘要】

本申请涉及数据提取，具体而言，涉及一种从候选数据集获取目标数据集的方法和装置。此外，本申请还涉及一种翻译机器。
技术介绍
传统地，根据特定的目标数据样本从候选数据集中获取特定的目标数据通常通过判断候选数据集中的数据和目标数据样本之间的相似度手工地进行选择，或者甚至从候选数据级中随机选取一些数据作为目标数据。明显地，这种传统的方式和方法不能提供高质量的目标数据。
技术实现思路
在下文中将给出关于本专利技术的简要概述，以便提供关于本专利技术的某些方面的基本理解。应当理解，这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分，也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念，以此作为稍后论述的更详细描述的前序根据本申请的实施例，从目标数据样本提取特征，利用所述特征从所述候选数据集中抽取目标数据，从而形成目标数据集。这样，基于针对所述特定目的的目标数据样本从候选数据集抽取子集形成目标数据集。所形成的目标数据集的生成更为迅速。此外，所形成的目标数据集更为符合后续处理的要求。附图说明本专利技术可以通过参考下文中结合附图所给出的描述而得到更好的理解，其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分，而且用来进一步举例说明本专利技术的优选实施例和解释本专利技术的原理和优点。在附图中图1示出了根据本专利技术的一个实施例的用于从候选数据集获取目标数据集的方法的流程图，图2示出了根据本专利技术的另一实施例的用于从候选数据集获取目标数据集的方...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员：郑仲光，何中军，孟遥，于浩，
申请(专利权)人：富士通株式会社，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人