跨语言信息建构与处理方法及跨语言信息系统技术方案

技术编号:24756545 阅读:19 留言:0更新日期:2020-07-04 09:15
一种跨语言信息建构方法,包含以系统的处理器从多个网络平台搜集多个对象信息。以处理器依据这些对象信息建构对应本地语言的第一数据结构与对应目标语言的第二数据结构。以处理器依据第一数据结构内的多个第一对象信息具有的特征数据,对这些第一对象信息进行分群以形成多个本地图像群组。以处理器依据第二数据结构内的多个第二对象信息具有的特征数据,对这些第二对象信息进行分群以形成多个目标图像群组。其中,每个本地图像群组包含多个本地标签群组,且每个目标图像群组包含多个目标标签群组。

Cross language information construction and processing methods and cross language information system

【技术实现步骤摘要】
跨语言信息建构与处理方法及跨语言信息系统
本专利技术关于一种应用图像及词语特征的跨语言信息建构与处理方法以及跨语言信息系统。
技术介绍
互联网的快速发展使人们的生活越来越便利,而网络购物已逐渐地成为全球化之中重要的一环。全球性的发展所要面对的第一个问题为语言差异所造成的隔阂。虽然英文为重要的国际语言,然而并非所有国家都使用英文作为主要沟通语言。当各国的用户在网络平台上看到感兴趣的商品信息、或者是其他具有概念或含义的信息或某些国家的当地流行语等相关内容时,需要通过翻译软件/工具来解释网站的文字内容意思为何,且流行商品的翻译还有其困难度,例如:中文中化妆品中的前导液,韩文翻为引物,英文翻为底漆,与原意相差甚远。此外,各国的社群网站与论坛网站众多,且所展示的商品时常推陈出新。这样的情况会造成时间上的耗费且用户的便利性也会大幅下降。
技术实现思路
本专利技术提出一种跨语言信息建构与处理方法以及系统,应用图像与词语特征的分类进行跨语言的数据建构与比对分析,以便利地搜寻到跨语言目标(例如商品)。依据本专利技术的一实施例公开一种跨语言信息建构方法,包含以下步骤:以系统的处理器从多个网络平台搜集多个对象信息;以处理器依据这些对象信息而建构具有对应本地语言的第一数据结构与对应目标语言的第二数据结构的数据库;以处理器依据第一数据结构内的多个第一对象信息具有的特征数据,对这些第一对象信息进行分群以形成多个本地图像群组;以处理器依据第二数据结构内的多个第二对象信息具有的特征数据,对这些第二对象信息进行分群以形成多个目标图像群组。其中,每个本地图像群组包含多个本地标签群组,且每个目标图像群组包含多个目标标签群组。依据本专利技术的一实施例公开一种跨语言信息处理方法,包含以下步骤:以系统的处理器建构具有对应本地语言的第一数据结构与对应目标语言的第二数据结构的数据库;以系统的操作接口接收目标对象信息,并且提取目标对象信息的特征数据;以系统依据所提取的目标对象信息的特征数据而从对应本地语言的第一数据结构当中选取第一关联图像群;以系统依据第一关联图像群执行跨语言比对任务而从对应目标语言的第二数据结构当中选取第二关联图像群;以系统依据第二关联图像群而输出多个候选对象图像;以系统依据用户指令选取这些候选对象图像当中的一个候选对象图像作为目标对象图像。其中,目标对象信息的特征数据包含关于目标对象信息的图像特征与词语特征。依据本专利技术的一实施例公开一种跨语言信息系统,适于多个网络平台,该跨语言信息系统包含数据库,操作接口及处理器。数据库配置以储存对应本地语言的第一数据结构与对应目标语言的该第二数据结构。操作接口配置以接收目标对象信息。处理器连接数据库与操作接口,处理器配置以提取目标对象信息的特征数据,且依据所提取的目标对象信息的特征数据而从第一数据结构当中选取第一关联图像群,处理器还依据第一关联图像群执行跨语言比对任务而从第二数据结构当中选取第二关联图像群,且依据第二关联图像群而使操作接口输出多个候选对象图像,处理器还依据用户指令选取该些候选对象图像当中的候选对象图像作为目标对象图像。其中,该目标对象信息的特征数据包含关于该目标对象信息的一图像特征与一词语特征。在本专利技术所提出的跨语言信息建构与处理方法以及系统中,主要是先建构各类对象的图像(image)及标签(hashtag)的数据库,并提取所输入的目标对象的图像特征以及标签(hashtag)特征,以在不同语言的数据库当中进行搜寻分类,从而筛选且排序出多个候选的品项供用户选取,并且可允许用户反馈分数。因此,通过图像及词语标签的分类比对建立高精准度的跨语言搜寻,使用户获知不同语系国家的社群或购物网站上的产品,也可用于供商品设计的进行、进货布局、元素添加决策、广告投放或目标热度的消长状态。以上的关于本公开内容的说明及以下的实施方式的说明用以示范与解释本专利技术的精神与原理,并且提供本专利技术的权利要求保护范围更进一步的解释。附图说明图1是依据本专利技术的一实施例所绘示的跨语言信息系统的方块示意图。图2是依据本专利技术的一实施例所绘示的跨语言信息建构方法的方法流程图。图3是依据本专利技术的一实施例所绘示的跨语言对象信息建构的示意图。图4是依据本专利技术的一实施例所绘示的跨语言信息处理方法的方法流程图。【附图标记】10跨语言信息系统101处理器103数据库105操作接口20a~20c网络平台DA1第一数据结构DA2第二数据结构SG1~SG3本地图像群组TG1~TG3目标图像群组SHG1~SHG9本地标签群组THG19~THG27目标标签群组SB1~SB27第一对象信息TB1~TB27第二对象信息具体实施方式以下在实施方式中详细叙述本专利技术的详细特征以及优点,其内容足以使任何本领域技术人员了解本专利技术的
技术实现思路
并据以实施,且根据本说明书所公开的内容、权利要求保护范围及附图,任何本领域技术人员可轻易地理解本专利技术相关的目的及优点。以下的实施例进一步详细说明本专利技术的观点,但非以任何观点限制本专利技术的范畴。请一并参照图1与图2,图1是依据本专利技术的一实施例所绘示的跨语言信息系统的方块示意图。图2是依据本专利技术的一实施例所绘示的跨语言信息建构方法的方法流程图,此方法可由图1的跨语言信息系统实施。如图1所示,跨语言信息系统10(以下简称「系统10」)包含处理器101、数据库103及操作接口105,其中处理器101连接数据库103及操作接口105。在实际操作上,跨语言信息系统10为一计算机系统可通过网络连接外部的多个网络平台20a~20c,其中处理器101可为中央处理器、微处理器、微控制器等具有运算功能的元件,而网络平台20a~20c可为各国家的不同社群网站、论坛网站等。如图2所示的跨语言信息建构方法,在步骤S201中,以处理器101从网络平台20a~20c搜集多个对象信息。所述的对象信息为来自不同国家的各类商品信息、例如是化妆品、3C商品、食品、服饰等。请进一步参照图3,图3是依据本专利技术的一实施例所绘示的跨语言对象信息建构的示意图。在步骤S203中,以处理器101依据这些对象信息建构对应本地语言的第一数据结构DA1与对应目标语言的第二数据结构DA2。具体来说,处理器101先根据语言类别而将所搜集的这些对象信息(如下述的对象信息SB1~SB27、TB1~TB27)进行初步的分群,以形成属于本地语言的对象信息(即第一数据结构DA1)以及属于目标语言的对象信息(即第二数据结构DA2)。在此所述的本地语言例如为用户的母语(例如中文),而目标语言为不同于用户母语的另一种语言(例如韩文),本专利技术不以此为限。在步骤S205中,以处理器101依据该第一数据结构DA1内的第一对象信息SB1~SB27具有的特征数据,对这些第一对象信息SB1~SB27进行分群以形成多个本地图像群组,例如:SG1~SG3,本专利技术不以此为限。本地图像群组SG1~SG3个别包含多个本地标签群组。本文档来自技高网
...

【技术保护点】
1.一种跨语言信息建构方法,包含:/n以一系统的一处理器从多个网络平台搜集多个对象信息;/n以该处理器依据这些对象信息建构对应一本地语言的一第一数据结构与对应一目标语言的一第二数据结构;/n以该处理器依据该第一数据结构内的多个第一对象信息具有的特征数据,对这些第一对象信息进行分群以形成多个本地图像群组;以及/n以该处理器依据该第二数据结构内的多个第二对象信息具有的特征数据,对这些第二对象信息进行分群以形成多个目标图像群组;/n其中,每一该本地图像群组包含多个本地标签群组,且每一该目标图像群组包含多个目标标签群组。/n

【技术特征摘要】
20190104 TW 108100366;20181226 US 16/232,4381.一种跨语言信息建构方法,包含:
以一系统的一处理器从多个网络平台搜集多个对象信息;
以该处理器依据这些对象信息建构对应一本地语言的一第一数据结构与对应一目标语言的一第二数据结构;
以该处理器依据该第一数据结构内的多个第一对象信息具有的特征数据,对这些第一对象信息进行分群以形成多个本地图像群组;以及
以该处理器依据该第二数据结构内的多个第二对象信息具有的特征数据,对这些第二对象信息进行分群以形成多个目标图像群组;
其中,每一该本地图像群组包含多个本地标签群组,且每一该目标图像群组包含多个目标标签群组。


2.如权利要求1所述的跨语言信息建构方法,其中这些第一对象信息具有的特征数据包含多个第一图像数据及多个第一标签数据,且这些第二对象信息具有的特征数据包含多个第二图像数据及多个第二标签数据。


3.如权利要求2所述的跨语言信息建构方法,其中以该处理器依据该第一数据结构内的这些第一对象信息具有的特征数据,对这些第一对象信息进行分群以形成这些本地图像群组包含:
以该处理器依据这些第一图像数据对这些第一对象信息执行一图像分群任务,以形成这些本地图像群组,其中每一该本地图像群组内的这些第一对象信息具有对应的第一图像特征。


4.如权利要求2所述的跨语言信息建构方法,还包含:
以该处理器依据这些第一标签数据对每一该本地图像群组内的这些第一对象信息执行一标签分群任务,以形成这些本地标签群组,其中每一该本地标签群组内的这些第一对象信息具有对应的该第一标签特征。


5.如权利要求2所述的跨语言信息建构方法,其中以该处理器依据该第二数据结构内的这些第二对象信息具有的特征数据,对这些第二对象信息进行分群以形成这些目标图像群组包含:
以该处理器依据这些第二图像数据对这些第二对象信息执行一图像分群任务,以形成这些目标图像群组,其中每一该目标图像群组内的这些第二对象信息具有对应的第二图像特征。


6.如权利要求5所述的跨语言信息建构方法,还包含:
以该处理器依据这些第二标签数据对每一该目标图像群组内的这些第二对象信息执行一标签分群任务,以形成这些目标标签群组,其中每一该目标标签群组内的这些第二对象信息具有对应的该第二标签特征。


7.一种跨语言信息处理方法,包含:
以一系统的一处理器建构对应一本地语言的一第一数据结构与对应一目标语言的一第二数据结构;
以该系统的一操作接口接收一目标对象信息,并且以该处理器提取该目标对象信息的特征数据;
以该系统依据所提取的该目标对象信息的特征数据而从对应该本地语言的该第一数据结构当中选取一第一关联图像群;
以该系统依据该第一关联图像群执行一跨语言比对任务而从对应该目标语言的该第二数据结构当中选取一第二关联图像群;
以该系统依据该第二关联图像群而输出多个候选对象图像;以及
以该系统依据一用户指令选取这些候选对象图像当中的一候选对象图像作为一目标对象图像;
其中,该目标对象信息的特征数据包含关于该目标对象信息的一图像特征与一词语特征。


8.如权利要求7所述的跨语言信息处理方法,其中以该系统依据所提取的该目标对象信息的特征数据而从该本地语言的该第一数据结构当中选取该第一关联图像群包含:
以该系统从该第一数据结构内的多个本地图像群组当中选取一个本地图像群组作为该第一关联图像群,其中所选取的该本地图像群组对应的第一图像特征与该目标对象信息的该图像特征相符合。


9.如权利要求8所述的跨语言信息处理方法,其中该跨语言比对任务包含:
以该系统依据作为该第一关联图像群的该本地图像群组的第一图像特征而对该目标语言的该第二数据结构内的多个目标图像群组进行比对,以从这些目标图像群组当中选取出一个目标图像群组作为该第二关联图像群,其中所选取的该目标图像群组对应的第二图像特征与所选取的该本地图像群组对应的第一图像特征相符合。


10.如权利要求8所述的跨语言信息处理方法,还包含:
以该处理器依据该第一数据结构内的多个第一对象信息所具有的多个第一图像数据而对这些第一对象信息执行一图像分群任务,以形成这些本地图像群组,其中每一该本地...

【专利技术属性】
技术研发人员:萧羽廷梁哲玮陈圣轩徐道婷蔡雅芳
申请(专利权)人:财团法人工业技术研究院
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1