武汉数博科技有限责任公司专利技术

武汉数博科技有限责任公司共有13项专利

  • 本发明公开了一种基于PDF的论文解析方法及装置,该生成方法包括:基于待分析论文进行文字识别和语种识别,得到顺序排列的多个初始文字块及对应信息;统计得到待分析论文中每一栏的顶点坐标;基于多个初始文字块进行段落合并,得到顺序排列的多个基础文...
  • 本发明公开了一种科技文档前沿性量化评分方法、相关方法及装置,该方法包括:提取待分析文档中的各待分析研究要素及其类别;针对每个待分析研究要素,根据预先构建的前沿性计算图谱获取待分析研究要素的前沿评分和各相关研究要素,确定每个相关研究要素的...
  • 本发明涉及一种用于文件合规性审计的审计线索确定方法及装置,该方法包括:将法律法规集合中的每一法律法规文件转换为分析树,得到分析树集合;使用行为描述判断训练数据集和行为极性分析训练数据集分别训练得到行为描述判断模型和行为极性分析模型;基于...
  • 本发明公开了一种基于语义分割的表格识别方法及装置,该方法包括:将获取的表格图像输入框线检测模型,得到横线图像和竖线图像;基于所述横线图像与所述竖线图像进行像素过滤、直线缺失补偿和连通域替换,得到框线图像以及所述框线图像中每个单元格的区域...
  • 本申请公开了一种面向多业务视角的知识图谱构建方法、装置、设备及介质。该方法包括构建由多个业务视角面构成的数据场;在数据场中,对于每一预先定义的业务视角面,获取业务视角面下各业务数据对应的各实体类型;根据每一业务视角面下各业务数据对应的实...
  • 本发明公开了一种基于产学研数据库的作者姓名消歧方法及装置,该方法包括:基于获取的研究人员‑成果数据进行数据采集和清洗,得到唯一库和计算库;基于唯一库,构建研究方向‑词的关联系数;根据研究方向‑词的关联系数,计算得到唯一库中的研究人员对应...
  • 本发明公开了一种基于直播带货视频的商品识别方法及装置,该方法包括:基于直播带货视频得到主播解说文字和视频文字;基于主播解说文字和视频文字进行词向量转换,得到文本模态的特征矩阵;基于直播带货视频获取目标图像,提取得到目标图像的属性集合;将...
  • 本发明公开一种论文查重方法、系统和设备,该方法通过针对每种预设类型的字段信息,提取待查重论文的对应的至少一个字段信息,获取预设论文库中与每种预设类型的字段信息对应的对比论文,得到论文对比子库,筛选出了最有可能与待查重论文重复的对比论文,...
  • 本发明提出了一种改进BERT训练模型及一种命名实体识别方法、系统,该改进BERT训练模型包括传统BERT模型、强化位置编码层、分类层。强化位置编码层用于提取各字符任务向量中的位置向量,将位置向量与预设参数矩阵相乘,得到与第一语义特征向量...
  • 本发明公开了一种句法依存分析方法,本方法按预设规则生成与文本信息的每个节点对应的用于表示该节点与相邻节点依存关系的标签;根据文本信息及所述各节点的标签信息按预设规则生成相邻节点的依存关系,输出依存关系,并将该依存关系中的叶子节点删除,最...
  • 本发明公开了一种文本自动摘要方法,包括将待摘要文档按照预定义的句子结束符号进行分割;根据已有的文本语料库计算分割后每个句子的主题向量;根据两两语句间共同出现的词语数量,确定两两语句的相关度;根据每个句子的主题向量计算两两语句间的语义相似...
  • 一种中文机构名称实时分析方法及系统
    本发明公开了一种中文机构名称实时分析方法及系统。首先集合中文机构库和中文机构自动提取算法构建准全量中文机构词典,然后使用快速匹配算法将相关文本与准全量中文机构名称库进行匹配,并实时获取文本中相关机构的具体信息,同时使用热加载的方式对海量...
  • 一种面向金融领域的知识抽取方法
    本发明涉及了一种面向金融领域的知识提取方法。首先将需要提取的金融领域文本内容进行预处理,采用统一的标签式语言描述待提取文本内容,并对文本中的金融实体内容进行识别;然后采用可定制的知识提取模块从语义层面对文本内容进行快速实时的提取,并对提...
1