杭州费尔斯通科技有限公司专利技术

杭州费尔斯通科技有限公司共有61项专利

  • 本发明公开了一种基于GAN聚类的文本清洗方法及系统,首先构建包含生成网络、编码网络和判别网络的GAN网络,通过编码网络得到文本的隐变量和文本类型分布向量,将隐变量+文本类型分布向量作为文本的向量表示,取平均值作为文本类型的锚向量;对于待...
  • 本申请涉及一种基于词典的语言理解模型的测评方法和系统,其中,该方法包括:通过从预设词典集中获取预设词典对,确定预设词典对中相同的单词为共有词集,根据共有词从预设词典对中得到第一义项集和第二义项集;通过预设相似度模型,分别计算第一义项集中...
  • 本申请涉及一种基于词频的实体匹配方法、系统、设备和介质,其中,该方法包括:对若干实体数据中的别名进行分词,得到第一分词列表和别名词集合,统计得到别名词集合中词语的词频数据,将第一分词列表中存在的城市词剔除,得到第二分词列表,根据词频数据...
  • 本申请涉及一种基于区块链的医疗数据共享方法和系统,其中,该方法包括:通过第一医疗节点对医疗数据进行哈希运算,再通过第一医疗节点对应的私钥进行签名生成医疗信息记录,调用区块链上部署的智能合约将医疗信息记录上链存证;通过第二医疗节点获取需要...
  • 本申请涉及基于双链的疫情物资调度方法和系统,其中,该方法包括:通过医疗节点将疫情信息上传到疫情信息链中,物资捐赠节点获取物资信息和交付证明,根据交付证明将物资信息实时共识存储到物资调度链中,数据中心节点获取疫情信息和物资信息,并使用大数...
  • 本申请涉及一种基于上位词的分词修正方法、系统、电子装置和存储介质,通过获取分词工具对目标文本的分词结果,其中,分词结果包括分词工具输出的多个分词及对应的词性;根据分词结果获取目标文本中的主语,获取主语的最终上位词,其中,主语的最终上位词...
  • 本申请涉及一种基于词语解释的文本增强的方法和系统,其中,该方法包括:获取待测文本,并获取该待测文本中目标词的解释句;接着对待测文本进行预处理,对以目标词为标签的文本分类任务,将目标词的解释句设置为标签,对不以目标词为标签的文本分类任务,...
  • 本申请涉及一种层级性多元标签文本分类的方法和系统,其中,该方法包括:获取文本序列,并通过BERT预训练模型对文本序列进行词向量初始化,得到文本矩阵;通过双流模型对文本矩阵进行处理,分别得到全局类别信息和局部类别信息,其中,双流模型包括全...
  • 本申请涉及一种基于关键词的文本标记方法,其中,该方法包括:获取训练数据,训练数据包括:文本、标签和与标签相关的关键词;将文本和关键词分别进行词语列表表示,得到文本词语列表和关键词词语列表,将关键词词语列表连接至标签得到第一句子;以文本词...
  • 本申请涉及一种文本大规模分类的方法和系统,其中,该方法包括:通过获取数据库中初始已分类文本的第一simhash值,计算出待分类文本的第二simhash值,并将两者进行比对,得到初始已分类文本与待分类文本的距离,从初始已分类文本的每种类别...
  • 本申请涉及一种产业大数据安全共享的方法、系统、电子装置和存储介质,其中,该方法包括:获取产业数据,企业通过哈希算法计算得到产业数据Hash值,通过政府机构公钥对产业数据加密,得到产业数据密文,并对产业数据密文和产业数据Hash值进行私钥...
  • 本申请涉及一种基于无标注语料的实体匹配方法和系统,其中,该方法包括:通过对目标语料进行分割,得到若干候选实体,并计算得出候选实体的统计信息,获取种子实体集,根据种子实体集和候选实体的统计信息,从候选实体中判断选取出与种子实体最接近的实体...
  • 本申请涉及一种基于实体词列表的实体识别方法和装置,其中,该方法包括:通过将预设语料中的所有句子分割得到若干子序列,记录子序列在预设语料中的位置,统计子序列在预设语料中出现的次数,根据实体词列表设置子序列的标签,计算子序列的特征集合和先验...
  • 本申请涉及一种Web端项目表单设计器的实现方法和系统,其中,该方法包括:获取添加表单组件的组件创建请求,对项目表单设计器中的基础控件进行属性配置和排序,生成表单组件,获取添加表单模板的模板创建请求,对项目表单设计器中的表单组件和基础控件...
  • 本申请涉及一种数据迁移的方法、系统、电子装置和存储介质,其中,该方法包括:获取关系型数据库中数据表结构信息,并根据映射关系表对数据表结构信息进行相应的转换;接着对数据进行筛选,并设置新的全局UUID
  • 本申请涉及一种领域迁移学习的实体识别方法、系统和设备,其中,该方法包括:用训练好的序列标注模型提取源语料和目标语料中实体的文本特征,建立训练样本,对训练样本的文本特征分别进行主成分分析,得到源域特征空间和目标域特征空间,进而计算得到测地...
  • 本申请涉及一种基于实体扩展的实体识别方法和系统,其中,该方法包括:通过多种短语挖掘方法对无标签语料的句子进行分割,得到概念词候选集,其中,概念词候选集包含若干概念词,通过词嵌入算法对概念词进行训练,得到概念词的词向量,根据词向量计算概念...
  • 本申请涉及一种命名实体识别模型的训练方法和命名实体识别的方法,通过获取训练集,其中,训练集为目标领域相近领域的标注样本;用训练集对命名实体识别模型进行训练,每轮训练包括:将训练查询集和训练支持集输入到命名实体识别模型的BERT层,获取训...
  • 本申请涉及一种扩展图数据库存储结构方法、系统、设备和储存介质,该方法包括:图数据库中的属性数据包括第一属性数据和第二属性数据,通过将图数据库中的属性数据进行预设命名处理,通过预设过滤处理将图数据库中的第一属性数据和第二属性数据分开,其中...
  • 本发明公开了一种基于领域适应的少样本实体识别方法,该方法首先选取支点特征,将源领域和目标领域出现频次均最高的词组作为支点特征词,将支点特征实例化,形成支点特征集。然后建立训练数据集,训练支点特征分类器,全部支点特征构成系数矩阵,表示非支...