一种对企业信息中自然语义的专家学习拟合方法及系统技术方案

技术编号：16456200 阅读：39 留言：0更新日期：2017-10-25 20:41

本发明专利技术提出了一种对企业信息中自然语义的专家学习拟合方法及系统，包括：爬取互联网上的企业名称和企业信息；对获取的企业信息进行分词操作；建立企业搜索网站，允许用户输入企业名称或关键词进行搜索，检测用户点击的词汇，并自动启动对该词汇的搜索；统计用户对各个词语的点击频率，过滤出点击频率高的多个词汇作为该企业的特征词汇，并利用上述词汇创立一个新型的字典；将企业之间共同的特征作为连接点，连接不同的企业，以形成企业之间的关联关系图；根据企业之间的关联关系图，搜索出与该企业相关的业务关联企业。本发明专利技术引入专家交互学习系统，学习到有关产业链结构的知识，进而自动拟合出相关企业之间的产业链结构。

An expert learning fitting method and system for natural semantic in enterprise information

The invention provides an expert on natural semantic learning and enterprise information system, the fitting method comprises the following steps: crawling on the Internet business name and business information; word segmentation operation to obtain the enterprise information; the establishment of enterprise search website, allows the user to enter the business name or keyword search, the user clicks on the detection of vocabulary. The vocabulary of the search and start automatically; the user clicks on each word frequency statistics, filter out the high frequency of multiple click words as the feature words of the enterprise, and the creation of a new vocabulary dictionary; will the common characteristics between enterprises as a connection point, the connection of different enterprises to form between enterprises the relationship between enterprises; according to the relation graph, the search business enterprises associated with the company. The invention introduces an expert interactive learning system to learn the knowledge of the industrial chain structure, and automatically fits the industrial chain structure between the related enterprises.

全部详细技术资料下载

【技术实现步骤摘要】
一种对企业信息中自然语义的专家学习拟合方法及系统
本专利技术涉及计算机网络
，特别涉及一种对企业信息中自然语义的专家学习拟合方法及系统。
技术介绍
现有的企业信息综合网站，大都是对企业信息的简单罗列，并且是主要针对单一企业的信息汇总和分析。现有技术的缺点是存在缺少一种对企业之间的相互关系进行分析的方式。其中，如何分析各个企业的基本信息，然后通过自然语义的方式对企业信息的含义进行识别，以实现计算机自动化对该企业关系分析，是当前需要解决的技术问题。
技术实现思路
本专利技术的目的旨在至少解决所述技术缺陷之一。为此，本专利技术的目的在于提出一种对企业信息中自然语义的专家学习拟合方法及系统。为了实现上述目的，本专利技术的实施例提供一种对企业信息中自然语义的专家学习拟合方法，包括：步骤S1，爬取互联网上的企业名称和企业信息；步骤S2，对获取的企业信息进行分词操作；步骤S3，建立企业搜索网站，允许用户输入企业名称或关键词进行搜索，在向用户显示企业时，将分词信息嵌入到企业介绍中，以在接收到用户的点击操作时，检测用户点击的词汇，并自动启动对该词汇的搜索；步骤S4，统计用户对各个词语的点击频率，过滤出点击频率高的多个词汇作为该企业的特征词汇，并利用上述词汇创立一个新型的字典，所述字典记录有该企业的产业链特征词汇；步骤S5，将企业之间共同的特征作为连接点，连接不同的企业，以形成企业之间的关联关系图；步骤S6，根据所述企业之间的关联关系图，搜索出与该企业相关的业务关联企业。进一步，在所述步骤S1中，爬取的数据源包括：企业官网、广告黄页、行业门户。进一步，在所述步骤S2中，采用...
一种对企业信息中自然语义的专家学习拟合方法及系统

【技术保护点】
一种对企业信息中自然语义的专家学习拟合方法，其特征在于，包括如下步骤：步骤S1，爬取互联网上的企业名称和企业信息；步骤S2，对获取的企业信息进行分词操作；步骤S3，建立企业搜索网站，允许用户输入企业名称或关键词进行搜索，在向用户显示企业时，将分词信息嵌入到企业介绍中，以在接收到用户的点击操作时，检测用户点击的词汇，并自动启动对该词汇的搜索；步骤S4，统计用户对各个词语的点击频率，过滤出点击频率高的多个词汇作为该企业的特征词汇，并利用上述词汇创立一个新型的字典，所述字典记录有该企业的产业链特征词汇；步骤S5，将企业之间共同的特征作为连接点，连接不同的企业，以形成企业之间的关联关系图；步骤S6，根据所述企业之间的关联关系图，搜索出与该企业相关的业务关联企业。

【技术特征摘要】
1.一种对企业信息中自然语义的专家学习拟合方法，其特征在于，包括如下步骤：步骤S1，爬取互联网上的企业名称和企业信息；步骤S2，对获取的企业信息进行分词操作；步骤S3，建立企业搜索网站，允许用户输入企业名称或关键词进行搜索，在向用户显示企业时，将分词信息嵌入到企业介绍中，以在接收到用户的点击操作时，检测用户点击的词汇，并自动启动对该词汇的搜索；步骤S4，统计用户对各个词语的点击频率，过滤出点击频率高的多个词汇作为该企业的特征词汇，并利用上述词汇创立一个新型的字典，所述字典记录有该企业的产业链特征词汇；步骤S5，将企业之间共同的特征作为连接点，连接不同的企业，以形成企业之间的关联关系图；步骤S6，根据所述企业之间的关联关系图，搜索出与该企业相关的业务关联企业。2.如权利要求1所述的对企业信息中自然语义的专家学习拟合方法，其特征在于，在所述步骤S1中，爬取的数据源包括：企业官网、广告黄页、行业门户。3.如权利要求1所述的对企业信息中自然语义的专家学习拟合方法，其特征在于，在所述步骤S2中，采用字典匹配法、词频统计法进行分词操作。4.如权利要求1所述的对企业信息中自然语义的专家学习拟合方法，其特征在于，在所述步骤S4中，将点击频率高的词汇以特殊标记进行突出显示。5.如权利要求1所述的对企业信息中自然语义的专家学习拟合方法，其特征在于，在所述步骤S5中，所述企业之间共同的特征包括：多个企业的特征词汇中的相同词汇或近义词。6.一种对企业信息中自然语义的专家学...

【专利技术属性】
技术研发人员：辛柯俊，
申请(专利权)人：辛柯俊，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人