【技术实现步骤摘要】
【技术保护点】
一种基于信息指纹的相似信息识别方法,其特征在于:所述的方法包括以下步骤:对文档的文本进行中文分词;统计词频,取出词频靠前的词,作为特征值;根据提取出来的特征值计算出文档的信息指纹;比对两篇文档的信息指纹,若比对结果大于阀值,则判断为相似文章。
【技术特征摘要】
【专利技术属性】
技术研发人员:戴森,
申请(专利权)人:广州一呼百应网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。