基于社交网络的对象分类方法及装置制造方法及图纸

技术编号：12280317 阅读：117 留言：0更新日期：2015-11-05 16:06

本发明专利技术公开了一种基于社交网络的对象分类方法及装置，属于计算机技术领域。所述方法包括：获取对象的特征信息；将特征信息表示成语义向量，语义向量用于反映各个分词在特征信息中同时出现时的相关性特征；将对象的特征信息的语义向量输入预定分类器，得到对象被分类后的初始类别。本发明专利技术通过将对象的特征信息表示成语义向量，将该语义向量输入预定分类器，得到对象被分类后的初始类别；解决了现有技术中由于用户信息和群组信息有数亿的规模，空间向量的维度非常大，导致计算的时间复杂度与空间复杂度都非常大，严重损害到向量空间模型的处理效率以及性能的问题；达到了可以大大降低计算的复杂度，提高向量空间模型的处理效率以及性能的效果。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及计算机
，特别涉及一种基于社交网络的对象分类方法及装置。
技术介绍
社交网络通常具有庞大的用户群，这些用户相互交流分享形成很多群组。由于用户有不同的兴趣，因此他们相互形成的群组也有不同的偏好，譬如〃篮球〃类群，"小区〃类群，"瑜伽"类群等。用户要从这海量的数据中找到与自己有类似兴趣的用户或者相似偏好的群组是相当困难的。因此急需一种能够自动地把兴趣相同的用户或者话题相似的群组进行整理归类的聚类方法。在传统的对用户或者群组进行整理归类的聚类方法中，首先把每一个用户信息或每一个群组信息用0/1表示方法（即对于每条用户信息或群组信息所对应的特征信息，如果某些分词在该特征信息中出现，则将对应的用于表示该分词的向量值设置为1，否则将用于表示该分词的向量值设置为〇)表示成空间向量，该空间向量的维度为全部特征的总词数；然后基于特征信息的空间向量利用分类器VSM(VectorSpaceModel，向量空间模型）进行聚类分析。在实现本专利技术的过程中，专利技术人发现现有技术至少存在以下问题：由于用户信息和群组信息有数亿的规模，空间向量的维度非常大，导致计算的时间复杂度与空间复杂度都非常大，甚至还会严重损害到向量空间模型的处理效率以及性能。
技术实现思路
为了解决现有技术中由于用户信息和群组信息有数亿的规模，空间向量的维度非常大，导致计算的时间复杂度与空间复杂度都非常大，甚至还会严重损害到向量空间模型的处理效率以及性能的问题，本专利技术实施例提供了一种基于社交网络的对象分类方法及装置。所述技术方案如下：第一...

【技术保护点】
一种基于社交网络的对象分类方法，其特征在于，所述方法包括：获取对象的特征信息；将所述特征信息表示成语义向量，所述语义向量用于反映各个分词在所述特征信息中同时出现时的相关性特征；将所述对象的特征信息的语义向量输入预定分类器，得到所述对象被分类后的初始类别。

【技术特征摘要】

【专利技术属性】
技术研发人员：余建兴，易玲玲，贺鹏，陈川，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人