下载一种基于PTB模型的主题爬虫方法、系统及存储介质的技术资料

文档序号:41678209

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。

本发明公开了一种基于PTB模型的主题爬虫方法、系统及存储介质,属于计算机网络信息获取技术领域,方法包括:依次爬取种子URL集,获取种子URL集内部的所有URL链接并依次放入URL队列中;对URL队列中的URL链接进行过滤,并对经过过滤的UR...
该专利属于南京工程学院所有,仅供学习研究参考,未经过南京工程学院授权不得商用。

详细技术文档下载地址

温馨提示:您尚未登录,请点 登陆 后下载,如果您还没有账户请点 注册 ,登陆完成后,请刷新本页查看技术详细信息。