专业英语词库的建构方法及系统技术方案

技术编号:9295778 阅读:102 留言:0更新日期:2013-10-31 00:22
本发明专利技术揭示了一种专业英语词库的建构方法,包括如下步骤:S1、抓取电子行业网站上的网页信息;S2、提取所述网页信息中的文本信息;S3、对所述文本信息进行分词,以获取若干词条;S4、判断所述词条是否为本行业的专业词条,若是,将该词条存储于专业英语词库中;若否,对该词条进行剔除。与现有技术相比,本发明专利技术通过在本行业内各大网站上抓取网页信息,并通过分词获取大批专业英语词汇,从而提高所建立的专业英语词库的完整度,且减小了人工编译所带来的成本。

【技术实现步骤摘要】

【技术保护点】
一种专业英语词库的建构方法,其特征在于,该方法包括如下步骤:S1、抓取电子行业网站上的网页信息;S2、提取所述网页信息中的文本信息;S3、对所述文本信息进行分词,以获取若干词条;S4、判断所述词条是否为本行业的专业词条,若是,将该词条存储于专业英语词库中;若否,对该词条进行剔除。

【技术特征摘要】

【专利技术属性】
技术研发人员:苏公雨
申请(专利权)人:苏州引角信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1