System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于自然语言处理和神经网络的留学申请推荐方法及系统技术方案_技高网

基于自然语言处理和神经网络的留学申请推荐方法及系统技术方案

技术编号:40246669 阅读:5 留言:0更新日期:2024-02-02 22:42
本发明专利技术提供一种基于自然语言处理和神经网络的留学申请推荐方法及系统,方法包括获取包含若干条用户数据的训练数据集,对获取到的定量数据进行标准化,对文本数据进行自然语言处理;建立留学申请融合推荐模型,将预处理后的训练数据集输入留学申请融合推荐模型中进行训练优化,获取最优的留学申请融合推荐模型;获取待推荐的用户数据及其对应的留学申请范围信息,计算待推荐的用户数据与其留学申请范围信息的笛卡尔积;最后将计算得到的笛卡尔积输入最优的留学申请融合推荐模型中进行融合推荐;本发明专利技术将定量数据与文本数据融合进行推荐能够有效提高推荐精准度,从而提高留学申请的成功率。

【技术实现步骤摘要】

本专利技术涉及自然语言处理和神经网络,更具体地,涉及一种基于自然语言处理和神经网络的留学申请推荐方法及系统


技术介绍

1、留学涉及多种多样的海外大学及课程信息,传统的留学咨询机构仅凭个人经验很难让咨询工作变得标准化,也难以提供透明、完整的留学信息。留学咨询和推荐服务本是一项高度个性化和智力密集型的服务,如果不结合学生的个人情况进行盲目推荐,那么学生错误地选择留学院校和专业将会为其人生埋下不可预测的隐患。

2、另外,由于每个学校在审核申请时使用的量化和质化度量标准并不相同,在考量时给予同类指标的权重也不同,而且大多学校甚至不会公布具体的录取考量标准,因此学生也无法准确估计被录取的概率,难以制定完善的留学准备计划,这也进一步提高了学生的留学成本。

3、现有技术公开了一种留学申请匹配方法及系统,系统包括:申请装置、连接网络、网络浏览器、网络服务器、预测服务器、申请人预测数据库、学院服务器/学院的数据库以及计算机智能语义库;预测服务器,用于对比所述留学申请人的申请数据和之前被录取学生的申请数据得到第一对比结果;同时用于对比所述留学申请人的申请数据和之前被拒绝学生的申请数据得到第二对比结果;预测服务器与申请人预测数据库连接,将上述的对比结果保存至所述申请人预测数据库的学院预测模型中,再根据留学申请人输入的数据在预测服务器中计算出申请人的录取概率;尽管该现有技术的方案使用了部分量化数据的检索匹配给用户进行推荐,但它没有使用简历信息、实习经历等具体的文本数据作为推荐的依据,仅依靠定量数据进行推荐,会丢失很多的对申请成功率起重要影响作用的文本数据信息,从而影响推荐精准度。


技术实现思路

1、本专利技术为克服上述现有技术仅基于定量数据而造成的推荐精度低的缺陷,提供一种基于自然语言处理和神经网络的留学申请推荐方法及系统,将定量数据与文本数据融合进行推荐能够有效提高推荐精准度,从而提高留学申请的成功率。

2、为解决上述技术问题,本专利技术的技术方案如下:

3、一种基于自然语言处理和神经网络的留学申请推荐方法,包括以下步骤:

4、s1:获取包含若干条用户数据的训练数据集;所述用户数据包括定量数据和文本数据;

5、s2:对获取到的训练数据集进行预处理,所述预处理包括对定量数据进行标准化,以及对文本数据进行自然语言处理;

6、s3:建立留学申请融合推荐模型,将预处理后的训练数据集输入留学申请融合推荐模型中进行训练优化,获取最优的留学申请融合推荐模型;

7、s4:获取待推荐的用户数据及其对应的留学申请范围信息,计算待推荐的用户数据与其留学申请范围信息的笛卡尔积;所述留学申请范围信息包括若干条待申请的留学信息;

8、s5:将计算得到的笛卡尔积输入最优的留学申请融合推荐模型中进行融合推荐,获取每条待申请的留学信息的成功率,完成用户的留学申请推荐。

9、优选地,所述步骤s1中,定量数据包括学业学分绩点、意向地区、目标教育层次、语言成绩、毕业院校和毕业专业;

10、文本数据包括:竞赛获奖经历和实习经历。

11、优选地,所述步骤s2中,对定量数据进行标准化的具体方法为:

12、将用户的学业学分绩点转化成百分制成绩后进行标准化处理,将用户的语言成绩直接进行标准化,将用户的意向地区、目标教育层次、毕业院校和毕业专业分别转化为第一、第二、第三和第四有序编码,完成对定量数据的标准化预处理。

13、优选地,所述步骤s2中,对文本数据进行自然语言处理的具体方法为:将每个用户的文本数据分别输入预设的自然语言处理模型中进行预处理。

14、优选地,所述自然语言处理模型包括依次连接的:词向量层、双向循环子模型和crf层;

15、所述双向循环子模型包括结构相同且并列设置的正向循环神经网络和反向循环神经网络;

16、所述正向循环神经网络和反向循环神经网络均包括若干个依次连接的rnn层。

17、优选地,所述双向循环子模型具体为bi-gru模型或bi-lstm模型;所述rnn层具体为gru层或lstm层。

18、优选地,所述步骤s3中建立的留学申请融合推荐模型具体为sa-net神经网络模型;

19、所述sa-net神经网络模型包括依次连接的特征分组模块、注意力模块和特征融合模块;

20、所述注意力模块包括并列设置的通道注意力子模块和空域注意力子模块。

21、优选地,所述步骤s5中,将计算得到的笛卡尔积输入最优的留学申请融合推荐模型中进行融合推荐,最优的留学申请融合推荐模型计算输出每条待申请的留学信息的二分类置信度,根据二分类置信度获取每条待申请的留学信息的成功率;

22、所述待申请的留学信息包括:待申请的留学院校和留学专业。

23、优选地,所述步骤s5之后还包括:

24、s6:获取待推荐的用户的留学申请结果,根据留学申请结果对所述最优的留学申请融合推荐模型进行反馈优化。

25、本专利技术还提供一种基于自然语言处理和神经网络的留学申请推荐系统,应用上述的一种基于自然语言处理和神经网络的留学申请推荐方法,包括:

26、数据获取单元:用于获取包含若干条用户数据的训练数据集;所述用户数据包括定量数据和文本数据;

27、数据预处理单元:用于对获取到的训练数据集进行预处理,所述预处理包括对定量数据进行标准化,以及对文本数据进行自然语言处理;

28、模型建立和训练单元:用于建立留学申请融合推荐模型,将预处理后的训练数据集输入留学申请融合推荐模型中进行训练优化,获取最优的留学申请融合推荐模型;

29、留学信息计算单元:用于获取待推荐的用户数据及其对应的留学申请范围信息,计算待推荐的用户数据与其留学申请范围信息的笛卡尔积;所述留学申请范围信息包括若干条待申请的留学信息;

30、留学融合推荐单元:用于将计算得到的笛卡尔积输入最优的留学申请融合推荐模型中进行融合推荐,获取每条待申请的留学信息的成功率,完成用户的留学申请推荐。

31、与现有技术相比,本专利技术技术方案的有益效果是:

32、本专利技术提供一种基于自然语言处理和神经网络的留学申请推荐方法及系统,首先获取包含若干条用户数据的训练数据集,用户数据包括定量数据和文本数据;对获取到的训练数据集进行预处理,预处理包括对定量数据进行标准化,以及对文本数据进行自然语言处理;建立留学申请融合推荐模型,将预处理后的训练数据集输入留学申请融合推荐模型中进行训练优化,获取最优的留学申请融合推荐模型;获取待推荐的用户数据及其对应的留学申请范围信息,计算待推荐的用户数据与其留学申请范围信息的笛卡尔积;所述留学申请范围信息包括若干条待申请的留学信息;最后将计算得到的笛卡尔积输入最优的留学申请融合推荐模型中进行融合推荐,获取每条待申请的留学信息的成功率,完成用户的留学申请推荐;

33、本本文档来自技高网...

【技术保护点】

1.一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤S1中,定量数据包括学业学分绩点、意向地区、目标教育层次、语言成绩、毕业院校和毕业专业;

3.根据权利要求2所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤S2中,对定量数据进行标准化的具体方法为:

4.根据权利要求2或3所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤S2中,对文本数据进行自然语言处理的具体方法为:将每个用户的文本数据分别输入预设的自然语言处理模型中进行预处理。

5.根据权利要求4所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述自然语言处理模型包括依次连接的:词向量层、双向循环子模型和CRF层;

6.根据权利要求5所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述双向循环子模型具体为Bi-GRU模型或Bi-LSTM模型;所述RNN层具体为GRU层或LSTM层。

7.根据权利要求6所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤S3中建立的留学申请融合推荐模型具体为SA-NET神经网络模型;

8.根据权利要求7所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤S5中,将计算得到的笛卡尔积输入最优的留学申请融合推荐模型中进行融合推荐,最优的留学申请融合推荐模型计算输出每条待申请的留学信息的二分类置信度,根据二分类置信度获取每条待申请的留学信息的成功率;

9.根据权利要求8所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤S5之后还包括:

10.一种基于自然语言处理和神经网络的留学申请推荐系统,应用权利要求1~9任意一项中所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,包括:

...

【技术特征摘要】

1.一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤s1中,定量数据包括学业学分绩点、意向地区、目标教育层次、语言成绩、毕业院校和毕业专业;

3.根据权利要求2所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤s2中,对定量数据进行标准化的具体方法为:

4.根据权利要求2或3所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述步骤s2中,对文本数据进行自然语言处理的具体方法为:将每个用户的文本数据分别输入预设的自然语言处理模型中进行预处理。

5.根据权利要求4所述的一种基于自然语言处理和神经网络的留学申请推荐方法,其特征在于,所述自然语言处理模型包括依次连接的:词向量层、双向循环子模型和crf层;

6.根据权利要求5所述的一种基于自然语言处理和神经网络的留学申...

【专利技术属性】
技术研发人员:郑誉廖若凡杨方安任宇晟
申请(专利权)人:华南师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1