全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202210324312.2 (22)申请日 2022.03.29 (71)申请人 西北大学 地址 710069 陕西省西安市太华北路2 29号 (72)发明人 宋小烜 高东怀  (74)专利代理 机构 北京高沃 律师事务所 1 1569 专利代理师 刘芳 (51)Int.Cl. G06F 16/951(2019.01) G06F 16/9535(2019.01) G06F 16/955(2019.01) G06F 16/33(2019.01) G06F 16/335(2019.01) G06F 40/289(2020.01) G06F 40/30(2020.01) (54)发明名称 一种高考志愿填报推荐方法及系统 (57)摘要 本发明涉及一种高考志愿填报推荐方法及 系统, 涉及数据处理技术领域, 方法包括获取维 基百科数据和考生输入的意向信息; 利用爬虫技 术获取历史招录信息; 根据所述维基百科数据和 所述历史招录信息训练词向量; 根据所述词向量 和所述意向信息进行相似度匹配, 得到相似度; 根据所述相似度确定高考志愿推荐结果。 本发明 能够提高对高考志愿推荐的准确性。 权利要求书1页 说明书5页 附图3页 CN 114637904 A 2022.06.17 CN 114637904 A 1.一种高考志愿填报推荐方法, 其特 征在于, 包括: 获取维基百 科数据和考 生输入的意向信息; 利用爬虫技 术获取历史招录信息; 根据所述维基百 科数据和所述历史招录信息训练词向量; 根据所述词向量和所述 意向信息进行相似度匹配, 得到相似度; 根据所述相似度确定高考志愿推荐结果。 2.根据权利要求1所述的高考志愿填报推荐方法, 其特征在于, 所述利用爬虫技术获取 历史招录信息, 具体包括: 获取网页的URL并将所述网页的URL作为种子; 将所述种子 置入待抓取的URL队列; 对所述待抓取的URL队列进行爬取 得到种子的URL; 利用DNS对所述种子的URL进行解析, 得到链接地址; 根据所述链接地址下 载历史招录信息 。 3.根据权利要求2所述的高考志愿填报推荐方法, 其特征在于, 在所述根据所述链接地 址下载历史招录信息之后还 包括: 将所述种子的URL置入已抓取队列。 4.根据权利要求3所述的高考志愿填报推荐方法, 其特征在于, 所述获取网页的URL并 将所述网页的URL作为种子具体包括: 判断所述网页的URL是否位于所述已抓取队列, 得到判断结果; 若是, 则重新获取网页的URL; 若否, 则获取网页的URL并将所述网页的URL作为种子 。 5.根据权利要求1所述的高考志愿填报推荐方法, 其特征在于, 在所述根据所述维基百 科数据和所述历史招录信息训练词向量之前, 还 包括: 对所述维基百 科书和所述历史招录信息依次进行去重和分词处 理。 6.根据权利要求1所述的高考志愿填报推荐方法, 其特征在于, 所述根据 所述维基百科 数据和所述历史招录信息训练词向量, 具体包括: 利用Word2vec模型根据所述维基百 科数据和所述历史招录信息训练词向量。 7.根据权利要求1所述的高考志愿填报推荐方法, 其特征在于, 所述相似度根据余弦距 离确定。 8.一种高考志愿填报推荐系统, 其特 征在于, 包括: 获取模块, 用于获取维基百 科数据和考 生输入的意向信息; 爬取模块, 用于利用爬虫技 术获取历史招录信息; 训练模块, 用于根据所述维基百 科数据和所述历史招录信息训练词向量; 相似度匹配模块, 用于根据所述词向量和所述 意向信息进行相似度匹配, 得到相似度; 高考志愿推荐结果确定模块, 用于根据所述相似度确定高考志愿推荐结果。权 利 要 求 书 1/1 页 2 CN 114637904 A 2一种高考志 愿填报推荐方 法及系统 技术领域 [0001]本发明涉及数据处 理领域, 特别是 涉及一种高考志愿填报推荐方法及系统。 背景技术 [0002]现有志愿填报推荐网站和系统对志愿文本语义分析理解能力弱, 推荐结果个性化 程度不足, 无法满足考 生和家长需求的现状和问题。 发明内容 [0003]本发明的目的是提供一种高考志愿填报推荐方法及系统, 以提高对高考志愿推荐 的准确性。 [0004]为实现上述目的, 本发明提供了如下 方案: [0005]一种高考志愿填报推荐方法, 包括: [0006]获取维基百 科数据和考 生输入的意向信息; [0007]利用爬虫技 术获取历史招录信息; [0008]根据所述维基百 科数据和所述历史招录信息训练词向量; [0009]根据所述词向量和所述 意向信息进行相似度匹配, 得到相似度; [0010]根据所述相似度确定高考志愿推荐结果。 [0011]可选地, 所述利用爬虫技 术获取历史招录信息, 具体包括: [0012]获取网页的URL并将所述网页的URL作为种子; [0013]将所述种子 置入待抓取的URL队列; [0014]对所述待抓取的URL队列进行爬取 得到种子的URL; [0015]利用DNS对所述种子的URL进行解析, 得到链接地址; [0016]根据所述链接地址下 载历史招录信息 。 [0017]可选地, 在所述 根据所述链接地址下 载历史招录信息之后还 包括: [0018]将所述种子的URL置入已抓取队列。 [0019]可选地, 所述获取网页的URL并将所述网页的URL作为种子具体包括: [0020]判断所述网页的URL是否位于所述已抓取队列, 得到判断结果; [0021]若是, 则重新获取网页的URL; 若否, 则获取网页的URL并将所述网页的URL作为种 子。 [0022]可选地, 在所述根据所述维基百科数据和所述历史招录信息训练词向量之前, 还 包括: [0023]对所述维基百 科书和所述历史招录信息依次进行去重和分词处 理。 [0024]可选地, 所述 根据所述维基百 科数据和所述历史招录信息训练词向量, 具体包括: [0025]利用Word2vec模型根据所述维基百 科数据和所述历史招录信息训练词向量。 [0026]可选地, 所述相似度根据余弦距离确定 。 [0027]一种高考志愿填报推荐系统, 包括:说 明 书 1/5 页 3 CN 114637904 A 3

.PDF文档 专利 一种高考志愿填报推荐方法及系统

文档预览
中文文档 10 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共10页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种高考志愿填报推荐方法及系统 第 1 页 专利 一种高考志愿填报推荐方法及系统 第 2 页 专利 一种高考志愿填报推荐方法及系统 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-18 17:47:52上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。