(19)国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202210963914.2
(22)申请日 2022.08.11
(71)申请人 华侨大学
地址 362000 福建省泉州市城华北路269号
申请人 陕西识代运筹信息科技股份有限公
司
(72)发明人 谢朝武 李哲君 卫华飞 曾怡
(74)专利代理 机构 泉州市文华专利代理有限公
司 35205
专利代理师 陈雪莹
(51)Int.Cl.
G06Q 10/04(2012.01)
G06Q 50/26(2012.01)
G06F 16/9537(2019.01)
(54)发明名称
一种基于大数据平台的景区接待人数预判
方法和装置
(57)摘要
本发明公开了一种基于大数据平台的景区
接待人数预判方法和装置, 利用大数据平台实时
获取当前游 客量、 相关景点的火车票订购数量以
及地图APP中关与某景点的搜索次数, 采用即时
学习(Just ‑In‑Time Learning,JITL)的软测量
建模方法, 利用当前时刻的前一段数据从历史数
据中寻找 最近近邻匹配数据进行局部建模, 对景
区的实时游 客进行自适应更新和预测, 对景区游
客的饱和量预测及判断起到积极的决策作用。
权利要求书4页 说明书11页 附图1页
CN 115239016 A
2022.10.25
CN 115239016 A
1.一种基于大 数据平台的景区接待人 数预判方法, 其特 征在于, 包括:
步骤10、 基于大数据平台, 实时获取指定景区火车票的预定数据以及电子地图中指定
景区的实时搜索次数, 将所述火车票的预定数据和实时搜索次数按时间维度整合, 得到历
史数据集;
步骤20、 获取当前的指定景区火车票的预定数据以及电子地图中指定景区的实时搜索
次数输入作为测试数据集, 通过云模型对历史数据集中的所有样本与测试数据集进行相似
性度量, 取 前k个样本作为测试 数据集的近邻域数据;
步骤30、 以指定景区下一 时刻的游客数量为因变量, 以所述近邻域数据为自变量, 引入
拉格朗日乘子求出自变量的权重向量和因变量的权重向量, 然后提取自变量潜在变量的因
子和因变量潜在变量的因子以及二者之 间的回归系数, 接着 计算自变量和因变量的残差空
间, 训练偏最小二乘法模型使残差空间达到最小值, 最后建立残差空间之间的线性回归方
程并逆标准 化, 得到所述测试 数据集对应的局部模型;
步骤40、 将当前的指定景区火车票的预定数据以及电子地图中指定景区的实时搜索次
数输入所述局部模型模型, 得到指定景区下一时刻的游客数量估计值。
2.根据权利要求1所述的方法, 其特征在于: 所述步骤20中, 通过云模型对历史数据集
中的所有样本与测试 数据集进行相似性度量, 具体包括:
步骤21: 计算指定景区火车票的预定数据以及电子地图中指定景区的实时搜索次数定
量值xi的样本均值
一阶样本绝对中心矩
样本方差
步骤22: 由步骤21中的样本均值计算得到云 分布的期望值:
步骤23: 由步骤21中的样本均值和步骤22中的云分布的期望值计算得到云分布的熵:
步骤24: 由步骤21中的样本方差和步骤23中的云分布的熵计算可得云分布的超熵:
步骤25、 按步骤21至步骤24的方法计算历史数据集的云模型数字特征以及测试数据集
云模型数字特征, 然后计算历史数据集的云模 型数字特征与测试数据的云模型数字特征的
相似性, 公式如下:
其中, α =(Exα,Enα,Heα)代表历史数据集的云模型数字特征, β =(Exβ,Enβ,Heβ)代表测
试数据集的云模型 数字特征。
3.根据权利要求1所述的方法, 其特 征在于: 所述 步骤30具体包括:
步骤31、 以指定景区火车票的预定数据以及电子地图中指定景区的实时搜索次数为样
本输入量p, 以景点接待人数为样本输出量q, 则有p个输入量{x1,x2…xp}和q个输出量{y1,权 利 要 求 书 1/4 页
2
CN 115239016 A
2y2…yq}为样本, 输入数据矩阵X∈Rn×p,输出数据矩阵Y∈Rn×q; 设X和Y的第一个主成分轴向
量分别为w1(p×1)和c1(q×1), 且均为单位向量, 则由w1和c1表示出X和Y的第一个主成分t1
和u1, 其中t1=X*w1, u1=Y*c1;
步骤32、 采用偏最小二乘法使t1和u1的相关性 最大化, 公式如下:
Maximize<Xw1,Yc1>,Subject to:||w1||=1,||c1||=1
其中, Maximize<Xw1,Yc1>表示t1和u1之间的相关性最大化, t1是X的第一个成分, t1是X
的第一个轴, 它是一个单位向量, 即有 ||w1||=1, 同理得| |c1||=1;
步骤33、 引入拉格朗日乘子的方法求出自变量的权重向量wk和因变量的权重向量ck, 其
中wk是u'kvkv'kuk的最大特征根对应的特征向量, ck为v'kuku'kvk的最大特征根对应的特征
向量; 其自变量潜在变量tk和因变量的潜在变量sk计算为:
tk=uk‑1wk
sk=vk‑1ck
步骤34、 提取自变量潜在变量和因变量潜在变量 的因子负荷pk和qk以及二者之间的回
归系数bk:
p'k=(t'ktk)‑1t'kuk‑1
q'k=(t'ktk)‑1t'kvk‑1
b'k=(t'ktk)‑1t'ksk
步骤35、 计算自变量x和因变量y的残差空间uk、 vk:
uk=uk‑1‑tkp'k
vk=vk‑1‑tkq'k
步骤36、 判断残差空间uk和vk是否达到最小值, 如果没有达到最小值则返回步骤32, 如
果达到最小值, 建立uk和vk之间的线性回归方程:
v=uβ
步骤36、 通过逆标准 化, 得到因变量Y和自变量X的回归方程:
Y=Xβ 。
4.一种基于大数据平台的景区接待人数预判装置, 其特征在于, 包括: 数据预处理模
块、 云模型相似性度量模块、 局部模型构建模块以及预测输出模块;
所述数据预处理模块, 用于基于大数据平台, 实时获取指定景区火车票的预定数据以
及电子地图中指定景区的实时搜索次数, 将所述火车票的预定数据和实时搜索次数按时间
维度整合, 得到历史数据集;
所述云模型相似性度量模块, 用于获取当前的指定景区火车票的预定数据以及电子地
图中指定景区的实时搜索次数输入作为测试数据集, 通过云模型对历史数据集中的所有样
本与测试 数据集进行相似性度量, 提取 前k个样本作为测试 数据集的近邻域数据;
所述局部模型构建模块, 用于以指定景区下一时刻的游客数量为因变量, 以所述近邻
域数据为自变量, 引入拉格朗日乘子求出自变量的权重 向量和因变量的权重 向量, 然后提
取自变量潜在变量的因子和因变量潜在变量的因子以及二者之 间的回归系数, 接着 计算自
变量和因变量的残差空间, 训练偏最小二乘法模型使残差空间达到最小值, 最后建立残差权 利 要 求 书 2/4 页
3
CN 115239016 A
3
专利 一种基于大数据平台的景区接待人数预判方法和装置
文档预览
中文文档
17 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
温馨提示:本文档共17页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 SC 于 2024-02-24 00:41:24上传分享