全网唯一标准王
(19)国家知识产权局 (12)发明 专利申请 (10)申请公布号 (43)申请公布日 (21)申请 号 202211532808.5 (22)申请日 2022.12.02 (71)申请人 陕西湘秦衡兴科技 集团股份有限公 司 地址 710082 陕西省西安市莲湖区高新 三 路财富中心C座2702室 (72)发明人 岳发宇  (51)Int.Cl. G06F 16/174(2019.01) H03M 7/30(2006.01) G06Q 40/04(2012.01) (54)发明名称 一种金融大 数据优化存 储方法 (57)摘要 本发明涉及数据处理技术领域, 具体涉及一 种金融大数据优化存储方法, 该方法包括: 获取 股价数据, 对股价数据进行二进制编码得到二进 制编码数据, 得到多段目标二进制数据, 获取每 段目标二进制数据的最优字典滑窗长度, 对目标 二进制数据进行压缩并存储, 本发 明通过自适应 获取的最优字典滑窗长度, 从而在利用LZ77编码 算法编码时, 实现对数据的高效压缩, 进而减少 压缩后的数据占用的存 储空间。 权利要求书2页 说明书9页 附图2页 CN 115543946 A 2022.12.30 CN 115543946 A 1.一种金融大 数据优化存 储方法, 其特 征在于, 包括: 获取每天的股价数据; 对每天的股价数据进行二进制编码得到二进制编码数据; 获取每相邻 两天的股价数据对应的波动图, 根据波动图中的股价数据获取相邻 两天的 股价数据的平稳程度; 获取相邻 两天的股价数据的差异性值, 根据差异性值和平稳程度获取相邻 两天的股价 数据的关联程度, 根据相 邻两天的股价数据的关联程度判断是否对连续相 邻天的股价数据 所对应的二进制编码数据进行合并, 并得到多段目标二进制数据; 获取每段目标二进制数据中每类相同的数据串出现的频率及对应类的数据串长度, 根 据每类相同的数据串 出现的频率及数据串长度获取每类相同的数据串对应的匹配率, 根据 匹配率、 最高频率数据串的长度和各数据串的长度大小确定目标二进制数据的最优字典滑 窗长度; 利用最优字典滑窗长度将对应的目标二进制数据进行压缩并存 储。 2.根据权利要求1所述的一种金融大数据优化存储方法, 其特征在于, 获取每类相同的 数据串对应的匹配率包括: 获取每类相同的数据串出现的频率与对应 类的数据串长度的目标比值; 以自然常数为底, 以目标比值的负值 为幂得到指数函数值; 将1减去指数函数值得到每 类相同的数据串对应的匹配率。 3.根据权利要求1所述的一种金融大数据优化存储方法, 其特征在于, 得到多段目标二 进制数据包括: 其中, 每段目标二进制数据包括第一目标二进制数据或者第二目标二进制数据; 第一目标二进制数据由连续相邻天的股价数据对应的二进制编码数据构 成, 且连续相 邻天的股价数据中的每相邻两天的股价数据的关联程度均大于关联程度阈值; 第二目标二进制数据由单天的股价数据对应的二进制编码数据构 成, 该单天对应的所 有相邻两天的股价数据的关联程度均小于或者 等于关联程度阈值。 4.根据权利要求1所述的一种金融大数据优化存储方法, 其特征在于, 获取相邻 两天的 股价数据的平稳程度包括: 设定第一权 重系数和第二权 重系数, 且第一权 重系数小于第二权 重系数; 获取波动图的股价数据峰值的方差及股价数据的最大差值; 以最大差值与第一权重系数的乘积为底数, 以第 二权重系数与波动图中股价数据峰值 的方差的乘积的倒数为幂, 得到指数函数值, 并将指数函数值作为相邻两天的股价数据的 平稳程度。 5.根据权利要求1所述的一种金融大数据优化存储方法, 其特征在于, 获取相邻 两天的 股价数据的差异性 值包括: 获取每天的股价数据对应的二进制编码数据中出现频率最高的重复数据串, 并作为目 标数据串; 获取每天的股价数据对应的二进制编码数据中的目标数据串的总长度占二进制编码 数据的总长度的长度比值; 获取相邻两天的股价数据对应的二进制编码数据中目标 数据串对应的长度比值差值;权 利 要 求 书 1/2 页 2 CN 115543946 A 2获取相邻两天的股价数据对应的二进制编码数据中目标 数据串的长度; 根据目标数据串的长度、 目标数据串对应的长度比值差值获取相邻 两天的股价数据的 差异性值。 6.根据权利要求5所述的一种金融大数据优化存储方法, 其特征在于, 相邻 两天的股价 数据的差异性 值的计算公式为: 式中, 表示相邻两天的股价数据中的第 天的股价数据与第 天的股价数据之间 的差异性 值; 表示第 天的股价数据对应的二进制编码数据中所有目标 数据串的总长度; 表示第 天的股价数据对应的二进制编码数据中所有目标 数据串的总长度; 表示第 天的股价数据对应的二进制编码数据的总长度; 表示第 天的股价数据对应的二进制编码数据的总长度; 表示第 天的股价数据对应的二进制编码数据中单个目标 数据串的长度; 表示第 天的股价数据对应的二进制编码数据中单个目标 数据串的长度。 7.根据权利要求1所述的一种金融大数据优化存储方法, 其特征在于, 将相邻 两天的股 价数据对应的平稳程度与对应的差异性 值的比值作为相邻两天的股价数据的关联程度。 8.根据权利要求1所述的一种金融大数据优化存储方法, 其特征在于, 获取相邻 两天的 股价数据对应的波动图包括: 去除每天的股价数据中的最大股价数据和最小股价数据, 得到去除后的目标股价数 据; 根据相邻两天的目标股价数据获取目标股价数据对应的波动图。 9.根据权利要求1所述的一种金融大数据优化存储方法, 其特征在于, 得到二进制编码 数据包括: 将每天的股价数据转 化为流式数据; 对流式数据进行霍夫 曼编码得到二进制编码数据。 10.根据权利要求9所述的一种金融大数据优化存储方法, 其特征在于, 将每天的股价 数据转化为流式数据包括: 将每天的股价数据中的每一次股价波动的股价数据中小数点前预设位数的数据和小 数点后预设位数的数据得到一个多位数的数据; 将每天的股价数据中的每一次股价波动的股价数据与前一次股价波动的股价数据对 应的多位数的数据拼接得到流式数据, 其中, 将多位数的数据中空缺的位置补0 。权 利 要 求 书 2/2 页 3 CN 115543946 A 3

.PDF文档 专利 一种金融大数据优化存储方法

文档预览
中文文档 14 页 50 下载 1000 浏览 0 评论 309 收藏 3.0分
温馨提示:本文档共14页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
专利 一种金融大数据优化存储方法 第 1 页 专利 一种金融大数据优化存储方法 第 2 页 专利 一种金融大数据优化存储方法 第 3 页
下载文档到电脑,方便使用
本文档由 人生无常 于 2024-03-17 23:41:20上传分享
友情链接
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。