专利一种模型训练数据的更新方法和装置

(19)国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202210768923.6 (22)申请日 2022.07.01 (71)申请人北京沃东天骏信息技术有限公司地址 100176 北京市北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司 (72)发明人黎沛含　邢召龙　张克丰　王文生　刘倩欣　原武军　裴杨　舒俊华　 (74)专利代理机构中原信达知识产权代理有限责任公司 1 1219 专利代理师韩黎捷　张效荣 (51)Int.Cl. G06F 16/23(2019.01) G06F 16/2455(2019.01) G06N 20/00(2019.01) (54)发明名称一种模型训练数据的更新方法和装置 (57)摘要本发明公开了一种模型训练数据的更新方法和装置，涉及计算机技术领域。响应于模型训练数据的更新请求，分别将每个训练器节点的第一参数服务器中的模型训练数据缓存至每个训练器节点的第二参数服务器中；对每个训练器节点，从目标训练器节点的第二参数服务器和除目标训练器节点之外的非目标训练器节点的第二参数服务器中获取模型训练数据；使用所获取的模型训练数据，通过目标训练器节点的训练器对模型进行训练生成训练结果；将训练结果保存至各训练器节点的第一参数服务器，以使每个训练器节点根据训练结果更新模型训练数据。该实施方式能够提高拉取和更新的通信速率，降低数据传输所耗费的时间，提高模型的训练效率和训练器资源的使用效率。权利要求书4页说明书14页附图7页 CN 115129734 A 2022.09.30 CN 115129734 A 1.一种模型训练数据的更新方法，其特征在于，包括：响应于模型训练数据的更新请求，分别将每个训练器节点的第一参数服务器中的模型训练数据缓存至所述每个训练器节点的第二参数服务器中，所述第二参数服务器的访问速度高于所述第一参数服务器的访问速度；对所述每个训练器节点，从目标训练器节点的第二参数服务器和除所述目标训练器节点之外的非目标训练器节点的第二参数服务器中获取所述模型训练数据；使用所获取的模型训练数据，通过所述目标训练器节点的训练器对模型进行训练，生成训练结果；将所述训练结果保存至所述目标训练器节点的第一参数服务器和所述非目标训练器节点的第一参数服务器中，以使所述每个训练器节点根据所述训练结果更新所述模型训练数据。 2.根据权利要求1所述的方法，其特征在于，所述更新请求包括模型训练数据标识，所述响应于模型训练数据的更新请求，分别将每个训练器节点的第一参数服务器中的模型训练数据缓存至所述每个训练器节点的第二参数服务器中，包括：根据所述模型训练数据标识，分别将所述每个训练器节点的第一参数服务器中与所述模型训练数据标识对应的模型训练数据缓存至所述每个训练器节点的第二参数服务器中。 3.根据权利要求2所述的方法，其特征在于，所述第二参数服务器为高带宽内存参数服务器，不同训练器节点的第二参数服务器之间通过多对多通信模式进行通信，从除所述目标训练器节点之外的非目标训练器节点的第二参数服务器中获取所述模型训练数据，包括：根据所述模型训练数据标识，通过所述多对多通信模式从除所述目标训练器节点之外的非目标训练器节点的第二参数服务器中获取与所述模型训练数据标识对应的模型训练数据。 4.根据权利要求3所述的方法，其特征在于，在同一所述训练器节点中，所述第一参数服务器和所述第二参数服务器通过点对点通信模式进行通信，所述将每个训练器节点的第一参数服务器中的模型训练数据缓存至所述每个训练器节点的第二参数服务器中，包括：根据所述模型训练数据标识，通过所述点对点通信模式将所述每个训练器节点的第一参数服务器中与所述模型训练数据标识对应的模型训练数据缓存至所述每个训练器节点的第二参数服务器中。 5.根据权利要求4所述的方法，其特征在于，将所述训练结果保存至所述非目标训练器节点的第一参数服务器中，包括：根据所述模型训练数据标识，通过所述多对多通信模式将所述训练结果保存至所述非目标训练器节点的第二参数服务器中；通过所述点对点通信模式将所述非目标训练器节点的第二参数服务器中的训练结果保存至非目标训练器节点的第一参数服务器中。 6.根据权利要求1所述的方法，其特征在于，所述使用所获取的模型训练数据，通过所述目标训练器节点的训练器对模型进行训练，生成训练结果，包括：对所获取的模型训练数据进行分批得到分批训练数据；分别使用每一分批训练数据，通过所述目标训练器节点的训练器对所述模型进行训权　利　要　求　书 1/4 页 2 CN 115129734 A 2练，生成分批训练结果；对所述分批训练结果进行汇总得到所述训练结果。 7.根据权利要求1所述的方法，其特征在于，所述更新请求包括多个批次的模型训练数据标识；所述从目标训练器节点的第二参数服务器和除所述目标训练器节点之外的非目标训练器节点的第二参数服务器中获取所述模型训练数据，包括：根据每个批次的模型训练数据标识，分别从目标训练器节点的第二参数服务器和除所述目标训练器节点之外的非目标训练器节点的第二参数服务器中获取每个批次的模型训练数据作为分批训练数据；所述使用所获取的模型训练数据，通过所述目标训练器节点的训练器对模型进行训练，生成训练结果，包括：分别使用每一分批训练数据，通过所述目标训练器节点的训练器对所述模型进行训练，生成分批训练结果；对所述分批训练结果进行汇总得到所述训练结果。 8.一种模型训练数据的更新方法，其特征在于，包括：响应于模型训练数据的更新请求，将第一参数服务器中的模型训练数据缓存至第二参数服务器中，所述第二参数服务器与所述第一参数服务器位于同一训练器节点，且所述第二参数服务器的访问速度高于所述第一参数服务器的访问速度；从所述第二参数服务器和与本训练器节点不同的第一训练器节点的第二参数服务器中获取所述模型训练数据；使用所获取的模型训练数据，通过训练器对模型进行训练，生成训练结果；将所述训练结果保存至所述第一参数服务器和所述第一训练器节点的第一参数服务器中，以使每个训练器节点根据所述训练结果更新所述模型训练数据。 9.根据权利要求8所述的方法，其特征在于，所述更新请求包括模型训练数据标识，所述响应于模型训练数据的更新请求，将第一参数服务器中的模型训练数据缓存至第二参数服务器中，包括：根据所述模型训练数据标识，将第一参数服务器中与所述模型训练数据标识对应的模型训练数据缓存至第二参数服务器中。 10.根据权利要求9所述的方法，其特征在于，所述第二参数服务器为高带宽内存参数服务器，不同训练器节点的第二参数服务器之间通过多对多通信模式进行通信，从与本训练器节点不同的第一训练器节点的第二参数服务器中获取所述模型训练数据，包括：根据所述模型训练数据标识，通过所述多对多通信模式从所述第一训练器节点的第二参数服务器中获取与所述模型训练数据标识对应的模型训练数据。 11.根据权利要求10所述的方法，其特征在于，在同一所述训练器节点中，所述第一参数服务器和所述第二参数服务器通过点对点通信模式进行通信，所述将第一参数服务器中的模型训练数据缓存至第二参数服务器中，包括：根据所述模型训练数据标识，通过所述点对点通信模式将所述第一参数服务器中与所述模型训练数据标识对应的模型训练数据缓存至所述第二参数服务器中。 12.根据权利要求11所述的方法，其特征在于，将所述训练结果保存至所述第一训练器权　利　要　求　书 2/4 页 3 CN 115129734 A 3

专利 一种模型训练数据的更新方法和装置

专利一种模型训练数据的更新方法和装置