专利 利用C++编译器的CPU-GPU数据同步方法和装置

(19)国家知识产权局 (12)发明专利 (10)授权公告号 (45)授权公告日 (21)申请号 202210409838.0 (22)申请日 2022.04.19 (65)同一申请的已公布的文献号申请公布号 CN 114756369 A (43)申请公布日 2022.07.15 (73)专利权人北京领为军融科技有限公司地址 102627 北京市大兴区金苑路甲15号6 幢8层A818室 (72)发明人贾磊　 (74)专利代理机构北京远大卓悦知识产权代理有限公司 1 1369 专利代理师卞静静 (51)Int.Cl. G06F 9/50(2006.01) G06F 9/54(2006.01)G06F 8/41(2018.01) (56)对比文件 CN 113674133 A,2021.1 1.19 CN 112819678 A,2021.0 5.18 US 201818215 3 A1,2018.0 6.28 US 20202 94179 A1,2020.09.17 审查员崔鑫彤 (54)发明名称利用C++编译器的CPU-GPU数据同步方法和装置 (57)摘要本发明公开了一种利用C++编译器的CPU ‑ GPU数据同步方法，包括：获取需要进行CPU ‑GPU 同步的数据的描述；调用C++编译器对需要进行 CPU‑GPU同步的数据的描述进行编译，执行编译结果，计算得到渲染系统共享数据和各模块专属数据在内存中需要的存储空间和存储地址，以及在显存中需要的存储空间和存储地址；将需要进行CPU‑GPU同步的数据按渲染系统共享数据和各模块专属数据加载至共享数据和各模块专属数据各自在内存中的存储空间内；将渲染系统共享数据和各模块专属数据按各自在显存中的存储地址从内存中同步至共享数据和各模块专属数据各自在显存中的存储空间内。本发明克服了现有渲染系统缓存本地性差的缺点。权利要求书1页说明书5页附图2页 CN 114756369 B 2022.12.09 CN 114756369 B 1.一种利用C+ +编译器的CPU ‑GPU数据同步方法，其特征在于，包括：获取需要进行CPU ‑GPU同步的数据的描述，所述需要进行CPU ‑GPU同步的数据的描述是用户通过模板标签在特定维度对需要进行CPU ‑GPU同步的数据进行标注得到的，所述需要进行CPU‑GPU同步的数据的描述中记载有数据所属的数据类型、以及不同数据类型对应的存储规则；调用C++编译器对需要进行CPU ‑GPU同步的数据的描述进行编译，执行编译结果，计算得到渲染系统共享数据和各模块专属数据在内存中需要的存储空间和存储地址，以及在显存中需要的存储空间和存储地址，以使渲染系统共享数据和各模块专属数据可在内存中连续保存，以及可在显存中连续保存；将需要进行CPU ‑GPU同步的数据按渲染系统共享数据和各模块专属数据各自在内存中的存储地址分别加载至共享数据和各模块专属数据各自在内存中的存储空间内；将渲染系统共享数据和各模块专属数据按各自在显存中的存储地址从内存中同步至共享数据和各模块专属数据各自在显存中的存储空间内。 2.如权利要求1所述的利用C++编译器的CPU ‑GPU数据同步方法，其特征在于，所述特定维度包括：数据静态/动态更新、数据类型两个维度。 3.一种利用C+ +编译器的CPU ‑GPU数据同步装置，其特征在于，包括：编码单元，其用于获取需要进行CPU ‑GPU同步的数据的描述，所述需要进行CPU ‑GPU同步的数据的描述是用户通过模板标签在特定维度对需要进行CPU‑GPU同步的数据进行标注得到的，所述需要进行CPU‑GPU同步的数据的描述中记载有数据所属的数据类型、以及不同数据类型对应的存储规则；编译单元，其用于调用C++编译器对需要进行CPU ‑GPU同步的数据的描述进行编译，执行编译结果，计算得到渲染系统共享数据和各模块专属数据在内存中需要的存储空间和存储地址，以及在显存中需要的存储空间和存储地址，以使渲染系统共享数据和各模块专属数据可在内存中连续保存，以及可在显存中连续保存；加载单元，其用于将需要进行CPU ‑GPU同步的数据按渲染系统共享数据和各模块专属数据各自在内存中的存储地址分别加载至共享数据和各模块专属数据各自在内存中的存储空间内；同步单元，其用于将渲染系统共享数据和各模块专属数据按各自在显存中的存储地址从内存中同步至共享数据和各模块专属数据各自在显存中的存储空间内。 4.如权利要求3所述的利用C++编译器的CPU ‑GPU数据同步装置，其特征在于，所述特定维度包括：数据静态/动态更新、数据类型两个维度。 5.一种电子设备，其特征在于，包括：至少一个处理器，以及与所述至少一个处理器通信连接的存储器，其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器执行权利要求 1～2中任一项所述的方法。 6.一种存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时，实现权利要求1～ 2中任一项所述的方法。权　利　要　求　书 1/1 页 2 CN 114756369 B 2利用C++编译器的CPU ‑GPU数据同步方法和装置技术领域 [0001]本发明涉及计算机技术领域。更具体地说，本发明涉及一种利用C++编译器的CPU ‑ GPU数据同步方法和装置。背景技术 [0002]渲染系统通常由若干渲染模块构成，基于业务数据，若干渲染模块分别处理不同类型的渲染任务，渲染模块在处理渲染任务时其数据均源自CPU，这些数据(包括系统共享数据和模块专属数据)在渲染过程中需要同步至GPU，现有的渲染系统在CPU ‑GPU数据同步方面，一般采取以下策略： a、系统共享数据由渲染框架负责数据管理； b、各渲染模块专属数据由各渲染模块自身负责，即通过在内存中创建各自的存储区间，以及在GPU端显存中创建各自的存储区间，再进行两者间的数据同步。上述策略中，由于渲染模块各自负责各自的专属数据同步，故在内存上各模块分配的存储区间零星分散，那么各模块的专属数据在内存中不能连续成片分布(如图1所示)，而在CPU计算过程中，为了提高CPU性能， CPU中一般会内置算法，以在缓存中提前预加载可能使用到的数据，例如需要用到的数据分布在连续的内存中， CPU一旦读取了部分数据，那么CPU缓存中有极大概率通过预加载提前读取在连续的内存中的其他数据，因此，上述策略容易导致不同模块的专属数据在渲染过程难以提前读取至CPU缓存中，又CPU对存储类型不同的数据访问速度也不同，如CPU对L2缓存的访问速度在纳秒级别，对内存的访问速度则在微秒级别，由于上述策略使CPU在处理完一个模块的专属数据后不能立即从缓存中读取下一个模块的专属数据，还需要从内存中读取，这就造成了缓存本地性差、系统效率低的问题， GPU原理与CPU类似，因此GPU中也存在同样问题，另外，从系统角度看，由于渲染模块各自负责各自的专属数据同步，那么系统就要进行多次数据同步，这就进一步降低了系统效率。发明内容 [0003]本发明的一个目的是解决至少上述问题，并提供至少后面将说明的优点。 [0004]本发明还有一个目的是提供一种利用C ++编译器的CPU ‑GPU数据同步方法和装置，可对需要进行CPU ‑GPU同步的数据所需的内存和显存进行集中分配，克服了缓存本地性差的缺点，同时对渲染系统共享数据和各模块专属数据进行了集中同步，减少了数据同步次数，提高了渲染系统效率。 [0005]为了实现根据本发明的这些目的和其它优点，提供了一种利用C++编译器的CPU ‑ GPU数据同步方法，其包括： [0006]获取需要进行CPU ‑GPU同步的数据的描述，所述需要进行CPU ‑GPU同步的数据的描述是用户通过模板标签在特定维度对需要进行CPU‑GPU同步的数据进行标注得到的； [0007]调用C++编译器对需要进行CPU ‑GPU同步的数据的描述进行编译，执行编译结果，计算得到渲染系统共享数据和各模块专属数据在内存中需要的存储空间和存储地址，以及在显存中需要的存储空间和存储地址，以使渲染系统共享数据和各模块专属数据可在内存说　明　书 1/5 页 3 CN 114756369 B 3

专利 利用C++编译器的CPU-GPU数据同步方法和装置

专利利用C++编译器的CPU-GPU数据同步方法和装置