[发明专利]波内纹理循环在审

专利信息
申请号: 202280017523.X 申请日: 2022-02-04
公开(公告)号: CN116940922A 公开(公告)日: 2023-10-24
发明(设计)人: A·E·格鲁贝尔 申请(专利权)人: 高通股份有限公司
主分类号: G06F8/41 分类号: G06F8/41
代理公司: 永新专利商标代理有限公司 72002 代理人: 赵磊
地址: 美国加*** 国省代码: 暂无信息
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 本公开涉及用于图形处理的方法和设备,包括例如GPU的装置。装置可以确定是否将线程组划分为多个线程子组,线程组中的每个线程与着色器程序相关联。装置还可以在确定将线程组划分为多个线程子组时,将线程组划分为多个线程子组。此外,装置可以在将线程组划分为多个线程子组时,针对多个线程子组中的每个线程子组执行着色器程序的分段。
搜索关键词: 纹理 循环
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高通股份有限公司,未经高通股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202280017523.X/,转载请声明来源钻瓜专利网。

同类专利
  • 波内纹理循环-202280017523.X
  • A·E·格鲁贝尔 - 高通股份有限公司
  • 2022-02-04 - 2023-10-24 - G06F8/41
  • 本公开涉及用于图形处理的方法和设备,包括例如GPU的装置。装置可以确定是否将线程组划分为多个线程子组,线程组中的每个线程与着色器程序相关联。装置还可以在确定将线程组划分为多个线程子组时,将线程组划分为多个线程子组。此外,装置可以在将线程组划分为多个线程子组时,针对多个线程子组中的每个线程子组执行着色器程序的分段。
  • 基于处理器使用率的代码生成-202280014361.4
  • J·马拉蒂;M·墨菲;张晓华 - 辉达公司
  • 2022-10-12 - 2023-10-10 - G06F8/41
  • 用于至少部分地基于要由一个或更多个第二处理器使用的一个或更多个数据指示来生成要由一个或更多个第一处理器执行的代码的装置、系统和技术。在至少一个实施例中,CUDA程序包括主机代码和设备代码,并且链接器使用对主机代码中的代码元素的引用来链接或修剪来自设备代码的代码元素。
  • 经合并的机器级中间表示优化-202180089654.4
  • 李翔 - 微软技术许可有限责任公司
  • 2021-11-29 - 2023-09-29 - G06F8/41
  • 提供了一种计算机设备,其包括处理器,该处理器被配置为接收针对包括至少两个代码文件的程序的源代码,以及处理针对该程序的源代码,以针对源代码的至少两个代码文件中的每个代码文件生成机器级代码文件。处理器还被配置为生成针对源代码的至少两个代码文件所生成的每个机器级代码文件的控制流图数据,使用机器级代码文件和针对该机器级代码文件生成的控制流图数据,生成针对每个机器级代码文件的机器级中间表示,将机器级中间表示合并为经合并的机器级中间表示,以及对经合并的机器级中间表示执行机器级优化以及输出经优化的经合并的机器级中间表示。
  • 基于流的范围界定-201880033532.1
  • G·比尔曼;B·戈茨;G·斯蒂尔 - 甲骨文国际公司
  • 2018-04-09 - 2023-09-05 - G06F8/41
  • 公开了用于基于流的范围界定的技术。相同级别代码段序列中的第一代码段封装第一较低级别词法范围。第一较低级别范围包括为相同级别代码段序列提供的范围界定。第一代码段包括条件和未初始化变量。如果第一代码段被执行,则使得条件被评估。如果条件被满足,则未初始化变量被初始化,并且使未初始化变量仅在第一较低级别词法范围内可用。如果第二代码段(a)引用未初始化变量,并且(b)在相同级别代码段序列中或在第一较低级别词法范围之外的第二较低级别词法范围中,则呈现指示未初始化变量在第二代码段的范围之外的错误消息。
  • 电子电路的设计规范的自动翻译-202180079708.9
  • G·帕塔萨拉蒂;S·南达;P·乔杜里;P·帕蒂尔;A·文卡塔查尔 - 美商新思科技有限公司
  • 2021-11-22 - 2023-08-22 - G06F8/41
  • 实施例涉及用于翻译电子电路的设计规范的系统。在一个实施例中,分析设计规范以标识一个或多个语句。系统从一个或多个标识的语句中提取语义概念。此外,针对一个或多个标识的语句中的每个语句,系统确定该语句是否能够翻译的。如果目标语句能够翻译的,则系统针对目标语句生成解析树,并针对生成的解析树生成概率移位减少调度。使用生成的概率移位减少调度和可选地生成的解析树,系统生成用于验证在目标语句中指定的条件的代码。在一些实施例中,为了生成代码,系统使用生成的概率转移减少调度来解析目标语句。
  • 电子装置和管理电子装置的存储器的方法-202180074380.1
  • 郑宽熙;许世耕;金晓钟;安栋规 - 三星电子株式会社
  • 2021-02-23 - 2023-07-14 - G06F8/41
  • 根据各种实施例,电子装置包括至少一个处理器和用于存储可由处理器执行的指令的存储器。其中,处理器可以:监测关于存储器的存储空间的信息和由处理器执行的多个对象的使用历史;基于该信息和该使用历史中的一者或两者,在多个对象中确定其编译方案将被改变的目标对象;以及通过改变目标对象的编译方案来增加存储器的空闲存储空间。其他实施例是可能的。
  • 替选循环限制-201880025248.X
  • 奥利维尔·泰马姆;哈西特·哈伊坦;拉维·纳拉亚纳斯瓦米;禹同爀 - 谷歌有限责任公司
  • 2018-04-27 - 2023-05-23 - G06F8/41
  • 描述了用于存取N维张量的方法、系统和装置。在一些实施方式中,一种方法包括对第一嵌套循环的一个或多个第一迭代中的每个迭代,执行嵌套在第一嵌套循环内的第二嵌套循环的迭代,直到达到用于第二嵌套循环的第一循环边界为止。响应于第二嵌套循环具有超过计算系统的硬件属性的值的迭代的总数,用于第一嵌套循环的一个或多个第一迭代的第二嵌套循环的迭代的数目受到第一循环边界限制。在第一嵌套循环的倒数第二迭代已经完成之后,对第一嵌套循环的最后一个迭代执行第二嵌套循环的一个或多个迭代,直到达到替选循环边界为止。
  • 促进量子状态测量后端过程的量子状态测量逻辑-202180061907.7
  • J·鲁丁格;T·亚历山大;D·麦凯 - 国际商业机器公司
  • 2021-09-09 - 2023-05-12 - G06F8/41
  • 提供了用于促进在量子状态测量后端过程中使用的量子状态测量逻辑的系统、计算机实现的方法以及计算机程序产品。根据一个实施例,一种系统可以包括:存储器,其存储计算机可执行组件;以及处理器,其执行被存储在存储器中的计算机可执行组件。该计算机可执行组件可以包括:级控制寄存器组件,其定义与量子状态测量管线的至少一个级中的至少一个存储元件相对应的数据处理功能。
  • 无依赖性的快速编译源代码-202180045257.7
  • 亚伯拉罕·理查德·霍夫曼 - 贝宝公司
  • 2021-06-21 - 2023-03-03 - G06F8/41
  • 提供了用于源代码的超事实软件编译的技术。编译器接收软件代码并且可以将其划分为代码段。可以生成有序节点图谱,使得该图中的每个节点可以包括代码段,并且节点的顺序表示软件代码的执行顺序。可以与其他代码段并行地且独立于其他代码段来将每个代码段编译成可执行对象。二进制可执行文件可以通过链接从代码段生成的可执行对象来生成。该方法与现有的源代码编译技术存在显著不同,因为常规的编译器按顺序来建立可执行文件,而本实施方式将源代码划分成多个较小的代码段,并且单独地且并行地对它们进行编译。对多个代码段进行编译相对于常规技术在数量级上改进了编译工作。
  • 用于优化从一个存储器到另一个存储器的数据传输的方法和系统-202180024592.9
  • 克里斯·史密斯 - 北欧半导体公司
  • 2021-03-25 - 2022-11-11 - G06F8/41
  • 公开了一种用于通过处理器(106)将数据从源存储器(102)移动到目标存储器(104)的方法和系统(100)。处理器(106)具有多个寄存器(114)并且源存储器(102)存储包括一个或多个加载指令和一个或多个存储指令的指令序列。处理器(106)将加载指令从源存储器(102)移动到目标存储器(104)。然后,处理器(106)启动来自目标存储器(104)的加载指令的执行,以便将来自源存储器(102)的数据加载到处理器(106)中的一个或多个寄存器(114)。然后执行返回到存储在源存储器(102)中的指令序列,并且处理器(106)将来自寄存器(114)的数据存储到目标存储器(104)。
  • 用于ETL流水线处理的系统和方法-202080095553.3
  • 胡意仪;欧阳恩 - 皇家飞利浦有限公司
  • 2020-12-03 - 2022-09-16 - G06F8/41
  • 本发明提供了一种ETL流水线系统,其包括被配置为获得多个图配置组件的接口。每个图配置组件包括表示一个或多个计算逻辑规则的信息。该系统还包括被配置为基于所获得的图配置组件来生成计算图的计算图生成器。所生成的计算图包括针对每个图配置组件的节点以及表示节点之间的关系的一个或多个链接。该系统还包括计算图适配器,该计算图适配器被配置为从外部源接收与图配置组件有关的外部信息,并基于外部信息来适配所生成的计算图。该系统还包括被配置为运行所适配的计算图的计算图运行器。
  • 用于优化硬件FIFO指令的方法、系统和计算机存储介质-201980093043.X
  • 徐元仲;詹姆斯·M·施蒂希诺特;戴维·亚历山大·迈内默 - 谷歌有限责任公司
  • 2019-11-26 - 2022-09-06 - G06F8/41
  • 描述了用于调度先进先出(FIFO)指令的方法、系统和装置。在一个方面,一种方法包括接收表示将由具有硬件处理器的处理单元执行的程序的代码的数据。对于一个或多个硬件处理器中的每一个,在表示代码的数据中标识用于由硬件处理器执行的独立FIFO指令组的顺序。对于用于由硬件处理器执行的每个独立的FIFO指令组,确定表示从独立的FIFO指令组到达程序的末尾需要多长时间的路径长度度量。至少基于用于由硬件处理器执行的每个独立FIFO指令组的路径长度度量来生成用于由硬件处理器执行的独立FIFO指令组的新顺序。
  • 用于应用中的向量计算的多阶段自动编译-201980101100.4
  • 丁俊勇;穆罕默德·哈格特;李天佑;塞巴斯蒂安·温克尔;张琦 - 英特尔公司
  • 2019-11-06 - 2022-05-27 - G06F8/41
  • 系统、装置和方法可提供将二进制代码嵌入到应用二进制文件中的开发者阶段技术,其中二进制代码对应于静态类型源代码中的向量函数和非向量函数,并且生成中间表示(IR)数据,其中中间表示数据对应于静态类型源代码中的向量函数。此外,开发者阶段技术将IR数据嵌入在应用二进制文件中。此外,部署阶段技术可基于应用二进制文件生成第一编译输出,并且检测与第一编译输出相关联的执行环境中的能力变化。部署阶段技术还可响应于检测到的能力变化,基于第一编译输出来生成第二编译输出。
  • 用于实现数据流AI应用的自主加速的方法和装置-202080052164.2
  • 芮泽·阿兹米;冯承祥;愷婷·艾米·王;高耀庆;田野;王翔 - 华为技术有限公司
  • 2020-09-14 - 2022-03-01 - G06F8/41
  • 一种方法,包括分析表示数据流应用的运算符之间的数据依赖关系的数据流图,以识别所述运算符的多个候选组。根据给定硬件加速器的特征和所述多个候选组中给定候选组的运算符,确定所述给定候选组的所述运算符是否要被组合。在确定所述给定候选组的所述运算符要被组合之后,检索与所述给定候选组的所述运算符对应的可执行二进制代码段;生成二进制代码单元,所述二进制代码单元包括所述可执行二进制代码段和表示所述可执行二进制代码段之中执行控制流的元数据;并且将所述代码单元调度到所述给定硬件加速器以执行所述代码单元。
  • 数据移动任务优化的方法和装置-201980098172.8
  • 王寓卿;叶友本;赵未鸣;周鹏;张伟丰 - 阿里巴巴集团控股有限公司
  • 2019-08-23 - 2022-02-11 - G06F8/41
  • 本公开的实施例提供了用于优化与机器学习模型相关的数据移动任务的方法和设备。该方法可以包括在设备的可执行程序中识别数据移动任务,识别与该数据移动任务相关联的一个或多个操作,确定设备的硬件能力和优化数据移动任务的需求,以及响应于设备的硬件能力满足所述需求的判断,将所述被识别数据移动任务映射到与所述数据移动任务相关联的被识别的一个或多个操作的数据写入。
  • 用于代码优化的语法图的持续注释-202080048722.8
  • B·J·F·德斯迈特 - 微软技术许可有限责任公司
  • 2020-03-27 - 2022-02-11 - G06F8/41
  • 定位并记录优化机会以通过编译器或解释器增强代码转换。增强型转换器扫描程序语法图,识别子图结构,并且注释该图的节点,以记录与该节点相关联的程序代码实体的优化特性。子图结构和对应注释可以维持在与任何特定可优化程序不同的优化目录中。优化器基于所注释的语法图来改进程序代码转换。优化特性可以指定关于执行值范围和执行行为(例如,副作用、局部或全局变量使用、I/O、引用参数)的代码纯度,并且哪些异常是可能的。可以使用例程名称、哈希值和具有孔的模板来标识子图结构,任何常数将填满该孔。可以根据子节点的特性来推断父节点特性。可以使用权重函数使优化候选优先化。可以插入优化器回调以递增地评估优化特性。
  • 通过编译器精度选择的着色器程序加速-202080040930.3
  • I·内弗雷弗;V·C·沙玛 - 微软技术许可有限责任公司
  • 2020-04-17 - 2022-01-11 - G06F8/41
  • 用于降低着色器程序中使用的计算的精度的方法和设备可以包括接收用于着色器程序的程序代码以与图形处理单元(GPU)一起使用,该图形处理单元(GPU)支持半精度存储和着色器程序中的算术。该方法和设备可以包括在程序代码上执行至少一个通道以选择程序代码内的操作集,以降低由操作集使用的多个计算的精度,并且针对多个计算中的每个计算,评估针对将精度降低到半精度的精度损失风险。该方法和设备可以包括响应于精度损失风险低于精度损失阈值,通过将计算重写为半精度来生成经编辑的程序代码。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top