[发明专利]一种低功耗GPU染色任务与统一染色阵列任务现场映射结构有效
申请号: | 201611140738.3 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106651744B | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 韩立敏;田泽;张骏;郑斐;任向隆;郑新建 | 申请(专利权)人: | 中国航空工业集团公司西安航空计算技术研究所 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06F9/50 |
代理公司: | 11008 中国航空专利中心 | 代理人: | 杜永保 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于图形处理器设计领域,公开了一种低功耗GPU染色任务与统一染色阵列任务现场映射结构。所述结构包含:输入数据组装与转发单元(1),接收外部模块输入的Vertex属性数据和Pixel属性数据,组装成Vertex warp和Pixel warp,转发到统一染色阵列(USA)的任务现场;配置与管理单元(2),接收外部HIU(主机接口单元)输入的配置参数,设置和记录配置参数的值;任务管理单元(3),依据深度优先的算法执行空闲slot查询与任务映射、任务输出和任务提交;资源管理单元(4),根据配置参数更新slot的资源管理方法。slot状态表单元(5),记录统一染色阵列内m个slot(任务现场)的状态和任务类型。 | ||
搜索关键词: | 一种 功耗 gpu 染色 任务 统一 阵列 现场 映射 结构 | ||
【主权项】:
1.一种低功耗GPU染色任务与统一染色阵列任务现场映射结构,其特征在于,包含:/n输入数据组装与转发单元(1),从外部的GFU(图形功能单元)、GDU(图形绘制单元)和GEU(几何引擎单元)获取Vertex染色任务和Pixel染色任务的输入数据,将GFU和GDU输入的16个Vertex的i个相关属性数据组装成Vertex warp,将GEU输入的16个pixel的j个相关属性数据组装成pixel warp,当前Vertex warp和pixel warp组装和传输完毕,则产生warp组装使能输出给向任务管理单元(3);输入数据组装与转发单元(1)从任务管理单元(3)获取slot id11和slot id12,使用slot id11和slot id12产生Vertex warp和pixelwarp数据传输到外部的USA(统一染色阵列)的localsram存储器地址,将Vertex warp和pixel warp的数据输出到USA(统一染色阵列)的localsram;/n配置与管理单元(2),从外部的HIU(主机接口单元)获取输入数据,设置slot配置码和SSC(SIMT Shading Cluster,SIMT染色处理单元簇)使能配置码,产生SSC低功耗编码;向任务管理单元(3)输出slot配置码的值和SSC使能配置码的值,向资源管理单元(4)输出slot配置码的值和SSC使能配置码的值,向外部的USA输出SSC低功耗编码;/n任务管理单元(3),以输入数据组装与转发单元(1)的warp组装使能为输入,结合配置与管理单元(2)输入的slot配置码的值和SSC使能配置码的值,查询slot状态表单元(5)中n个slot的状态值,依据深度优先的算法得到slotid11和slotid12,将slotid11和slot id12输出到输入数据组装与转发单元(1),将slot id11和slot id12作为slot的地址,将slotid11和slot id12的slot的配置信息输出到slot状态表单元(5),占用该slot;将Vertexwarp和Pixelwarp的染色任务控制信息,包括slot id11和slot id12,任务类型,输出到外部的USA(统一染色阵列),以外部的OCU(输出控制单元)模块输出的Vertex warp任务和Pixel warp任务的slot id21和slot id22为输入,作为slot的地址,将slot的配置信息输出到slot状态表单元(5),释放slot资源;/n资源管理单元(4),将slot状态表单元(5)的n个slot的全部状态作为输入,统计n个slot的负载状态,结合配置与管理单元(2)输入的slot配置码的值和SSC使能配置码的值,实施slot资源分配与映射操作,将slotid3和slot的配置信息输出到slot状态表单元(5),改变slot资源的任务类型;/nslot状态表单元(5),用于记录m个slot状态,每个slot的状态包括2个bit,第1个bit表示slot的当前状态:busy/idle,第2个bit表示slot的类型:Vertex/Pixel;向任务管理单元(3)输出slot id11和slot id12,以及n个slot的全部状态,指导任务映射操作,向资源管理单元(4)输出n个slot的全部状态,接收资源管理单元(4)输入的slot id3和slot任务类型的设置信息,指导资源映射操作;/ni的取值范围为3-25的整数;j的取值范围为3-10的整数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司西安航空计算技术研究所,未经中国航空工业集团公司西安航空计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611140738.3/,转载请声明来源钻瓜专利网。
- 上一篇:电陶炉(Q9)
- 下一篇:液体加热器(OMT‑YS809)