[发明专利]数据处理装置和数据处理方法有效

专利信息
申请号: 201711347790.0 申请日: 2017-12-15
公开(公告)号: CN108733413B 公开(公告)日: 2023-10-24
发明(设计)人: 弗朗索瓦·克里斯托弗·雅克·波特曼;托马斯·克里斯托弗·格罗卡特 申请(专利权)人: ARM有限公司;安谋科技(中国)有限公司
主分类号: G06F9/302 分类号: G06F9/302;G06F9/315
代理公司: 北京东方亿思知识产权代理有限责任公司 11258 代理人: 李晓冬
地址: 英国*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开涉及移位指令。一种装置具有包括用于对一对输入操作数进行乘法运算的乘法器电路的处理电路。响应于指定至少一个移位量的移位指令和包括至少一个数据元素的源操作数,将源操作数和根据移位量确定的移位操作数作为输入操作数提供给乘法器电路,并且控制乘法器电路以执行至少一个乘法运算,其等效于使源操作数的相应数据元素移位由相应移位量指定的位数以生成移位结果值。
搜索关键词: 数据处理 装置 方法
【主权项】:
1.一种装置,包括:处理电路,用于执行处理操作,所述处理电路包括乘法器电路,以对一对输入操作数执行乘法;以及指令解码器,用于解码程序指令以控制所述处理电路来执行处理操作;其中响应于指定至少一个移位量的移位指令和包括至少一个数据元素的源操作数,所述指令解码器被配置为控制处理电路以向乘法器电路提供所述源操作数和根据所述至少一个移位量确定的移位操作数作为所述输入操作数对,并且控制所述乘法器电路,以执行至少一个乘法运算,所述至少一个乘法运算等效于使源操作数的对应数据元素移位由对应的移位量指定的位数来生成移位结果值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于ARM有限公司;安谋科技(中国)有限公司,未经ARM有限公司;安谋科技(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711347790.0/,转载请声明来源钻瓜专利网。

同类专利
  • 具有高带宽和低功率向量寄存器堆的流处理器-201710434300.4
  • 陈佳升;何斌;马克·M·莱瑟;迈克尔·J·曼托尔;邹云晓 - 超威半导体公司
  • 2017-06-09 - 2023-09-19 - G06F9/302
  • 本发明涉及一种具有高带宽和低功率向量寄存器堆的流处理器。公开了用于实现由并行处理器使用的高带宽低功率的向量寄存器堆的系统、装置和方法。在一个实施方式中,系统至少包括具有多个处理流水线的并行处理单元。并行处理单元包括向量运算逻辑单元和高带宽低功率向量寄存器堆。向量寄存器堆包括满足寄存器带宽要求的多内存库高密度随机存取存储器(RAM)。并行处理单元还包括指令请求队列和指令操作数缓冲器,以便为VALU指令和向量I/O指令提供足够的本地带宽。此外,并行处理单元被配置为利用RAM的输出触发器作为最后一级高速缓存来减少多个指令之间的重复操作数请求。并行处理单元包括向量目标高速缓存以向向量寄存器堆提供附加的R/W带宽。
  • 一种基于类加法器的指令请求电路及乱序指令发射架构-202010264215.X
  • 虞致国;马晓杰;魏敬和;顾晓峰 - 江南大学
  • 2020-04-07 - 2023-08-08 - G06F9/302
  • 本发明公开了一种基于类加法器的指令请求电路及乱序指令发射架构,属于处理器设计领域。所述方法通过提供一种基于类加法器的指令请求电路,在对表项空闲信号总数进行统计时,利用类加法单元对两个输入信号分别作与运算和异或运算,取代传统指令请求电路在统计空余表项信息时采用逻辑加的方式,节省了指令请求电路统计表项空闲信号总数的耗时,从而能够满足现代超标量乱序处理器中高性能功耗比、低延时、高IPC的要求,解决了现有技术中处理器无法在发射队列表项数日益增加,延迟也日益增加的问题。
  • 一种基于指令凋零的多指令乱序发射方法及处理器-202010264562.2
  • 虞致国;马晓杰;魏敬和;顾晓峰 - 江南大学
  • 2020-04-07 - 2023-08-08 - G06F9/302
  • 本发明公开了一种基于指令凋零的多指令乱序发射方法及处理器,属于处理器设计领域。本发明摒弃了传统发射架构中冗长的仲裁结构,增加指令凋零电路,采用指令年龄阵列来表征指令在CPU中存储的时间,另外加上一位唤醒状态位,将已经超过凋零阈值的指令存放至沉降池以便CPU直接发射,并改善指令请求电路、指令分配电路、唤醒电路等电路结构,有效改善多指令发射这一处理器中关键路径的时序;唤醒指令时,对执行周期短的指令延迟唤醒,对执行周期长的指令提前唤醒,以保证指令能够背靠背执行,满足了现代超标量乱序处理器中高性能功耗比、低延时、高IPC的要求,解决了现有技术中处理器无法在发射队列表项数日益增加、延迟也日益增加的问题。
  • 一种字符串长度函数分段优化方法及其存储介质-202211473566.7
  • 姜军;夏竹轩;蒋丽萍;谢豪 - 无锡先进技术研究院
  • 2022-11-23 - 2023-03-14 - G06F9/302
  • 本发明公开了一种字符串长度函数分段优化方法及其存储介质,步骤S10,根据字符串的首地址,不对界装入字符串;步骤S11,去除字符串的首地址之前的无关数据的干扰;步骤S12,对字符串的首地址进行对界处理;步骤S13,寻找对界处理后的字符串的结束符,若未找到结束符则循环寻找字符串的结束符,若找到则进行尾部处理;计算字符串长度。采用上述优化方法实现的字符串长度函数,增加了单次处理的数据量,精简了指令数量,特别在输入字符串数据量大的情况下,充分利用了向量指令集的优势实现计算字符串长度的功能,以此提升函数性能。
  • 一种机载雷达空时自适应处理器-202010136564.3
  • 苏涛;彭宇;张永振 - 西安电子科技大学
  • 2020-03-02 - 2023-03-14 - G06F9/302
  • 本发明涉及一种机载雷达空时自适应处理器,包括:第一预处理板卡、第二预处理板卡、第一自适应板卡、第二自适应板卡、交换板卡、机箱和上位机,其中,第一预处理板卡连接在机箱上,并且连接上位机;第二预处理板卡连接在机箱上,并且连接上位机;第一自适应板卡连接在机箱上;第二自适应板卡连接在机箱上;交换板卡连接在机箱上;上位机连接交换板卡。该空时自适应处理器运算处理器少,成本低,功耗低,尽可能采用更少的运算处理器,实现整个机载雷达空时自适应处理器。
  • 用于动态调整流水线深度以改善执行等待时间的方法和装置-202210725969.X
  • S·盖恩;D·乔希;P·兰兹;R·桑卡兰;N·兰加纳坦 - 英特尔公司
  • 2022-06-23 - 2023-02-03 - G06F9/302
  • 用于管理数据处理设备的流水线深度的装置和方法。例如,装置的一个实施例包括:接口,用于接收来自多个客户机的多个工作请求;以及多个引擎,用于执行多个工作请求;其中,工作请求用于从多个工作队列被分派至多个引擎,工作队列用于存储针对每一工作请求的工作描述符,每个工作描述符用于包括执行对应的工作请求所需要的信息,其中,多个工作队列包括用于存储与第一等待时间特性相关联的工作描述符的第一工作队列和用于存储与第二等待时间特性相关联的工作描述符的第二工作队列;引擎配置电路,用于基于第一等待时间特性将第一引擎配置成具有第一流水线深度并且用于基于第二等待时间特性将第二引擎配置成具有第二流水线深度。
  • 一种浮点数据反量化及量化的方法和设备-202010028998.1
  • 刘海威;张新;赵雅倩;董刚;杨宏斌;尹文枫 - 苏州浪潮智能科技有限公司
  • 2020-01-12 - 2023-01-10 - G06F9/302
  • 本发明提供了一种浮点数据反量化及量化的方法和设备,该方法包括以下步骤:将存储器中的INT8数据转换成浮点数据;提取浮点数据中的指数得到指数矩阵并将指数矩阵中的最大值存储到数据存储器;响应于指数矩阵中的值不均为0,基于最大值得到移位矩阵;基于移位矩阵计算得到用于卷积计算的尾数矩阵;基于尾数矩阵进行卷积乘累加计算得到格式为FINT32的结果;将格式为FINT32的结果转换成格式为fp32的数据以用于卷积输入通道的累加计算。通过使用本发明的方法,能够在卷积计算时保持数据的高精度,同时减少复杂运算,能够有效保证计算的高精度,同时由于复杂计算的简化,减少了FPGA硬件资源的消耗,提高计算速度。
  • 运算方法、装置及相关产品-201811455827.6
  • 不公告发明人 - 上海寒武纪信息科技有限公司
  • 2018-11-30 - 2022-11-29 - G06F9/302
  • 本公开涉及运算方法、装置及相关产品。机器学习装置包括一个或多个指令处理装置,用于从其他处理装置中获取待运算数据和控制信息,并执行指定的机器学习运算,将执行结果通过I/O接口传递给其他处理装置;当机器学习运算装置包含多个指令处理装置时,多个指令处理装置间可以通过特定的结构进行连接并传输数据。其中,多个指令处理装置通过快速外部设备互连总线PCIE总线进行互联并传输数据;多个指令处理装置共享同一控制系统或拥有各自的控制系统、且共享内存或者拥有各自的内存;多个指令处理装置的互联方式是任意互联拓扑。本公开实施例所提供的运算方法、装置及相关产品能够在保证计算精度无损的同时,降低数据访存量和计算量。
  • 指令处理方法、装置、处理器和电子设备-202210893579.3
  • 王云贵;郝成龙 - 安谋科技(中国)有限公司
  • 2022-07-27 - 2022-11-01 - G06F9/302
  • 本申请涉及计算机领域,公开了一种指令处理方法、装置、处理器和电子设备。在对具有进位标志依赖关系的第一指令和第二指令进行处理时,在第一时钟周期对应于第一指令进行解码,然后进入第二时钟周期;在第二时钟周期内,此时对应于第一指令进行移位,同时对应于第二指令进行解码,但是由于此时未产生第一指令的进位标志结果,此时不等待第一指令的进位标志结果的产生,结束对第二指令的解码使得处理第二指令的过程由第二周期进入第三周期。因而,在处理具有进位标志依赖关系的第一指令和第二指令时,由于第二指令提前进入第三周期,使得第二指令的下一指令可以不需要多等待一个时钟周期提前进入解码阶段,进而当处理多条指令时,提高处理效率。
  • 一种多路混合基FFT可重构蝶形运算器-201810886891.3
  • 宋宇鲲;曲双双;陈楠;张多利;杜高明 - 合肥工业大学
  • 2018-08-06 - 2022-11-01 - G06F9/302
  • 本发明公开了一种多路混合基FFT可重构蝶形运算器,该蝶形运算器包括:控制单元,第一选择开关单元以及运算单元;控制单元用于根据接收到的待运算数据生成运算指令,其中,待运算数据包括待处理的数字信号、旋转因子以及预设旋转因子系数;第一选择开关单元用于根据运算指令选择对应的导通模式;运算单元用于根据导通模式,对待运算数据进行蝶形运算。通过本发明中的技术方案,有利于提高蝶形运算器中电子元件的利用效率,减小了电路硬件资源和功耗,有利于提高计算数据的准确性和实时性。
  • 显示屏拼接结构及智能交互平板-202080080308.5
  • 谭景焕 - 广州视源电子科技股份有限公司;广州视睿电子科技有限公司
  • 2020-12-08 - 2022-10-18 - G06F9/302
  • 一种显示屏拼接结构(100)及智能交互平板,拼接结构(100)包括:至少包括第一连接件(1)、第二连接件和连接支架(2),第一连接件(1)和第二连接件分别设置相邻两台显示屏(200)的背板上,且第一连接件(1)和第二连接件相对设置,第一连接件(1)和第二连接件通过连接支架(2)连接;第一连接件(1)、第二连接件和连接支架(2)均设置有斜面,第一连接件(1)、第二连接件与连接支架(2)之间通过斜面配合安装,连接支架(2)安装完成后与第一连接件(1)、第二连接件连接,两台显示屏(200)在第一连接件(1)和第二连接件的作用力下互相抵紧。
  • 一种基于AI处理器的通用矩阵乘算子的处理方法和装置-202210598490.4
  • 杨凯;范登栋;徐鹏翔;刘勇翔;田永鸿 - 鹏城实验室
  • 2022-05-30 - 2022-10-14 - G06F9/302
  • 本发明涉及矩阵处理技术领域,具体是涉及一种基于AI处理器的通用矩阵乘算子的处理方法和装置。依据原矩阵中的设定元素,在CPU上计算出输入矩阵;将所述输入矩阵搬运至所述全局内存;将搬运至所述全局内存的输入矩阵和位于所述全局内存上的矩阵作为通用矩阵乘算子的输入,得到所述通用矩阵乘算子的输出矩阵。本发明在AI处理器上通过通用矩阵乘算子处理矩阵,能够使得AI处理器的计算资源得到充分利用,从而提高了处理矩阵的速度和效率。
  • 一种基于转置的向量三角函数快速查表方法及系统-202210646016.4
  • 沈洁;龙标;黄春;唐滔;彭林;方建滨;崔英博;张鹏;廖霞 - 中国人民解放军国防科技大学
  • 2022-06-09 - 2022-08-30 - G06F9/302
  • 本发明公开了一种基于转置的向量三角函数快速查表方法及系统,本发明方法包括:输入索引向量vi与基址地址pb,将索引向量vi保存的偏移量值拆分到标量中,并与基址地址pb相加得到VL个地址,使用向量加载指令将VL个地址处共VL×4个浮点数加载到VL个向量组中,每个向量组包含对应地址处的4个浮点数,然后将VL个向量组进行转置得到向量长度为VL的向量vr1、vr2、vr3与vr4。本发明能够极大减少向量查表操作中加载函数或加载指令的使用次数,并且不需要特殊的向量聚合加载指令与动态置换指令的支持,从而提升向量查表操作以及使用向量查表操作的向量三角函数的性能。
  • 一种基于超越函数加速指令的正余弦函数实现方法及系统-202210647106.5
  • 沈洁;龙标;黄春;彭林;唐滔;姜浩;范小康;于恒彪;易昕;苏醒 - 中国人民解放军国防科技大学
  • 2022-06-09 - 2022-08-30 - G06F9/302
  • 本发明公开了一种基于超越函数加速指令的正余弦函数实现方法及系统,本发明方法包括对传入的向量操作数vd的每个元素规约到[‑π/4,π/4]区间,获得对应的整型向量vql以及位于[‑π/4,π/4]区间内的浮点数向量vdr;对整型向量vql取余数获得整型向量vqln;根据泰勒级数展开方法,使用超越函数加速指令对浮点数向量vdr和整型向量vqln进行多项式近似计算,得到向量正弦函数或向量余弦函数计算结果vr。本发明对于使用固定长度指令编码的指令集架构,无需使用额外的地址计算指令和向量加载指令从常量池中获取多项式近似的系数常量,从而极大提升了向量正弦函数与向量余弦函数的性能。
  • 用于乘法和累加操作的处理器单元-202080082664.0
  • J·莱恩斯塔拉;A·瓦格纳;J·莫雷拉;B·汤普托 - 国际商业机器公司
  • 2020-11-30 - 2022-07-12 - G06F9/302
  • 提供了一种用于乘法和累加(“MAC”)操作的处理器单元,该处理器单元包括:多个MAC单元,用于执行MAC操作集合,其中所述多个MAC单元中的每个MAC单元包括执行单元和一写一读(“1W/1R”)寄存器文件,其中所述1W/1R寄存器文件具有至少一个累加器;以及另一寄存器文件,其中每个MAC单元的执行单元被配置为通过计算从所述另一寄存器文件接收的值集合的乘积并且将所计算的乘积加到至少一个累加器的内容来执行所述MAC操作集合,其中每个MAC单元被配置为在单个时钟周期中执行所述相应MAC操作子集。
  • 在屏蔽寄存器中反转和置换位的装置和方法-201810006909.6
  • E·乌尔德艾哈迈德瓦勒;R·瓦伦丁 - 英特尔公司
  • 2014-06-17 - 2022-06-10 - G06F9/302
  • 描述了一种用于在屏蔽值上执行位反转和置换的装置和方法。例如,描述了执行指令以执行以下操作的处理器:读取存储在源屏蔽寄存器中的多个屏蔽位,所述屏蔽位与向量寄存器的向量数据元素相关联;以及执行位反转操作以将每个屏蔽位从源屏蔽寄存器复制到目的屏蔽寄存器,其中所述位反转操作使得来自所述源屏蔽寄存器的位要在所述目的屏蔽寄存器内被反转,产生原始位布置的对称镜像。
  • 基于一种面向risc-v的编译器设计实现方法-202210166748.3
  • 蔡斌;葛云生;丁赟;张立志;李斌;徐培欣;吴静 - 厘壮信息科技(苏州)有限公司
  • 2022-02-23 - 2022-05-27 - G06F9/302
  • 本发明涉及编译器设计的技术领域,公开了基于一种面向risc‑v的编译器设计实现方法,包括:设计构建PE计算单元,所述PE计算单元包括浮点数量化单元、乘积累加单元以及寄存器;基于PE计算单元构建二维脉动阵列;扩展上述构建的二维脉动阵列,并将扩展后的二维脉动阵列作为编译器的编译计算模块;编译器接收原始数据以及编译操作指令,利用编译计算模块进行数据的计算存储。本发明所述方法基于risc‑v指令集实现编译器的设计构建,且所设计的编译器基于多个PE计算单元可实现神经网络的参数计算,所设计的编译器通过实时对计算结果进行量化,提高了编译计算的速度,基于双缓存机制的编译计算模块将会提高计算设备的吞吐量,减少PE计算单元的空闲时间。
  • 处理方法、处理装置及相关产品-202011270378.5
  • 不公告发明人 - 中科寒武纪科技股份有限公司
  • 2020-11-13 - 2022-05-13 - G06F9/302
  • 本披露公开了一种处理方法、处理装置及相关产品。该处理装置可以实现为计算装置包括在组合处理装置中,该组合处理装置还可以包括接口装置和其他处理装置。该计算装置与其他处理装置进行交互,共同完成用户指定的计算操作。组合处理装置还可以包括存储装置,该存储装置分别与计算装置和其他处理装置连接,用于存储该计算装置和其他处理装置的数据。本披露的方案提供了指令并行的解决方案,其可以提高指令并行度,从而提高机器的处理效率。
  • 处理单元、加速单元、相关装置和方法-202011127249.0
  • 方菲菲 - 平头哥(上海)半导体技术有限公司
  • 2020-10-20 - 2022-05-06 - G06F9/302
  • 本公开提出一种处理单元、加速单元、相关装置和方法。该处理单元包括:取指令单元,用于从所述处理单元外部的存储器取回计算机指令;指令译码单元,用于对取回的计算机指令进行译码;指令执行单元,用于执行译码后的所述计算机指令,以实现:接收第二模型部分,所述第二模型部分包括声学识别模型的权重阵列分块对应的向量运算、与所述声学识别模型的分类层中分解出的指数运算;执行所述向量运算、和所述指数运算;发送所述向量运算的运算结果、和所述指数运算的运算结果。本公开实施例充分利用了硬件芯片中的计算资源,提高了模型运行效率。
  • 基于存算一体存储器的矢量处理器及其运行方法-202011187585.4
  • 燕博南 - 北京苹芯科技有限公司
  • 2020-10-30 - 2022-05-06 - G06F9/302
  • 本发明涉及一种基于存算一体存储器的矢量处理器,包括:乘法存算一体模块,其被配置为计算第一输入向量X与第一输入矩阵W的乘积,所述乘积为第一输出向量Y’;以及加法模块,其被配置为将第一输入向量X或第一输出向量Y’与第二输入向量B相加。本发明还涉及这样的矢量处理器的运行方法。通过本发明,可以在处理器芯片内完成加法和乘法以及乘加操作,由此显著地扩展矢量处理器的应用场景并降低其执行上述计算所需的硬件和软件成本。此外,本发明通过将加法运算集成到矢量存储器内,使得本发明的矢量存储器可以较好地适用于矢量空间运算,例如可完全地执行神经网络计算中的乘加运算,由此大大提高运算速度和效率。
  • 一种点云文本格式快速读取与写入方法-202111560450.2
  • 向泽君;滕德贵;龙川;李超;袁长征;苟永刚;饶鸣;李创;胡小林;张恒;王灵犀 - 重庆市勘测院
  • 2021-12-20 - 2022-04-08 - G06F9/302
  • 本发明提供一种点云文本格式快速读取与写入方法,点云文本格式读取方法使用预先构建的读取对照表,通过扫描文本文件中的每一个浮点数字符串,逐个累加浮点数的整数部分和小数部分进行读取;将点云写入文本文件的方法使用预先构建的写入对照表,把任意4位数直接转换为字符串进行写入;本发明采用查表的方法,本发明可以解决现有技术中存在的对于海量点云文本格式数据,读写速度慢、效率低的技术问题;避免了大量的库函数调研,可实现海量点云与文本格式之间进行快速转换。在相同的计算机硬件环境下,比使用系统函数进行转换快10倍左右。
  • 运算方法、装置、计算机设备和存储介质-201910620768.1
  • 不公告发明人 - 上海寒武纪信息科技有限公司
  • 2019-07-10 - 2022-03-29 - G06F9/302
  • 本公开涉及一种运算方法、装置、计算机设备和存储介质。其中的组合处理装置包括:机器学习运算装置、通用互联接口和其他处理装置;机器学习运算装置与其他处理装置进行交互,共同完成用户指定的计算操作,其中,组合处理装置还包括:存储装置,该存储装置分别与机器学习运算装置和其他处理装置连接,用于保存机器学习运算装置和其他处理装置的数据。本公开实施例所提供的运算方法、装置、计算机设备和存储介质的适用范围广,进行运算的处理效率高、处理速度快。
  • 指令处理方法、数据处理方法及装置-202010895906.X
  • 张文蒙 - 平头哥(上海)半导体技术有限公司
  • 2020-08-31 - 2022-03-01 - G06F9/302
  • 本发明公开了一种指令处理装置,包括:第一寄存器,适于存储多个第一源数据;第二寄存器,适于存储多个第二源数据;第三寄存器,适于存储顺序信息,顺序信息适于指示第二源数据的乘法操作执行顺序;解码器,适于接收乘累加指令并进行解码,乘累加指令指示:第一、第二、第三寄存器分别作为第一、第二、第三操作数;执行单元,适于执行解码后的乘累加指令,以便从第一寄存器中获取多个第一源数据,从第二寄存器中获取多个第二源数据,从第三寄存器中获取顺序信息,将多个第一源数据分别与顺序信息所指示的对应第二源数据相乘,得到多个乘法结果,将多个乘法结果相加以得到乘累加结果。本发明一并公开了相应的指令处理方法、数据处理方法及装置。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top