下载此文档

NVIDIAGPU结构(精).docx


文档分类:外语学习 | 页数:约4页 举报非法文档有奖
1/4
下载提示
  • 1.该资料是网友上传的,本站提供全文预览,预览什么样,下载就什么样。
  • 2.下载该文档所得收入归上传者、原创者。
  • 3.下载的文档,不会出现我们的网址水印。
1/4 下载此文档
文档列表 文档介绍
NVIDIAGPU结构
目前市场上的NVIDIA显卡都是基于Tesla架构的,分为G80、G92、GT200三个
系列。Tesla系统架构是一块拥有可扩展处器数目的办理器阵列。每个
GT200
GPU

包括

240个
NVIDIAGPU结构
目前市场上的NVIDIA显卡都是基于Tesla架构的,分为G80、G92、GT200三个
系列。Tesla系统架构是一块拥有可扩展处器数目的办理器阵列。每个
GT200
GPU

包括

240个流办理器(streamingprocessor,SP

每8个流办理器又组成了一个流


办理器(streamingmultiprocessor

’因sM此共有

30个流多办理器。

GPU

在工作时

,

工作
负载由

PCI-E

总线从

CPU

传入

GPU

显存,依据系统架构的层次自顶向下分

发。PCI-
规范中,每个通道上下行的数据传输速度达到了



,这样

PCI-


*16Gbit/s=10GB/s的带宽,故有效带宽为
8GB/S,而PCI-。但是因为PCI-E数据封包的影响,实质可用的带宽大体在5-6GB/s(PCI-。
在GT200架构中,每3个SM组成一个TPC(ThreadProcessingCluste线程办理器集群,而在G80架构中,是两个SM组成一个TPC,G80里面有8个TPC,因为G80
有128(2*8*8个流办理器,而GT200中TPC增添到了10(3*10*8个,此中,每个TPC
内部还有一个纹理流水线。
大多数时候,称呼streamingprocess。为流办理器,其实其实不太正确,因为若是
称streamingprocess。为流办理器的话,自然是隐式的与CPU相对,但是CPU有独立的一套输入输出机构,而streamingprocesso并无,不能够在GPU编程中使用printf
就是一个例证。将SM与CPU的查对照更加适合。和现在的CPU的核同样,SM也拥有
完好前端。
GT200和G80的每个SM包括8个流办理器。流办理器也有其余的名称,如线程办理器,核”等,而最新的Fermi架构中,给了它一个新的名称:CUDACore。SP并不是独立的办理器核,它有独立的寄存器和程序计数器(PC,但没有取指和调换单元来组成完好的前端(由SM供给。所以,SP更加近似于今世的多线程CPU中的一条流水线。SM每发射一条指令,8个SP将各执行4遍。所以由32个线程组成的线程束(warp是Tesla架构的最小执行单位。因为GPU中SP的频率略高于SM中其余单元的两倍,所以每两个SP周期SP才能对片内储藏器进行一次接见,所以一个warp中的32个线程又
能够分为两个

half-warp,

这也是为何取数会成为运算的瓶颈原

因。Warp

的大小对操作
延和缓访存延缓会产生影响,取

Warp

大小为

32是

NVIDIAGPU结构(精) 来自淘豆网www.taodocs.com转载请标明出处.

相关文档 更多>>
非法内容举报中心
文档信息
  • 页数4
  • 收藏数0 收藏
  • 顶次数0
  • 上传人温柔的兰花
  • 文件大小15 KB
  • 时间2022-09-05