我要上传

下载此文档

NVIDIAGPU结构(精).docx

文档分类：外语学习 | 页数：约4页举报非法文档有奖

1/4

下载提示

1.该资料是网友上传的，本站提供全文预览，预览什么样，下载就什么样。
2.下载该文档所得收入归上传者、原创者。
3.下载的文档，不会出现我们的网址水印。

同意并开始全文预览

1/4 下载此文档

文档列表 文档介绍

NVIDIAGPU结构
目前市场上的NVIDIA显卡都是基于Tesla架构的,分为G80、G92、GT200三个
系列。Tesla系统架构是一块拥有可扩展处器数目的办理器阵列。每个
GT200
GPU

包括

240个
NVIDIAGPU结构
目前市场上的NVIDIA显卡都是基于Tesla架构的,分为G80、G92、GT200三个
系列。Tesla系统架构是一块拥有可扩展处器数目的办理器阵列。每个
GT200
GPU

包括

240个流办理器(streamingprocessor,SP

每8个流办理器又组成了一个流

多
办理器(streamingmultiprocessor

’因sM此共有

30个流多办理器。

GPU

在工作时

,

工作
负载由

PCI-E

总线从

CPU

传入

GPU

显存,依据系统架构的层次自顶向下分

发。PCI-
规范中,每个通道上下行的数据传输速度达到了

,这样

PCI-

*16Gbit/s=10GB/s的带宽,故有效带宽为
8GB/S,而PCI-。但是因为PCI-E数据封包的影响,实质可用的带宽大体在5-6GB/s(PCI-。
在GT200架构中,每3个SM组成一个TPC(ThreadProcessingCluste线程办理器集群,而在G80架构中,是两个SM组成一个TPC,G80里面有8个TPC,因为G80
有128(2*8*8个流办理器,而GT200中TPC增添到了10(3*10*8个,此中,每个TPC
内部还有一个纹理流水线。
大多数时候,称呼streamingprocess。为流办理器,其实其实不太正确,因为若是
称streamingprocess。为流办理器的话,自然是隐式的与CPU相对,但是CPU有独立的一套输入输出机构,而streamingprocesso并无,不能够在GPU编程中使用printf
就是一个例证。将SM与CPU的查对照更加适合。和现在的CPU的核同样,SM也拥有
完好前端。
GT200和G80的每个SM包括8个流办理器。流办理器也有其余的名称,如线程办理器,核”等,而最新的Fermi架构中,给了它一个新的名称:CUDACore。SP并不是独立的办理器核,它有独立的寄存器和程序计数器(PC,但没有取指和调换单元来组成完好的前端(由SM供给。所以,SP更加近似于今世的多线程CPU中的一条流水线。SM每发射一条指令,8个SP将各执行4遍。所以由32个线程组成的线程束(warp是Tesla架构的最小执行单位。因为GPU中SP的频率略高于SM中其余单元的两倍,所以每两个SP周期SP才能对片内储藏器进行一次接见,所以一个warp中的32个线程又
能够分为两个

half-warp,

这也是为何取数会成为运算的瓶颈原

因。Warp

的大小对操作
延和缓访存延缓会产生影响,取

Warp

大小为

32是

NVIDIAGPU结构(精) 来自淘豆网www.taodocs.com转载请标明出处.

猜你喜欢

相关文档更多>>

非法内容举报中心

文档信息

页数：4
收藏数：0 收藏
顶次数：0 顶
上传人：温柔的兰花
文件大小：15 KB
时间：2022-09-05

相关标签

无锡停电通知无锡停水通知芜湖停水通知吴江复工通知吴江停电通知五一放假安排通知五一假期通知五一节放假通知五一六通知五一长假放假通知

英语四六级英语专业四八级英语词典英语读物商务英语托福雅思/LSAT GRE GMAT 日语学习法语学习翻译基础知识英语阅读英语写作英语听力英语口语英语词汇英语基础英语学习

最近更新

在线
客服
微信
客服
QQ
客服
意见
反馈
手机
查看
返回
顶部