Red Team 红色小队论坛

 找回密码
 立即注册
查看: 7999|回复: 16

[内存] AMD Zen全新架构细节曝光:高度致敬Intel

  [复制链接]

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
发表于 2015-8-15 20:36:21 | 显示全部楼层 |阅读模式

马上注册加入红色小队,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
本帖最后由 冶天 于 2015-8-16 19:26 编辑

http://news.mydrivers.com/1/442/442785.htm

AMD将于2016年推出全新的Zen CPU架构。在经历了推土机家族的惨败后,AMD已经在高端市场上萧条了好多年,服务器市场也完全溃败,Zen只许成功不许失败。

今天,我们又获得了该架构的一些技术细节,挺有意思的。

首先,Zen架构将会支持SMT同步多线程技术,也就是和Intel超线程技术完全相同的那一套,一个物理核心可处理两个逻辑线程。

具体的核心、线程调度机制也和Intel的类似,力求做到他山之玉可以攻石。

推土机上的“配对核心”设计将被彻底抛弃,回归单个独立核心,尤其是浮点计算单元不再由两个核心共享,而是每个核心一个。

不过,三级缓存仍是每两个核心共享一部分

指令集方面,Zen架构将会兼容ISA,也就是Intel Haswell/Broadwell上引入的那些,而且完全兼容现有软件,无需任何编程调整。

处理器除了硬件设计,编译器优化也是十分关键的。Zen将会重点优化GCC、LLVM,力争在SPECint v6、Visual Studio等环境中的性能表现媲美Intel。

当然啦,AMD也不是完全照抄对手。强大的GPU图形核心、超高带宽的HBM显存,这些都是AMD Zen独有的优势。

我们现在还无法预言Zen的理论、实际性能表现,但即便能够做到自己设想中的境界,压力依然很大。Intel更新换代的步伐虽然慢了下来,但多年累积的领先优势实在很大,2016年还会推出第三代14nm Kaby Lake,并且再往后就要上10nm。

AMD能做到最好的,就是尽量缩小和对手的性能差距。


HBM EHP APU

HBM EHP APU

1

主题

6

帖子

96

积分

R100

Rank: 2

精华
0
金币
70
经验
10
贡献
0
发表于 2015-8-15 20:41:08 | 显示全部楼层
这是个服务器版吧16核的

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
 楼主| 发表于 2015-8-15 20:50:55 | 显示全部楼层
daokd 发表于 2015-8-15 20:41
这是个服务器版吧16核的

可能 民用要精简一部分内核和HBM 量产小 成本高 合作定制 先优化 再转下来

79

主题

816

帖子

1万

积分

Polaris

Rank: 14Rank: 14Rank: 14Rank: 14

精华
0
金币
13841
经验
10
贡献
0
发表于 2015-8-15 21:49:41 | 显示全部楼层
要是4核8线程的APU也能有两颗HBM2显存,那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问题啊
葵花在手,啊哈哈哈哈哈哈!
江山我有,啊哈哈哈哈哈哈!

8

主题

55

帖子

3737

积分

R520

Rank: 5Rank: 5

精华
0
金币
3222
经验
10
贡献
0
发表于 2015-8-16 05:30:46 | 显示全部楼层
这标题 2333 什么致敬都是浮云,AMD逆袭指日可待!!!

0

主题

122

帖子

4721

积分

R580

Rank: 6Rank: 6

精华
0
金币
3759
经验
10
贡献
0
发表于 2015-8-16 08:35:52 | 显示全部楼层
z23wen 发表于 2015-8-15 21:49
要是4核8线程的APU也能有两颗HBM2显存,那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问 ...

那一块APU得多大
农企好好努力,市场需要良性竞争

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
 楼主| 发表于 2015-8-16 08:36:37 | 显示全部楼层
冰夷流云 发表于 2015-8-16 05:30
这标题 2333 什么致敬都是浮云,AMD逆袭指日可待!!!

主要还是务实 部分交叉授权的东西 也只是一方面 重点是编译器两家完整识别 自动定位 更多应用开发有没有使用开源的 大部分都是隔壁和微软的

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
 楼主| 发表于 2015-8-16 08:46:42 | 显示全部楼层
z23wen 发表于 2015-8-15 21:49
要是4核8线程的APU也能有两颗HBM2显存,那就爽歪歪了。
据说HBM2单颗带宽可以达到256MB/S,带1536SP都没有问 ...

你数据 好像打错了 我看到信息是 每个堆栈的带宽翻番为256GB/s 还的看总线是共享带宽 还是各自独享轮循 但也是显示 看架构将来更多公布 还有桥频率等 还是上次说的 很可能是CPU北桥和GPU的入口 混合的总控 减少了拷贝 直接增加SP计算规模 这是HSA的发展方向 也就是说是入口强化做了一些工作 GCN的SP就专门承担计算

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
 楼主| 发表于 2015-8-16 08:51:13 | 显示全部楼层
补充:
一致性缓存,提升数据调用与共享的速率,提升性能降低功耗
  过去,GPU内部核心通信需要程序员或者编译着插入明确的同步指令,来将共享数据送回内存,这种设计虽然简单,但是增加了共享数据和应用程序的开销,效率不高。而GCN架构将打通核心之间的算法沟通,将L2缓存数据格式统一,GPU各核心直接调用其中数据,比显存共享数据更快。

▲缓存一致性架构
  另外,GCN架构还在CPU与GPU之间引入了虚拟内存,简化了CPU与独显之间的数据移动,CPU与GPU无缝共享一个单一地址空间,共享数据,而不用复制转移。这对于提高效率,降低功耗起到了至关重要的作用。
◆高度并行的SIMD,GCN精简架构,提高性能
  早起的VLIW受限于编译器的性能,寄存器端口冲突,硬件资源没法充分利用,GCN架构中,采用了性能更高,更简单的矢量寄存器,寄存器文件可以分成独立的四个分区,矢量寄存器(vGPRs)含有64个通道,32bits位宽,相邻组合起来,每个SIMD有vGPRs 64KB分区,这样保证了带宽,消除了端口冲突,这也使得硬件运算资源更加趋于饱和。

▲GCN计算单元
  两个新的指令:4x1 SAD和Quad SAD,提升GPU相关应用程序性能(比如视频稳定技术SteadyVideo2.0)
◆兼具灵活性与可编程性,为加速异构应用带来无限可能
  全新架构不仅带来了更强大的运算效率,同时在底层异构运算上也做了巨大的优化,相比过去,GPU已经不仅仅是一个简单的图形中心,GCN架构将使得其具有高度的可编程性,使用更加灵活。AMD积累的CPU与GPU设计经验,将二者优势进一步融合。新产品可以通过DirectCompute、OpenCL、C ++ AMP等关键行业标准访问GPU,进而加速了主流应用程序,最终将实现无缝异构计算。
  整体来讲,GCN架构在统一指令流、标量管线调度等功能上,以及真正的工作中提高了GPU利用率,实现更高性能。基于28nm工艺第一代GCN架构GPU,其每瓦性能和每平方毫米性能均比前代产品提升50%!

0

主题

2

帖子

34

积分

R100

Rank: 2

精华
0
金币
22
经验
10
贡献
0
发表于 2015-8-16 10:44:59 | 显示全部楼层
反正我要入手860K+370X了

79

主题

816

帖子

1万

积分

Polaris

Rank: 14Rank: 14Rank: 14Rank: 14

精华
0
金币
13841
经验
10
贡献
0
发表于 2015-8-16 11:05:25 | 显示全部楼层
反正以后HSA不一定要APU,也可以是AMD cpu+ AMD GPU
葵花在手,啊哈哈哈哈哈哈!
江山我有,啊哈哈哈哈哈哈!

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
 楼主| 发表于 2015-8-16 11:46:13 | 显示全部楼层
z23wen 发表于 2015-8-16 11:05
反正以后HSA不一定要APU,也可以是AMD cpu+ AMD GPU

HSA想做大 未来会支持任意架构 这属于一种生态上的模式制定

9

主题

148

帖子

4311

积分

R580

Rank: 6Rank: 6

精华
0
金币
3113
经验
10
贡献
3
发表于 2015-8-16 16:49:33 | 显示全部楼层
AMD不是计划明年直接通过GF上14纳米么?

3330

主题

1万

帖子

14万

积分

特邀嘉宾

{[(A家A友)]}:功归功,过归过.尘归尘,土归土.

Rank: 20Rank: 20Rank: 20Rank: 20Rank: 20

精华
0
金币
116075
经验
10
贡献
32
 楼主| 发表于 2015-8-16 16:55:01 | 显示全部楼层
自由的风 发表于 2015-8-16 16:49
AMD不是计划明年直接通过GF上14纳米么?

内容显示是2016 明年 看是先发异架构计算还是民用的

5

主题

225

帖子

4406

积分

R580

Rank: 6Rank: 6

精华
0
金币
3421
经验
10
贡献
0
发表于 2015-8-16 21:31:55 | 显示全部楼层
看成品再说,ZEN必须做出来特色,靠玩性价比没有活路

0

主题

6

帖子

40

积分

R100

Rank: 2

精华
0
金币
24
经验
10
贡献
0
发表于 2015-8-23 11:49:46 | 显示全部楼层
只要制造工艺上去了。。。。其他问题不大

0

主题

6

帖子

192

积分

R100

Rank: 2

精华
0
金币
146
经验
10
贡献
0
发表于 2015-9-6 11:15:39 | 显示全部楼层
猴年马月才能用上啊,太浮云了
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表