一、前言:首款满血的PCIe 4.0 SSD到来 时代在变,然而思维陈旧的人会始终难以适应时代的变化!很多人无法理解ARM处理器的性能超越X86处理器,最强的RISC处理器(精简指令集)比不上最弱的CISC(复杂指令集)处理器似乎就是天经地义,苹果M1处理器的诞生颠覆了很多人的认知。 在SSD领域也有同样的情况,似乎MLC闪存天生就比TLC高贵,TLC SSD再怎么努力也赶不上最弱的MLC。而三星980PRO SSD的诞生同样将颠覆大多数玩家对于TCL SSD的认知,这是三星第一款采用TLC闪存的顶级SSD产品,也是第一款满血的PCIe 4.0固态硬盘。 1、PCIe4.0 x4的理论带宽 下面是PCIe各版本链路性能指标: 有很多同学奇怪为什么PCIe通道的传输率的单位使用GT/s而不是我们常见的Gbps、GB/s,主要原因是传输率还包括不提供额外吞吐量的开销位,比如 PCIe 1.x和PCIe 2.x使用8b / 10b编码方案,会占用了20%的原始信道带宽,也就是实际吞吐量只有传输率的8成。 PCIe 3.0的物理层协议使用了全新的128b/130b编码方案,也就是说有效吞吐量可以达到原始信道带宽的128/130。因而,PCIe 3.0协议的每一条通道的实际带宽= 8.0GT/s * 128 / 130/8=984.6MB/s。那么PCIe 3.0 x4就能提供3938MB/s的吞吐量。 PCIe 4.0协议的传输率翻倍到了16GT/s,同样也是使用了128b/130b编码方案,PCIe 4.0 x4的吞吐量可以达到7976MB/s,是PCIe 3.0 x4的二倍。 2、PCIe4.0 SSD的理论速度是最高可以达到多少? 任何数据PCIe系统传输,都会产生一定的开销。PCIe设备是以TLP的形式发送报文的,数据报文在Device Core产生之后,在分别经过事务层(Transaction Layer)、数据链路层(Data Link Layer)、物理层(Physical Layer)之后会依次被增加ECRC,Sequence Number,LCRC,Start,END等数据块。 PCIe 3.0/4.0 中一个TLP最高可以携带4096Bytes有效数据,不过通常它会受到设备以及主板支持的共同限制,多数情况下被限制在256Bytes。 TLP head长度可选12Bytes或者16Bytes,Memory Read/Write TLP中采用32位地址时,TLP head长度为12Bytes,采用64位地址时TLP head长度为16Bytes 因此PCIe 3.0/4.0 中TLP的有效数据率=256/(4+2+16+256+4+4)=89.5%。 那么PCIe 4.0 SSD可达到的最高理论带宽应该=7976 MB/s *89.5%=7138MB/s。 3、如何才能达到PCIe4.0 SSD最高理论速度? 简单的说就是主控和闪存的关系! 主控的最高速率=接口速率x通道数/经验倍率。比如群联的PS5016-E16主控。这款主控使用800MT闪存接口,8个通道理论上可以达到6.4GB/s,经验倍率是1.28,于是实际上最高只能支持6.4GB/s÷1.28=5GB/s。这数字与7138MB/s相去甚远。 三星Elpis同样也是8道通主控,不过闪存接口速度高达1200MT/s,扣掉1.28的经验倍率,实际带宽=1200*8/1.28=7500MB/s,已经超过PCIe 4.0 x4的理论带宽上限。 当然,就算主控再强,没有与之匹配的闪存肯定也无法发挥应有的性能。 三星980PRO 1TB SSD采用的是第六代V-NAND TLC闪存颗粒,堆叠层数从第五代的96层提升至136层,增加了约40%的单元。这颗闪存充分利用三星独创的“通道孔蚀刻”技术,通过建立一个由100多个层组成的导电晶片堆栈,从上到下垂直穿孔,形成均匀的三维电荷阱闪存(CTF)单元,堆叠层数从第五代的9X层提升至1XX层,增加了约40%的单元。 同时,三星还进行了更优化的电路设计,使其能够实现比第五代V-NAND更快的数据传输速度,而写入操作的时间少于450微秒(μs),读取操作的时间少于45μs,这2个指标都比上代提升了10%以上。 4、PCIe 4.0 SSD的前景 2019年7月AMD Zen2处理器发布的时候,PCIe 4.0还是曲高和寡。仅仅在一年多的时间,现在主流设备已经全面拥抱PCIe 4.0了。 AMD最新一代的RX 6000显卡,NVIDIA的RTX 30系显卡均支持PCIe 4.0,Intel的Z490主板绝大部分也支持PCIe 4.0(需要搭配即将发布的Rocket Lake第十一代酷睿处理器),AMD的B550、X570主板也早已支持PCIe 4.0。另外,微软和索尼的次世代主机Xbox Series X和PS5也都采用了PCIe 4.0 SSD。 PCIe 4.0 SSD的另外一个意义就是,等到明年微软正式推出DirectStorage技术之后,三星980PRO可以凭借7000MB/s的读取速度做到秒进游戏,这也是很多玩家期盼已久的事情。 三星980PRO SSD的详细规格如下: 我们此次测试采用的是三星980PRO 1TB SSD,写入寿命为600TBW,售价为1899元,晚些时候,2TB版本也会上市。 二、外观:LPDDR4 DRAM缓存 + 铜箔散热标签 m.2 2280规格,容量1TB。 正面的贴纸标注有产品的型号、容量、产地以及序列号等信息,用户可以将此信息与包装盒上面的SN码进行对比,看看是否有二码合一。 背面的铜箔贴纸,有各种认证信息。铜箔是用来增强散热。 PCIe 4.0 SSD发热巨大总所周知,传统SSD用的纸标签阻挡了SSD热量向外传递。980PRO使用的是铜箔标签,能以最快的速度将SSD产生的热量传递到媒介。 铜箔散热标签在拥有良好散热效能的同时,相比传统的带散热片可以更轻松安装入笔记本电脑。 揭掉正面的贴纸可以看到2颗闪存、一颗DRAM缓存以及主控。 三星Elpis主控,采用8nm制程工艺,能够同时处理128个I/O队列,是前代Phoenix主控的4倍,是UBX主控的16倍(三星950PRO使用)。 右边是三星的LPDDR4 DRAM缓存,容量1GB。 三星第六代V-NAND 3-bit MLC颗粒,在前代9X层单堆栈结构基础上增加了约40%的单 元。单Die容量512Gb,采用8Die封装,单颗NAND容量可达512GB。 三、基准性能测试:读取速度可达6700MB/s 测试平台配置如下: 1、CrystalDiskInfo信息识别 我们手上有2块三星980PRO 1TB SSD。此前在Zen3的评测中大量使用,其中一个的写入量已经达到了32TB,另外一个也有3TB。 2、AS SSD 写入量3T的三星980 PRO 1TB测试成绩。1GB的读写测试分数为8966,顺序读写速度分别为5532MB/s和4082MB/s;4K随机读写速度分别是82MB/s、202MB/s。 然后做10GB读写测试,得分达到了9012,甚至比1GB容量测试的分数更高。顺序读写速度分别为5563MB/s、4065MB/s;4K随机读写速度分别是82MB/s、204MB/s。 这是写入量已经达到32TB的三星980 PRO 1TB SSD,不论是顺序还是4K随机读写速度都出现了一定程度的下滑。总分也从9000分跌到了8200左右。 上面是AS SSD BenchMark 1GB的数据测试结果。在顺序写性能方面,三星980PRO 1TB比同为PCIe 4.0的影驰HOF 2TB快了将近1200MB/s、写入快了200MB/s。其他三款PCIe 3.0 SSD的读取速度都在3000M/s以下,写入不过与2900MB/s。 在4K性能方面,三星980PRO 1TB的读取速度达到了82MB/s,写入202MB/s,均傲视群雄。 |