MCPLive > 杂志文章 > 触摸海量存储的技术之光

触摸海量存储的技术之光

2010-08-31GF10X《微型计算机》2010年8月上

空间利用更有效——改进硬盘数据存储方式的高级格式化技术

在描述怎样才能提高硬盘每平方英寸数据密度之前,我们先来了解一项号称能够提升硬盘10%左右容量的新技术。该新技术相当于变相提升数据存储密度,这就是近很火热、已经被应用在实际产品上的高级格式化技术(Advanced Format)。

在电脑刚兴起的年代,硬盘的容量并不大,6.4GB的硬盘就可以称之为海量。因此选择512byte作为一个数据小节也是比较恰当的。但后来伴随着硬盘的容量从几GB一路增长到1TB甚至2TB—在进入TB时代后,传统的数据存储方式就出现了一些不必要的浪费。

 
传统格式化硬盘的数据存放方式和高级格式化技术存放方式的对比

我们假设有10GB的文件,如果按照512byte一个小节来划分的话,每一个小节不仅需要小容量的Sync/DAM区域,还需要配备40byte的ECC区域。如果仅考虑ECC文件空间,那么每次数据记录时,附加文件的体积大约需要占据整个存储空间的40÷(512+40)=7.2%。也就是说,我们存储10GB的内容,不考虑Sync/DAM区域和其他间隙扇区(Sector Gap),需要至少732MB的空间来存放校验内容,实际额外耗费的硬盘空间甚至在1GB左右。

而高级格式化技术的大特点在于将每个数据小节的容量由512byte扩大到4kB。为什么选择4kB呢?首先,X86计算机的内存分页就是4kB;其次,一些磁盘文件系统格式如NTFS等,每一个数据簇都是4kB;第三,微软的新操作系统直接支持4kB读取。选择4kB意味着一个数据节就可以存储整个内存分页文件和一个文件数据簇,非常方便。

在高级格式化技术将小节扩大到4kB后,ECC空间也相应扩大到100byte。如果仅考虑ECC文件空间,那么每次数据记录时,附加文件的体积大约占据100÷(4×1024+100)=2.3%。大大缩小了附加文件占据的体积。如果此时存储10GB的文件,多耗费硬盘空间(考虑Sync/DAM区域和其他间隙扇区在内)大约在300MB~400MB左右,相比之前的1GB左右节省了不少。

需要注意的是,这里所说的空间节省,是指在硬盘制造过程中,能够有效利用的空间更大,容易生产出单碟容量更高的硬盘,这种空间节省并不会明显增加硬盘的容量,凭空多出10%的空间的事情几乎不存在。此外,高级格式化技术在使用中还存在一定的问题,主要体现在对老的系统如Windows XP兼容性不好,需要使用硬跳线或者软件方法校准数据。当然,高级格式化技术还能够提升硬盘的纠错效率、格式化效率以及可靠性。总的来说,这项技术对硬盘厂商的意义远大于消费者,因为消费者购买的1TB容量的硬盘不大可能凭空变成1.1TB容量。目前采用高级格式化技术的主要是西数的绿盘系列硬盘,例如WD20EARS。

硬盘格式化都包含哪些内容?

所谓格式化,是为硬盘上存储数据的空间画好区域,便于用户操作时存放数据。既然有高级格式化,肯定有“传统格式化”。“传统格式化”在管理硬盘时,会将整个文件划分为很多很多个小节。每个小节存储的文件数据大小为512byte。有读者就要问了,这么多小节存放起来不是很麻烦吗?数据的连贯性和正确性怎么保证呢?为了解决这个问题,科学家为每小节都添加了一个Sync/DAM区域,用于保证数据的连贯性;另外,还有一个校验区域,用于保证512byte数据的正确性。在这里,你可以把硬盘存储数据的方式想象成火车。每一个数据小节都是一节车厢,这节车厢为了和前后车厢连接,肯定会有接头,接头部分就是Sync/DAM区域。为了保证每节车箱内的东西不被偷,还需要找一个专门的看护人员,这就是校验区域。

本文导航

分享到:

用户评论

用户名:

密码: