微软的Project Silica提供强大的千年存储

导读 Ars周二与英国剑桥微软研究院首席研究员Ant Rowstron博士就名为Silica的创新冷藏项目进行了交谈。二氧化硅旨在替代磁带和光学存档光盘,作...

Ars周二与英国剑桥微软研究院首席研究员Ant Rowstron博士就名为Silica的创新冷藏项目进行了交谈。二氧化硅旨在替代磁带和光学存档光盘,作为大规模(非常)长时间的冷藏的首选介质。微软研究院与电影巨头华纳兄弟公司(Warner Bros.)合作,后者直接对降低成本和提高自己的冷库计划的可靠性感兴趣。

所讨论的介质是一块高纯度玻璃,该玻璃已用飞秒激光蚀刻了体素。每个体素在延迟和角度两个属性中存储多个位,然后可以使用显微镜成像和偏振光读取这些位。通过将激光聚焦到块自身内所需的深度,可以在2mm深的玻璃中将体素写入100层或更多层。

目前对Silica的读写速度尚不理想-去年大约花费了一周的时间来记录超人的大约76GB数据,而Rowstron估计,重新读取数据大约需要三天的时间。从此取得了进步。当然,该技术仍处于起步阶段,预计读写所需要的时间将大大减少。Rowstron说,他仍然不希望有人会尝试直接从其Silica唱片中直接扮演超人,但这并不是它的初衷。

真正的长期数据归档是一项非常昂贵的提议。当我上大学时,我参加了大学档案部门的一个研究项目,该部门需要一个数据库应用程序来索引和跟踪其数字媒体馆藏,以便在很大程度上预算并进行存档在预期的刷新周期内进行更新操作。它的较早的模拟音频和视频磁带录像需要进行数字化,其光学CD和DVD录像需要进行读取,检查完整性,并在原始光盘分层之前刻录到新介质上。

任何规模的档案刷新周期都会迅速变得艰巨。如果假设您有10,000张CD的集合,以及一个由三到四个本科生组成的团队,这些CD-RW驱动器和一大堆光盘,则您需要花费一年多的专职工作来刷新它们。(华纳兄弟公司的预算比我母校图书馆的稀有收藏部门要高得多,它在严格的三年周期内迁移其自己的数字档案数据。)

更糟的是,刻录的CD的寿命通常很短-它们仅在五年后就很容易开始发生故障,因此至少应经常对其进行测试,即使没有更新“是否需要”也要进行测试。通过在5C / 41F和30%的相对湿度下存储光盘,可以大大延长光盘的使用寿命,但这会增加存储和维护的额外费用。

这就是Project Silica即将解决的问题。尽管目前读写速度相当慢,但二氧化硅的介质(不多于或少于高纯度玻璃)不共享胶带,光盘甚至纸张的故障模式。石英玻璃块不是复合介质。没有CD,DVD或Blu-Ray那样的塑料外壳会磨损,也没有磁性介质会从磁带或硬盘的表面物理损失。

二氧化硅有望在几乎任何温度,湿度和化学环境下都能生存数千年-实际上,二氧化硅只是玻璃,人们对玻璃的物理和化学性质也非常了解。我们只能使用加速老化技术来猜测更复杂的制造材料(胶带,盘片等)的特性,但数千年来的玻璃人工制品很容易研究。

除了该介质已经令人印象深刻的抗降解能力(基本上可以预期它会用锤子敲打它以外的任何东西)之外,该项目还使用了具有前向纠错功能的真实文件系统,以进一步确保存储的数据不会损坏或丢失。另外,诸如标题,索引,日期等之类的元数据可以被蚀刻到人类可读文本中每个Project Silica块的表面。

就像《上帝之眼》的粉丝们已经知道的那样,对于任何一种有望持续数千年的数据存储方法,都必须回答一个剩余的问题-当围绕存储介质的技术和文化背景崩溃时会发生什么?二氧化硅也通过使用初始的“地面真相”轨迹来解决此问题。该小组正在使用机器学习算法来重新读取Silica的数据,如果丢失了这些经过训练的算法,那么新算法可以在“地面真相”轨道上进行非常快速的训练,从而教会他们如何解释其余的信息。数据。

我们忍不住要问罗恩斯特龙博士关于尼文和普尔内尔的莫蒂斯在他们的周期性文明崩溃之一之后如何应对二氧化硅计划的问题。即使没有机器学习技术,使用Project Silica技术存储数据的研究人员也应该能够沿着“地面”的相同发现路径,找出如何仅使用优质显微镜和偏振光来读取数据的方法。真相”追踪了人工神经网络的行为。