不止从2017,这里为你保存了1981年以来的互联网记忆

虽然互联网的记忆很短暂,但也能留住一些东西。

编辑熊宇2019年05月15日 18时40分

或许你早就听说过互联网的记忆很短暂,但它可能比你想象的更短暂。

这种“短暂”是物理的,在通常环境下,光盘与硬盘中的数据只能储存几十年;刻录光盘的保存时间更短,通常不到10年;SSD硬盘一年不通电,会出现数据丢失的现象。与此相比,看起来落后的纸张与简帛,却能为我们带来两千多年前的历史记载。

这种“短暂”又不只是纯物理的,昨天还能看见,今天就能看不见,可能是因为服务器故障、网络故障、存储故障、终止服务或其他原因……不管因为什么,对网络访问来说,“无法连接”就意味着消失于人们的视野,“拒绝开放”对其他人来说无异于“并不存在”。‌

在数字时代,一切信息看起来都唾手可得,但唾手可得的一切又可能会随时消失。这既充满希望,又使人心怀恐惧。

一篇关于Roguelike的文章中的30年前

在游戏媒体工作,搜寻资料的技能是必备的,但一些老资料实在是年深月久、无从寻觅。

去年,我写了一篇Roguelike这个名字的来历与变迁的文章。在写作中,最让我苦恼的事情是“Roguelike”这个词最初在什么地方被使用,又是谁把它确定成了如此普遍的用法(甚至是一个游戏类型)。

当然,说起这个名字,大家都会提到《Rogue》,但这可不够

经过长时间搜索,一些零散的讨论和介绍性的文章将线索指向了Usenet上的讨论。Usenet,这对我们来说可能是极度陌生的一个词,我们可以将它理解为一个论坛,当然是上古的论坛——甚至古老到你无法用浏览器访问它。

你还记得IE 6.0吗,由于Windows XP在中国有高普及度,IE 6.0是许多人接触的第一个浏览器。现在想来它已经是十分古老了,对不对?而这个古老浏览器的版本是6.0,此前还有5个大版本,IE浏览器的第一个版本来自1995年,而Usenet比初版的IE浏览器还早了15年。

现在,使用Usenet需要专门的客户端。从原理上来说,Usenet的运行与电子邮件颇为类似。和电子邮箱有供应商一样,Usenet也是将一台主机作为专用服务器,发言的用户向这台主机发送“邮件”(当然与电子邮件的格式不一样),另一些需要查看该内容的用户则需要从主机手动下载这个帖子。

Usenet会产生巨大的传输和储存压力,图中显示的便是1341天当中几个主要群组产生的数据量

用一种不那么恰当的描述,对用户来说,使用Usenet时他们向一个公共的邮箱发送电子邮件,同时,他们可以查看这个邮箱上的所有邮件,并且手动将邮件下载到电脑上查看具体内容。这听起来很不方便——你能想象每看一个帖子和每一个回复都要重新下载一次吗?但在互联网时代早期,Usenet却开辟了一片公共的空间,使得一群人有了共同交流的场所。

我在Usenet上找到了所需要的资料:原来,“Roguelike”这个名字是由数百人经过多次投票,在否定了“Dungeon”“Alphabet-Soup”“Hacklike”等等一众名称,又经过了长时间的适应过程后,才让人们接受了它的结果。

我看着这些讨论,参加讨论的人们当年可能是20、30、40岁,现在已经变成了50、60、70岁。他们现在可能已经不玩游戏了,但在当时,这些只有字符在跳跃的游戏在他们的眼中却是一个崭新的奇幻世界,以至于他们坚信,不应该将这些游戏和传统游戏放在一起,应该拥有一个自己的名字。他们当然不会想到数百人的讨论确定的名字会有日后的风光——现在这个类型在全球可能有数以亿计的受众。

古老的Usenet与留住它的Google Groups

Usenet太硬核了,不仅不方便使用,而且使用的费用不低。由于主机要频繁进行下载与发送文件,Usenet的网络主机往往由专业供应商提供——这意味着上网之外的额外付费。费用往往根据流量计算,每个月的报价大概在5~20美元之间。

由于Usenet主机供应商有些难以寻找,有用户总结了一份可供参考的供应商列表

不过,在网页浏览器普及之后,Usenet的模式显得并不方便,在这种不方便的基础上还有额外付费,Usenet的现状也就可想而知了。对于熟悉这个时代网络的新用户来说,Usenet的门槛几乎是难以逾越的,谁会付费购买一个不方便,又没有太大必要的服务呢?要知道,就连更方便的RSS订阅都有日渐不受欢迎的趋势了。

Usenet的没落是一种进步,是技术发展的必然结果。但Usenet的价值却不仅仅在于这个架构本身,更重要的是,它在30年中积累下来的海量内容。一名游戏爱好者有一天想要溯源“Roguelike”能从这里寻迹,一名对其他领域有兴趣的人也能从Usenet中找到他想要的东西——Usenet本身就记录了历史。

早在Usenet被应用的早期,它的用户们自己就提出了这样的问题。1982年,一名叫Scott Orshan的用户在Usenet上提出,“任何网站都应该永远保留它所发布的所有文章”(Every site should keep all the articles it posted, forever.),与这个观点一同提出的还有他的Usenet帖子的分布式归档方案。此后的数年,Usenet一直在系统地备份并储存积累的帖子,并为之设计出了检索等功能,这些计划的参与者既包括个人,也包括商业公司。

其中,第一家基于网页的Usenet数据库由Deja News公司在1995年开始建立,2001年,该公司被谷歌收购。随后,谷歌推出了Google网上论坛(Google Groups),除了使用Deja News的数据库外,此前曾建立过自己数据库的个人与公司纷纷将自己保留的数据捐献给谷歌,而谷歌也将这些档案免费开放给所有人。

现在,任何人都可以用网页在Google网上论坛中查看Usenet上自从1981年以来保存下来的帖子。

这些数据可能经过几个备份的网站,最终汇聚在这里,而它们只是简单的几句网络聊天

Google网上论坛实质上是两类东西的混合,一方面它是论坛,或更接近新闻组(可以近似地理解为依附电子邮箱的Usenet),能够像普通论坛一样发表帖子,阅读别人的帖子;另一方面,它也是一个网络档案馆,它所保留下来的许多东西已经与我们有了足够的距离,可以称之为“历史”了。

这个时代的记忆力

互联网时代的人们获得了许多信息,不可避免地也会遇见信息的失去。在我们经历的时代中,网盘、种子、帖子都可以算是在网络上不断失去的东西。

曾经的网盘时代,人们争相使用网盘,甚至有“网盘将会逼得移动硬盘再无容身之地”的论断,但没多久,网盘大潮退去,市面上的产品所剩无几。留给我印象最深的,是那些网盘宣布关闭的前几天,所有人都在疯狂地下载自己存储的资源,他们抱怨说,储存的东西太多,下不完了,只能选择最想留住的东西。

种子是人们经常叹息的另一个内容,所有以种子发布的资源都面临着无法保存的问题。和网盘不同,P2P下载依赖和取决于是否有人上传,因此,见到一个冷门的种子将会是一种奇异的期待:你能够看见它包含怎样的东西,但可能永远无法得到它。

帖子则是容易遗失的另一项要素。大到百度贴吧,小到只有不到百人的小众论坛……无论因为什么原因,删帖就意味着一项东西从我们的视野中消失。甚至,一些小众论坛因为无法为服务器续费的原因而关站时,所有的帖子,连同许多宝贵的数据也就直接消失。相比Usenet上有许多人来创建数据的保存与归档项目,我们的数据分散在个人手中,各种意外都会使得它们永远不见天日。

中国的互联网时代起步得晚,我们没有Usenet——我们有的各种聊天室、论坛、QQ空间、校内网、人人网、百度贴吧就是中国的Usenet。它们从中国的互联网早期就存在,并始终面临着丢失一些东西的风险——其中的很大一部分内容事实上已经失去了,只是你从未留意到罢了。

互联网的记忆其实不长,所以当我在Google网上论坛里找到许多上世纪的网络材料时,同时感受到了欣喜、羡慕与心酸的情绪。Google网上论坛在海外受到了一些人的批评,他们说谷歌提供的检索功能不够好,各项功能也长期不进行更新。我觉得这些看法都很有道理——我在其中检索时也费了不少功夫——但是,它如实地、长期地、稳定地记录下了当年的一切,甚至还是免费开放的,对此我又能抱怨什么呢?

4

编辑 熊宇

xiongyu@chuapp.com

还是想养狗

查看更多熊宇的文章
关闭窗口