《阿里云天池&阿里巴巴:2021数字经济新型基础设施研究(71页).pdf》由会员分享,可在线阅读,更多相关《阿里云天池&阿里巴巴:2021数字经济新型基础设施研究(71页).pdf(71页珍藏版)》请在三个皮匠报告上搜索。
1、下一代分布式文件管理系统分布式文件存储的发展历程所谓分布式存储,就是将大量的普通服务器,通过互联网对外作为一个整体提供存储服务。这种存储方式通常具有可扩展性、可靠性、高性能、易维护等特性。在互联网发展的初期,人们使用电子邮件等应用是基于中心化服务器与一系列传输协议构建的。每一次对话产生的记录、信息都被中心化的存储在单点服务器中。如果发生单点故障,那么服务器数据无法被访问,应用将无法运行。随着计算机系统和各类应用软件的蓬勃发展,中心化的存储方式逐渐发生变革,P2P 的传输方式逐渐萌芽。前区块链时代的分布式存储。2000 年一位来自美国的大学生 Shawn Fanning 开发了一款名叫 Naps
2、ter 的软件,在该程序中可以下载自己想要的 MP3 文件,同时也可以上传自己的 MP3 文件,供他人下载。随之而来的,是这个软件带来的 P2P 文件传输技术的雏形,受此启发,BT(BitTorrent)协议横空出世。自此,中心化的存储方式发生巨大变革,不再依靠中心化服务器,点对点的文件存储传输应用风靡一时。以 BT 为例,其作为内容分发协议拥有诸多优势与中心化服务器不同,BT 协议下对同一内容下载的人数越多,下载的速度越快,使用这种方法可以使下载服务器同时处理多个大体积文件的下载请求,而无须占用大量带宽。磁力链接亦在此基础上发展,其不基于文档的 IP 地址或定位符,而是在分布式数据库中,通过散列函数值来识别、搜索来下载文档,即每种文件内容均有唯一哈希值作为 ID,使用分布式哈希表技术实现全网络的寻址与存储。因为不依赖一个处于启动状态的主机来下载文档,所以特别适用没有中心服务器的对等网络。