千家信息网

大容量文件服务器备份方案

发表于:2025-02-05 作者:千家信息网编辑
千家信息网最后更新 2025年02月05日,公司有一台文件服务器,提供给设计部门,用来存放图纸,空间10T,已使用容量9.2T,文件约为100万个。由于文件服务器使用一台较为低端的DELL R320加上几个SATA硬盘做的RAID5,为安全计,
千家信息网最后更新 2025年02月05日大容量文件服务器备份方案

公司有一台文件服务器,提供给设计部门,用来存放图纸,空间10T,已使用容量9.2T,文件约为100万个。由于文件服务器使用一台较为低端的DELL R320加上几个SATA硬盘做的RAID5,为安全计,需要备份数据。

对于备份的方案前期我们也做了一些调研,比如使用备份一体机还是使用传统的方案来进行备份。并且对各方面进行了一番对比。



备份一体机传统
备份原理在设计部文件服务器上安装备份代理,定期通过网络备份到一体机通过DFS复制,实时或定期将文件副本写入新服务器,定期对新服务器存储的文件备份到本地
安全性因为其使用linux做为底层,不易受到勒索病毒***,文件不易被删除,安全性较高使用windows,在windows上使用备份工具备份,易受到勒索病毒***,存在安全风险
可靠性使用单独的一体机,只用于备份设计部文件服务器时,可靠性较高使用wsb,文件易被误删除,导致无法还原,可靠性比一体机低
如果DFS出错,未能同步,可能导致数据丢失
底层OS为windows,备份做为一种工具或程序存在,OS故障,则导致备份可能无法还原
备份时间按备份速度为50MB/s,即网络流量为400Mbps,单次全备时间预计60个小时以上除首次同步外,不需长时间占用网络流量,在同一台机器上备份
价格16000055000
优势可靠性高,操作简单,易于验证,不易出错价格较低,只购买一台服务器,且服务器可以用于提供文件服务(备用文件服务器)
劣势价格较高可靠性和安全性比备份一体机低,无售后技术支持



简单的来讲,使用备份一体机,就是使用一台专门的一体机,只为这10T内容进行备份。因为10T的内容按照备份速度50MB/s,需要58小时才能备份完成。如果使用原有的备份一体机,那么在这个时间段内,其他数据的备份可能存在资源冲突。也有可能,10T数据备份,加上其他数据备份到同一台,这10T数据可能需要3-5天的时间才能完成。所以需要一台专门的备份一体机来为这10T数据备份。

而使用传统方案,则是使用卷影副本+DFS+WSB。具体是这样操作:在原有的服务器上,我们对存放数据的10T的卷做了卷影副本,如果空间充足,可以提供多达64个以前的版本。新购买一台服务器,可用空间50T,价格约为5.5万元,数据存放划分两个区,一个20T的空间用于存放DFS的已复制文件夹,另一个30T的空间用于使用WSB进行备份。DFS即分布式文件系统,可以用来抵御因硬件损坏带来的单点故障(与备份不同),这样,如果原有的10T服务器当机后,这台机器依然可以提供给用户访问。而数据的备份就依靠windows server backup来做了,经过测试环境的检验,使用WSB默认设置,即完全备份-副本备份,其实际上做的备份会进行重复数据删除或者说实际上做的是增量备份,除第一次全备外,并不会每次备份10个T的数据,而只会备份增量的数据。通过这个方案,我们可以抵御硬件带来的单点故障,对于小量的文件恢复,可以使用卷影副本来恢复,而如果面对服务器感染勒索病毒等情况下,还有备份可以还原。当然,前提是服务器需要打好补丁,安装好正版的杀毒软件。

两个方案报给领导,领导决定使用传统的备份方案。

接下来需要准备在实验环境下进行测试了,主要是考虑到10T的数据,进行DFS的初始复制需要的时间很长。根据微软网站上的实验,1400万个文件,共10T,进行初始同步花费了24天,微软网站上把这个形成为一种针对网络的***。官方推荐的做法是预先通过将目标服务器上放置源服务器上存在的数据,并且通过导出DFS数据库,再导入数据库到目标服务器的方式来减少DFS初始同步的问题。

我先把要点捋一下:

一、 在两台服务器上都安装DFS复制组件,DFS复制与DFS命名空间是分开的,可以不安装DFS命名空间。将源服务器(10T)加入到复制组并且创建已复制文件夹。使之成为初始复制的主要成员。

二、在源服务器上导出DFS数据库的克隆

三、使用robocopy将源服务器(10T)的数据拷贝到目标服务器(50T)

四、 在目标服务器上将第二步在源上导入的DFS数据库导入到目标服务器

五、 将目标服务器加入到复制组

六、进行初次同步


注意问题:

1. 目标服务器不要在最开始的时候加入到已复制组,需要等到数据复制完成,DFS数据库导入完成后再加入。

2. 目标服务器和源服务器不要搞混,源服务器指拥有权威数据的服务器,它应该被设置成为初始复制的主服务器,也称为上游服务器;目标服务器是指新服务器,没有数据的50T服务器,也称为下游服务器。

3. 在下游服务器上,不要手动创建被同步的文件夹,这两个文件夹应该由robocopy来创建,以免文件HASH存在不一致,导致DFS初始化时间过长。

4. 进行初始复制的时候,由上游服务器做为权威,会去同步下游服务器。而此时下游服务器上存在,上游服务器上不存在的数据,会被存放到下游服务器的dfsrprivate\preexiting这个目录下。这个目录是隐藏的,就在你的已同步文件夹里面。显示隐藏和系统文件即可看到。

5. 可以适当调整暂存文件夹和冲突和已删除文件夹的大小。建议暂存文件夹至少为4需要同步的最大文件的大小,否则,可能会报错。

接下来,我们开始实验

实验环境:有两台windows server 2012的虚拟机,dc201201 IP:192.168.99.98,充当DC以及DFS复制的上游服务器; dc201202 IP:192.168.99.99,充当DFS复制的下游服务器。

实验目标:上游服务器上存在数千个文件,需要使用预播的方式存到下游服务器,以便初次同步能迅速完成。

已复制文件夹名称:部门文档


DFS复制

一、 在DC201201上安装AD域服务,并且将其提升为新林contoso.com中的第一个域的DC

二、 域控安装完成之后,在两台机器上分别安装DFS复制这个管理组件。

Install-WindowsFeature -Name Fs-Dfs-Replication -IncludeManagementTools

三、 在两台服务器上分别创建分区E和F,大约都为50G。在dc201201的E盘创建了部门文档文件夹,并且放入了4875个文件,大小约为900M。

四、在上游服务器上创建复制组,创建一个已复制文件夹,并指定该文件夹在上游服务器的物理位置。

验证:等待DFS复制的事件日志中出现4112,这表示这台服务器DC201201是初始化复制时的主文件夹。

五、导出上游服务器的克隆数据库和卷配置的XML文件,它还要求该卷上的任何已复制文件夹都未处于初始同步阶段。

在这一个通PS创建了一个e:\dfsrclone的文件夹,并且将E盘的信息做出了一个克隆,注意,这个并不是真实的数据文件的克隆。

在这一步实施的时候,建议让用户不要访问e:\部门文档上的内容,因为这会导致克隆的效率降低。更重要的一点是,在初始复制完成以前,绝对禁止用户访问下游(目标)服务器上的文件。

在克隆数据库的时候,它给出了如何将数据和数据库复制到下游服务器的命令,按照给出的命令执行即可,目标可以使用UNC路径的方式来表示。

五、验证数据库的导出和上游服务器初始复制已经准备好。分别通过日志2402和2002表示。日志2402表示克隆的数据库已经导出完成,2002表示初始复制已经在主服务器上准备好。

六、将已复制文件夹内的数据使用robocopy复制到下游服务器。需要特别注意的是,目标路径不能在下游服务器上手动创建,让robocopy自动创建即可。

通过robocopy的显示,共复制了4875个文件,1002M,花费了21秒。

执行的命令

```

Robocopy.exe"e:\部门文档""\\dc201202\E$\部门文档"/ E / B / COPYALL / R:6 / W:5 / MT:64 / XD DfsrPrivate / TEE /LOG+:preseed.log

/E:

```

请勿在卷的根目录上使用robocopy / MIR选项,不要在下游服务器上手动创建已复制的文件夹,也不要运行先前已复制的robocopy文件(即如果必须重新开始,请删除目标文件夹和文件结构,并真正重新开始)。让robocopy创建所有文件夹,并在每次运行时通过/ e / b / copyall选项将所有内容复制到下游服务器。否则,您很可能最终会出现哈希不匹配。

接下来,我们需要将导出的E盘的数据库XML文件通过xcopy复制到下游服务器,同时,在这个时候,为了模拟上游服务器有人使用,复制了几个大文件到上游服务器。

七、验证文件HASH,验证两台服务器上的文件的HASH值是否一致,如果HASH一致,则表示这些文件在初始复制的时候无需再进行同步了。建议在多个目录下进行比对。

八、在下游服务器上导入数据库和XML文件,在导入之前,请确保下游服务器的e:\system volume information\dfsr这个文件夹不存在。

也可以使用以下方法来确保DFSR里不存在任何文件。

1. 创建一个e:\empty的文件夹

2. robocopy "e:\cmpty" "e:\system vloume information\dfsr" /mir

本文略过此步

九、验证下游服务器的数据库和XML文件导入是否成功,通过DFS复制的日志来查看,2412,2416,2404.看到日志2404则表示已经完成了导入。

十、 将下游服务器dc201202加入到复制组

十一、验证初始复制是否成功,需要等待DFS复制日志4104,请注意,在这里不会出现日志4102.如果在上游导出了克隆后,上游又有数据被更改了,那么这些文件将以权威的方式复制到下游服务器。

至此,DFS的复制工作完成。我们来下游服务器上看看数据是否被复制过来了。

验证一下同步功能,在下游服务器上删除红色HDTV01.MKV这个文件,查看上游是否会同步。

验证结果是可以同步。

卷影副本

vssadmin add shadowstorage /for=d: /on=e: /maxsize=2GB

1. 卷影副本最多可以支持多达64个以前的版本,如果超过64个,它会自动删除最前面的版本。

2. 卷影副本不适合大量读写的文件,可能导致CPU占用率居高不下

在这里,我准备的方案是在两台机器上都开启卷影副本。卷影副本占用的空间,我的做法是上游服务器1T,下游服务器2T。实验环境,都是取10%

首次开启卷影副本,会自动创建一次。在我的实际环境中,10T的数据空间,将卷影副本放到另外一个1T的空间。保存了64个副本。

提示:卷影副本不能完全当成备份使用,特别是你的磁盘空间不足的情况下,如果磁盘被擦写一次完整的,可能会丢失所有的卷影副本。

备份

安装windows server backup备份工具,并且进行默认的备份,默认的备份指完全备份,副本备份。下次有时候我再去执行非副本方式的备份。

一、在下游服务器, 通过向导安装wsb

在这里,默认的备份频率是每天一天或者多次,我们可以更改任务计划里的back的相关计划来调整频率。

进行首次备份,然后,添加1G文件,再进行第二次备份。查看两次备份总共占用的空间大小。

E盘已用空间4.42G,F盘目前占用空间为0.1G

备份第一次后,F盘已用空间为6.02GB

复制两个总共1G的文件,到E:\部门文档

再次执行备份,F盘已用空间为6.1G。

通过这个实验,我们进行了两次完全备份,第一次占用了6G空间,第二次备份,只占用了0.1G。它并没有占用两次备份的数据之和的空间。所以说明它是增量备份或者说是进行了重复数据删除的。(还要去查资料)

数据还原:

打开windows server backup,点击恢复,可以通过日期来看到备份编录。

灾难恢复

如果哪一天,50T空间的服务器操作系统故障,重装了,如何来有效的利用这上面的数据呢?

1. 卷影副本:

重装前的卷影副本有四次,

重装系统以后的数据:

2. 备份的数据

重装系统以前,备份的数据有以下几次

在重装后的系统启用WSB的恢复向导

请注意上图,11月2日到6日,数字加粗了,就表示有备份。这样,即使是重装了系统,也可以把原来的卷影副本和备份的数据找到。当然,由于这个备份的平台是Windows平台,一定要考虑好安全问题,一个是即时打补丁,一个是安装杀毒软件。 另外一点就是,DFS我们这个实验中设置的时实时的同步,也可以选择为非实时的,即多长时间复制一次,比如每周二、周六晚上0点到7:00进行复制,甚至也可以使用robocopy进行复制。像我原来公司的文件服务器就是每周三次的robocopy进行的复制,这样有一个好处就是万一哪天原文件服务器被勒索病毒***,加密了,我还有一个缓冲的时间,这样至多丢失三天的数据。





附全文脚本:(PS的脚本我也不熟悉,除了导出和导出数据库和XML以外,窃以为,其他的都可以通过GUI来实现)

On the upstream DC201201 server:

New-DfsReplicationGroup "VSS" |

New-DfsReplicatedFolder -FolderName "部门文档" | Add-DfsrMember -ComputerName dc201201

Set-DfsrMembership -GroupName "VSS" -ComputerName dc201201 -ContentPath "E:\部门文档" -PrimaryMember $True -FolderName "部门文档"

Update-DfsrConfigurationFromAD

Get-WinEvent "Dfs replication" -MaxEvents 4 | fl

New-Item -Path "E:\Dfsrclone" -Type Directory

Export-DfsrClone -Volume E: -Path "E:\Dfsrclone"

Robocopy.exe "E:\部门文档" "\\dc201202\E$\部门文档" /E /B /COPYALL /R:6 /W:5 /MT:64 /XD DfsrPrivate /TEE /LOG+:preseed.log

Robocopy.exe E:\Dfsrclone \\dc201202\e$\Dfsrclone

On the downstream DC201202 server (note: you may need to stop the DFSR service to perform the first step; be sure to start it up again so that you can run the import)

RD "E:\System Volume Information\DFSR" -Force -Recurse

Import-DfsrClone -Volume E: -Path "E:\Dfsrclone"

Get-WinEvent "Dfs replication" -MaxEvents 10 | fl

Add-DfsrMember -GroupName "VSS" -ComputerName "DC201202" | Set-DfsrMembership -FolderName "部门文档" -ContentPath "E:\部门文档"

Add-DfsrConnection -GroupName "VSS" -SourceComputerName "DC201201" -DestinationComputerName "DC201202"

Update-DfsrConfigurationFromAD DC201201,DC201202

Get-WinEvent "Dfs replication" -MaxEvents 10 | fl




服务 服务器 备份 文件 数据 文件夹 副本 空间 同步 数据库 目标 部门 文档 一体 一体机 验证 时间 实验 方案 日志 数据库的安全要保护哪些东西 数据库安全各自的含义是什么 生产安全数据库录入 数据库的安全性及管理 数据库安全策略包含哪些 海淀数据库安全审计系统 建立农村房屋安全信息数据库 易用的数据库客户端支持安全管理 连接数据库失败ssl安全错误 数据库的锁怎样保障安全 淮南dell服务器配件稳定可靠 物流软件开发工具课件 安徽众亿成网络技术有限公司 哪个是数据库api接口 使用数据库必须用jdbc吗 宁波大学计算机复试数据库 抚顺市网络安全宣传 湖北企业软件开发费用是多少 大数据和云计算与网络安全 常熟中高端服务器货源充足 电脑服务器断开联接法 如何把电脑设置成服务器 软件开发从零开始学可以吗 数据库怎么设置计算 软件开发模型的过程 用c做软件开发很累 无线网络技术谁发明的 环球一家网络技术北京 信息技术必修一数据库 网络安全书法作品28字 以互联网和科技促进教育均衡发展 软件开发版本管理常用的分支 廊坊师范学院有几个数据库 联通通用服务器中标 价格适中的网络安全评估 数据库查询语句where格式 崇左林怀网络技术有限公司 网页代理服务器ip 大连广昱软件开发有限公司 怎么给服务器ip授权
0