服务器不需要换油和轮胎压力检查等维护,但在许多方面拥有充当服务器的计算机设备有点像拥有车辆。驾驶汽车不涉及工程技能,运行服务器也不需要您是硬件工程师或软件开发人员。,对于汽车,您需要掌握一些基本知识,包括换油和轮胎压力检查以及偶尔的服务。同样,服务器需要日常维护,而不仅仅是每月支付托管费用的问题。您的服务器需要大量的定期维护,实际上比车辆要多得多。,,您无需成为工程师即可进行此维护,但您应该知道,为数百万客户提供服务的 24/7 运行的服务器将需要服务器维护计划。它很少涉及物理磨损,您不会听到服务器在搜索文件时发出吱吱声。但在软件层面,存在一层磨损。让我们来看看。,服务器中的移动部件通常会持续一生,例如,没有人打开硬盘驱动器并为轴承上油。在最坏的情况下,您可能需要更换一两个风扇,但即使是这些也很少会放弃幽灵。但是,服务器确实会产生软件意义上的“里程”。,随着时间的推移,您的服务器将建立大型存储库和记录,包括会降低交易率的缓存文件。随着时间的推移,SQL 表的碎片也是一个问题。随着交易量的增加,旧的服务器设置可能不再有效,您的服务器软件将成为攻击者的软目标。最后,HDD 和 SSD 最终都会退化,尽管这种情况会在很长一段时间内发生。,当服务器降级时会发生什么?好吧,充其量您可能会遭受服务器性能下降的困扰,这可能会导致您的工作量出现故障并导致客户不满意。在最坏的情况下,您可能会面临严重的数据损坏和数据丢失,或者由于黑客攻击而导致的数据盗窃。值得庆幸的是,我们指出的大多数服务器维护问题都可以使用服务器维护计划来解决。,我们之前说过服务器不像汽车,它们不需要物理维护,但在许多方面,服务器实际上就像汽车一样,它们确实需要软件维护。就像您的汽车一样,一些维护任务会很紧迫,需要经常关注,而另一些则只需要年度审查。例如,您不会每个月检查引擎和车灯,但至少每月检查一次轮胎压力。让我们看一下服务器维护的一些时间间隔:,
每日服务器检查,当您负责服务器维护计划时,您需要每天检查很多事情。首先,检查更新,包括病毒扫描程序的数据库和其他可以防止零日攻击的关键软件更新。事实上,您应该仔细查看软件和硬件供应商的漏洞声明,以便您可以修补服务器以抵御攻击。还要查看您的安全日志以获取入侵企图的证据,以便您有机会阻止这些用户。,,
每周服务器检查,您应该不太频繁地验证您的备份是否正常工作。没有必要每天都这样做,因为当您的备份突然停止工作时,不太可能需要备份。尽管如此,每周检查是必不可少的。您应该每周甚至每两周进行的另一项检查是磁盘使用情况。同样,磁盘使用情况很少会突然发生变化,因此您不需要每天检查。但是,磁盘空间不足可能意味着您的服务器出现故障。注意诸如帐户过时和过时的临时文件之类的问题。,
每月服务器检查,我们建议您每两个月优化一次数据库,数据库碎片以每月高达 5% 的速度发生,随着时间的推移,碎片将真正影响性能。调整单个应用程序也很重要,因为未优化的应用程序会损害性能。但是,由于流量水平变化很大,因此将应用程序调整限制为每两个月一次会很有用,这样您就可以很好地衡量应用程序负载水平。,
实时服务器检查,我们列出了您每天需要检查的大量要点,但有些检查必须实时完成。换句话说,一整天。这些服务器运行状况数据点可以在负载激增时发出信号,并且及早发现问题有助于防止服务器完全故障:停机代价高昂。大多数这些因素都可以使用服务器监控工具轻松检查,事实上,您甚至可以获得自动警报。例如,您可以检查 CPU 和整体服务器温度、RAID 卷的健康状况和负载因素,包括打开的网络连接数。,
支票如何变成计划,那么现实中的服务器维护计划是什么?好吧,维护计划只是一个固定的时间表,它概述了上述哪些检查是实时、每天或每月完成的。做到这一点并不难:尽管大型运营商将拥有内部技术人员,但小型企业可以依靠远程员工或其他公司来做到这一点。但是,如果您全靠自己,请不要绝望:您可以制定自己的服务器维护计划,而且一点也不难。,一个好的起点是根据您试图通过活动实现的目标对维护活动进行分类,并从那里开始。在本文中,我们将其分为三个区域。,首先,我们将了解您在发生紧急情况时需要采取的应对措施,称之为应急计划。其中包括在出现紧急情况时获取警报等步骤,以及在出现问题时快速恢复服务的能力。,接下来,我们将考虑您应该采取的措施,以防止紧急情况的发生。例如,您可以主动进行安全检查、分析性能数据并检查服务器资源的使用情况。,,最后,我们将看看一些作为一种保险的措施,以防您遇到服务器问题。这些活动,包括审核您的备份和进行故障转移检查,将确保您可以在需要时快速恢复您的服务器。,不同的车辆有不同的故障点:火箭的故障点可能与赛车上的非常不同。同样,不同的服务器有不同的故障根本原因:邮件服务器可能发生故障的原因与 Web 服务器发生故障的原因大不相同。,出于这个原因,我们不能建议一个单一的计划来准确地告诉您需要监控什么,以确保您在紧急情况下快速响应。相反,我们将通过概述您应该考虑的内容来引导您朝着正确的方向前进。我们将使用 Web 服务器作为典型示例。,
服务器容量和用户需求问题,您的服务器不是为管理无限需求而构建的:它有容量限制。有时需求会出乎意料地上升,也许有人向一百万人发送了一封广受欢迎的电子邮件,或者社交媒体上的某些东西触发了需求。这可能会导致内存过载、磁盘无法响应以及服务器无法提供页面。,同样,在共享主机的环境中,一些用户可以运行占用大量资源的应用程序。事实上,一些用户可能故意滥用服务器资源,因为他们不注意他们产生的服务器负载量。,最后,有时服务器过载是由编码错误引起的。写得不好的脚本可能会导致内存泄漏和其他资源问题。作为服务器维护计划的一部分,您必须注意那些利用超出其公平份额的服务器资源的脚本和用户,同时密切关注服务器利用率。,
服务器攻击和恶意软件,我们生活在一个服务器攻击非常普遍的时代。这些可以有几种不同的形状。例如,机器人可能会尝试蛮力进入您的机器,而这涉及的数千个同时查询将导致容量问题。成功的攻击可能导致未经授权访问您的计算机。,恶意软件是另一个重大威胁,通过未公开和未修补的漏洞注入软件可以让黑客进入您的计算机,再次提供未经授权的访问,并可能导致您的服务器被用作攻击其他计算机的临时站点。,除了数据丢失和容量问题等未经授权访问的风险外,这些攻击还可能导致声誉损失:换句话说,您的服务器可能会被排除在搜索引擎结果之外,您会发现您的流量急剧下降。作为服务器维护计划的一部分,请注意攻击。,,
错误和失败,服务器是高度连接的设备:无论是在硬件和软件的内部还是外部。注意网络问题,包括与数据库后端或服务器所依赖的其他应用程序的连接断开。,硬件是您需要注意的另一点,例如确保 RAID 卷保持健康,并观察 CPU 和机箱温度等关键指标。最后,如果冗余电源出现故障 – 立即更换它,同样存在 RAID 卷问题。,本质上,您需要监控所有级别的服务器统计信息:网络流量、利用率、负载等,以便您可以在出现异常时注意到。只有这样,您才能进一步调查。但是,当您注意到紧急情况正在发展时,制定一个可以实施的计划会有所帮助。,我们已经概述了在监控新出现的问题时需要注意的事项,但预防胜于治疗。同样,它稍微取决于您正在运行的服务器,但让我们看看您可以添加到服务器维护计划中的一些预防性维护,其中相关服务器是数据库服务器。,
碎片整理和检查索引和完整性,数据库涉及大量的读写操作,需要快速处理,因此数据库可能会变得碎片化。删除查询尤其会导致碎片,这就是为什么定期优化数据库中的表以减少导致性能问题并减少可用空间的碎片很重要的原因。,同样,您的预防性服务器维护计划应该定期进行索引分析,优化 MySQL 如此依赖的索引。MySQL 有一个分析功能,您应该每月运行一次,以确保 MySQL 始终可以快速找到数据。分析简化索引并确保快速执行查询。,数据库完整性可能是一个问题,由于数据库崩溃和其他应用程序错误,MySQL 有时会丢失对数据集的跟踪。每周检查数据库完整性可以防止查询失败,因为它为 MySQL 提供了修复错误的机会。,
检查磁盘运行状况和空间,就像数据库完整性一样,您不能将磁盘健康视为理所当然。始终确保检查服务器日志,因为您可以在此处找到 HDD 和 RAID 错误通知。这些错误表明硬盘驱动器或 RAID 卷即将出现故障,让您有机会在驱动器关闭服务器之前更换驱动器。,服务器因驱动器空间不足而摔倒并不是什么新鲜事。您必须为数据库增加空间、进行备份和处理大型数据库事务留出空间。通过删除临时文件、不再相关的备份和其他陈旧数据来释放空间。,集群效率很重要,如果要防止运行缓慢的查询和数据库错误,数据库集群应该高效同步。同样,早期检测是关键,因为它可以防止代价高昂的数据库崩溃。,,
审查 SQL 日志,当你的 MySQL 服务器发现表损坏或索引问题时,它会记录错误。审核您的日志将确保您获得可能的数据库故障的早期警告:充满错误的日志是一个确定的警告信号。,慢查询是另一个需要注意的地方。除了突出整体性能问题外,它还指示哪些特定查询导致性能问题,允许您调整这些以提高服务器性能。,最后,每月对您的服务器速度进行一次健康检查将为您提供一个记录,以便您可以检测到您的服务器何时开始遇到瓶颈。然后,您可以在出现更严重的问题之前更轻松地解决这些瓶颈。,总体而言,您需要一定程度的服务器管理经验才能真正了解服务器性能会引发危险信号,表明潜在问题正在逼近。无论您运行 Web 服务器、数据库服务器还是其他东西,预防性维护都是关键。,预防性计划是避免灾难的关键,但即使是运行最好的服务器环境也偶尔会面临灾难。你如何回应?显然,最重要的目标是让一切重新运转起来。,有了经过深思熟虑的灾难恢复计划,您可以在一分钟或更短的时间内启动并运行。并非每个用例都需要如此快速的周转,如果他们的网站关闭一两个小时,一些网站所有者不会看到太大的伤害。对于其他人来说,每一分钟的停机时间都是收入损失。,有多种选择可以最大限度地减少停机时间。其中包括非常适合确保业务连续性的高可用性集群。具有容错能力的硬件(包括冗余电源)可以与故障转移镜像一起工作,以确保硬件故障不会导致长时间停机。,
灾难恢复的关键:您的备份,我们在上一段中提到的一些要点实施起来很昂贵,而且许多网站运营商都无法做到。但是有一点对于合理的服务器维护计划至关重要。这与您的备份有关。,首先,确保您的备份实际上每天都在完成。检查错误并确保您的备份工具报告正确的状态。接下来,您需要检查您的备份是否可以恢复:您可以检索数据,是否有任何损坏?始终监控您的可用磁盘空间,因为这是备份失败的主要原因。最后,对恢复过程进行测试运行,以验证它需要多长时间以及它是否在第一个实例中成功。注意可能导致恢复困难的意外故障,例如连接问题。,,
确定您的恢复计划,最后,在决定如何设置恢复计划以及投资多少时,您应该仔细考虑应用程序的要求。首先考虑您可以容忍多少停机时间:在损坏变得无法容忍之前,您需要多快恢复服务?,接下来,弄清楚您需要哪些计划、软件以及最终需要哪些硬件来制定灾难恢复计划。在这样做时,您可以将您可以接受的权衡与您不能接受的权衡相匹配。但无论您做什么,始终确保您检查并验证您的备份策略。,租用或托管服务器可咨询vsping科技在线客服。,
,服务器不需要换油和轮胎压力检查等维护,但在许多方面拥有充当服务器的计算机设备有点像拥有车辆。驾驶汽车不涉及工程技能,运行服务器也不需要您是硬件工程师或软件开发人员。,对于汽车,您需要掌握一些基本知识,包括换油和轮胎压力检查以及偶尔的服务。同样,服务器需要日常维护,而不仅仅是每月支付托管费用的问题。您的服务器需要大量的定期维护,实际上比车辆要多得多。,接下来,我们将考虑您应该采取的措施,以防止紧急情况的发生。例如,您可以主动进行安全检查、分析性能数据并检查服务器资源的使用情况。
服务器维护计划的基本组成部分
版权声明:本文采用知识共享 署名4.0国际许可协议 [BY-NC-SA] 进行授权
文章名称:《服务器维护计划的基本组成部分》
文章链接:https://zhuji.vsping.com/498230.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
文章名称:《服务器维护计划的基本组成部分》
文章链接:https://zhuji.vsping.com/498230.html
本站资源仅供个人学习交流,请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。