中文字幕一区二区人妻电影,亚洲av无码一区二区乱子伦as ,亚洲精品无码永久在线观看,亚洲成aⅴ人片久青草影院按摩,亚洲黑人巨大videos

有效的服務(wù)器維護:服務(wù)器維護計劃的重要組成部分

發(fā)布于:2021-01-08 01:25:24

0

873

0

服務(wù)器 服務(wù)器維護計劃 服務(wù)器檢查

服務(wù)器不需要以換油和胎壓檢查的形式進行維護,但是在許多方面,擁有充當(dāng)服務(wù)器的計算機設(shè)備有點像擁有車輛。駕駛汽車不涉及工程技能,并且運行服務(wù)器不需要您成為硬件工程師或軟件開發(fā)人員。

駕車時,您需要掌握一些基本知識,換油和輪胎壓力檢查以及不定期的保養(yǎng)。以同樣的方式,服務(wù)器需要例行維護,而不僅僅是每月支付托管費用。您的服務(wù)器需要大量的定期維護,實際上比車輛要多得多。

您無需成為工程師即可執(zhí)行此維護,但您應(yīng)該知道運行24/7的服務(wù)于數(shù)百萬個客戶端的服務(wù)器將需要服務(wù)器維護計劃。它很少涉及物理上的磨損,您不會在服務(wù)器搜索文件時聽到服務(wù)器吱吱作響的聲音。但是在軟件級別上存在一層磨損。讓我們來看看。

  • 為什么需要服務(wù)器維護計劃

  • 服務(wù)器維護計劃:簡介

  • 制定服務(wù)器維護計劃

  • 應(yīng)對新出現(xiàn)的問題:您需要注意的問題

  • 預(yù)防性維護:避免問題的關(guān)鍵

  • 災(zāi)難恢復(fù):制定計劃以啟動并運行

為什么需要服務(wù)器維護計劃

服務(wù)器中的活動部件通??梢允褂靡簧?,沒有人打開硬盤驅(qū)動器并為其軸承加油。在最壞的情況下,您可能需要更換一兩個風(fēng)扇,但即使是這樣,也很少會消失。但是,服務(wù)器確實會在軟件意義上引起“里程”。

隨著時間的流逝,您的服務(wù)器將建立大型存儲庫和記錄,包括可能會降低事務(wù)處理速度的緩存文件。隨著時間的流逝,SQL表的碎片化也是一個問題。隨著交易量的增加,舊的服務(wù)器設(shè)置可能不再有效,并且服務(wù)器軟件將成為攻擊者的軟目標(biāo)。最后,HDD和SSD最終都會降級,盡管這種情況會持續(xù)很長時間。

服務(wù)器降級時會發(fā)生什么?好吧,充其量您可能會遭受服務(wù)器性能下降的困擾,這可能會導(dǎo)致工作負(fù)載故障并導(dǎo)致客戶不滿意。在最壞的情況下,您可能會面臨嚴(yán)重的數(shù)據(jù)損壞和數(shù)據(jù)丟失,或者由于黑客入侵而導(dǎo)致數(shù)據(jù)失竊。值得慶幸的是,我們指出的大多數(shù)服務(wù)器維護問題都可以使用服務(wù)器維護計劃來解決。

服務(wù)器維護計劃:簡介

我們說過,早期的服務(wù)器不像汽車,它們不需要物理維護,但是從許多方面來說,服務(wù)器實際上就像汽車,因為它們確實需要軟件維護。就像您的汽車一樣,某些維護任務(wù)非常緊急,需要經(jīng)常注意,而其他維護任務(wù)僅需進行年度檢查。您不會每月檢查引擎和照明燈,例如,每月至少檢查一次輪胎壓力。讓我們看一下服務(wù)器維護的間隔:

每日服務(wù)器檢查

負(fù)責(zé)服務(wù)器維護計劃時,每天需要檢查很多事情。首先,檢查更新,包括病毒掃描程序的數(shù)據(jù)庫和其他關(guān)鍵軟件更新,這些更新可以防止零日攻擊。

實際上,您應(yīng)該仔細(xì)查看軟件和硬件供應(yīng)商提供的漏洞聲明,以便可以對服務(wù)器進行補丁攻擊。還請注意安全日志中是否有入侵嘗試的證據(jù),以便您有機會阻止這些用戶。

每周服務(wù)器檢查

不太頻繁地,您應(yīng)該驗證備份是否正常運行。不必每天執(zhí)行此操作,因為當(dāng)您的備份突然停止工作時,并不需要可能的備份。盡管如此,每周檢查還是必不可少的。

您每周甚至每兩周應(yīng)該做的另一項檢查是磁盤使用情況。同樣,磁盤使用率很少突然改變,因此您不必每天檢查一下。但是,磁盤空間不足可能意味著您的服務(wù)器出現(xiàn)故障。留意諸如過期和臨時文件帳戶之類的問題。

每月服務(wù)器檢查

我們建議您每兩個月優(yōu)化一次數(shù)據(jù)庫,數(shù)據(jù)庫碎片的發(fā)生率每月最高可達(dá)5%,隨著時間的推移,碎片會真正影響性能。調(diào)整單個應(yīng)用程序也很重要,因為未優(yōu)化的應(yīng)用程序可能會損害性能。

但是,由于流量水平變化很大,因此將應(yīng)用程序調(diào)整限制為每兩個月一次可能很有用,這樣您就可以很好地衡量應(yīng)用程序的負(fù)載水平。

實時服務(wù)器檢查

我們列出了您每天需要檢查的許多要點,但是有些檢查必須實時進行。換句話說,全天候。這些服務(wù)器運行狀況數(shù)據(jù)點可以發(fā)出信號,指示負(fù)載何時達(dá)到峰值,及早發(fā)現(xiàn)問題可以幫助防止服務(wù)器完全故障:停機成本高昂。

使用服務(wù)器監(jiān)視工具很容易檢查其中的大多數(shù)因素,實際上,您甚至可以獲得自動警報。例如,您可以檢查CPU和服務(wù)器的整體溫度,RAID卷的運行狀況以及負(fù)載因素,包括打開的網(wǎng)絡(luò)連接的數(shù)量。

支票如何變成計劃

那么實際的服務(wù)器維護計劃是什么?好吧,維護計劃只是一個固定的時間表,概述了上述哪些檢查是實時,每日或每月進行的。做到這一點并不難:盡管大型運營商將擁有內(nèi)部技術(shù)人員,但小型企業(yè)可以依靠遠(yuǎn)程人員或另一家公司來完成此任務(wù)。

但是,如果您自己一個人,不要失望:您可以建立自己的服務(wù)器維護計劃,這并不困難。

制定服務(wù)器維護計劃

一個很好的起點是根據(jù)維護活動要達(dá)到的目的對維護活動進行分類,然后從那里遷移。在本文中,我們將其分為三個區(qū)域。

首先,我們將研究您在緊急情況下需要采取的應(yīng)對措施,將其稱為緊急響應(yīng)計劃。這些步驟包括諸如在緊急情況下獲得警報,以及在出現(xiàn)問題時迅速恢復(fù)服務(wù)的能力。

接下來,我們將考慮您應(yīng)該采取的可避免緊急情況發(fā)生的步驟。例如,您可以主動進行安全檢查,分析性能數(shù)字并檢查服務(wù)器資源的使用情況。

最后,我們將研究一些操作,這些操作可在您遇到服務(wù)器問題時充當(dāng)一種保險。這些活動(包括審核備份和進行故障轉(zhuǎn)移檢查)將確保您在需要時可以快速還原服務(wù)器。

應(yīng)對新出現(xiàn)的問題:您需要注意的問題

不同的車輛具有不同的故障點:火箭的故障點可能與賽車的故障點非常不同。同樣,不同的服務(wù)器也有不同的失敗根源:郵件服務(wù)器可能失敗的原因與Web服務(wù)器崩潰的原因非常不同。

因此,我們無法建議一個單一的計劃來確切告訴您需要監(jiān)視的內(nèi)容,以確保您在緊急情況下能夠快速做出響應(yīng)。相反,我們將概述您應(yīng)考慮的事項,以正確的方向指導(dǎo)您。我們將使用Web服務(wù)器作為典型示例。

服務(wù)器容量和用戶需求方面的問題

您的服務(wù)器并非旨在管理無限需求:它具有容量限制。有時需求可能會出乎意料地上升,也許有人向100萬人發(fā)出了廣受歡迎的電子郵件,或者社交媒體上的某些東西觸發(fā)了需求。這可能導(dǎo)致內(nèi)存過載,磁盤無法響應(yīng)以及服務(wù)器無法提供頁面。

同樣,在共享托管的環(huán)境中,某些用戶可以運行消耗大量資源的應(yīng)用程序。實際上,某些用戶可以通過不注意他們生成的服務(wù)器負(fù)載量來故意濫用服務(wù)器資源。

最后,有時服務(wù)器過載是由編碼錯誤引起的。編寫不正確的腳本可能會導(dǎo)致內(nèi)存泄漏和其他資源問題。作為服務(wù)器維護計劃的一部分,您必須當(dāng)心腳本和用戶,他們不僅要充分利用服務(wù)器資源,而且還要密切注意服務(wù)器利用率。

服務(wù)器攻擊和惡意軟件

我們生活在一個服務(wù)器攻擊非常普遍的時代。這些可以有幾種不同的形狀。例如,機器人可以嘗試強行進入您的計算機,而與此同時涉及的成千上萬次查詢將導(dǎo)致容量問題。成功的攻擊可能導(dǎo)致未經(jīng)授權(quán)訪問您的計算機。

惡意軟件是另一個重大威脅,通過未公開和未修補的漏洞進行的軟件注入可以使黑客進入您的計算機,從而再次提供未經(jīng)授權(quán)的訪問,并有可能導(dǎo)致您的服務(wù)器被用作攻擊其他計算機的臨時站點。

除了包括數(shù)據(jù)丟失和容量問題在內(nèi)的未經(jīng)授權(quán)訪問的風(fēng)險外,這些攻擊還可能導(dǎo)致信譽損失:換句話說,您的服務(wù)器可以從搜索引擎結(jié)果中排除,并且您會發(fā)現(xiàn)流量急劇下降。小心攻擊,這是服務(wù)器維護計劃的一部分。

錯誤和失敗

服務(wù)器是高度連接的設(shè)備:既在內(nèi)部基于硬件和軟件,又在外部。當(dāng)心網(wǎng)絡(luò)問題,包括與數(shù)據(jù)庫后端或服務(wù)器依賴的其他應(yīng)用程序的斷開連接。

硬件是您需要注意的另一點,例如,確保RAID卷保持健康,并注意關(guān)鍵指示器,例如CPU和機箱溫度。最后,如果冗余電源出現(xiàn)故障–立即更換它,并同樣更換RAID卷問題。

本質(zhì)上,您需要在所有級別上監(jiān)視服務(wù)器統(tǒng)計信息:網(wǎng)絡(luò)流量,利用率,負(fù)載等,以便您可以在異常情況下注意到。只有這樣,您才能進一步調(diào)查。但是,當(dāng)您注意到緊急情況發(fā)展時,制定一個可以實施的計劃會有所幫助。

預(yù)防性維護:避免問題的關(guān)鍵

我們已經(jīng)概述了監(jiān)視新出現(xiàn)的問題時需要尋找的內(nèi)容,但是預(yù)防勝于治療。同樣,它在某種程度上取決于您正在運行的服務(wù)器,但是讓我們看一下可以添加到服務(wù)器維護計劃中的一些預(yù)防性維護,其中所涉及的服務(wù)器是數(shù)據(jù)庫服務(wù)器。

整理碎片并檢查索引和完整性

數(shù)據(jù)庫涉及大量的讀寫操作,這些操作需要快速處理,結(jié)果數(shù)據(jù)庫可能變得碎片化。尤其是刪除查詢會導(dǎo)致碎片,這就是為什么定期優(yōu)化數(shù)據(jù)庫中的表以減少導(dǎo)致性能問題并減少可用空間的碎片很重要的原因。

同樣,您的預(yù)防性服務(wù)器維護計劃應(yīng)定期進行索引分析,以優(yōu)化MySQL如此依賴的索引。MySQL具有分析功能,您應(yīng)該每月運行一次以確保MySQL始終可以快速找到數(shù)據(jù)。分析可簡化索引,并確保快速執(zhí)行查詢。

數(shù)據(jù)庫完整性可能是一個問題,由于數(shù)據(jù)庫崩潰和其他應(yīng)用程序錯誤,MySQL有時會失去對數(shù)據(jù)集的跟蹤。每周對數(shù)據(jù)庫完整性進行檢查可以防止查詢失敗,因為它為MySQL提供了修復(fù)錯誤的機會。

檢查磁盤運行狀況和空間

就像數(shù)據(jù)庫完整性一樣,您不能認(rèn)為磁盤運行狀況是理所當(dāng)然的。始終確保檢查服務(wù)器日志,因為在這里您會發(fā)現(xiàn)有關(guān)HDD和RAID錯誤的通知。這些錯誤表明硬盤驅(qū)動器或RAID卷出現(xiàn)故障,使您有機會在關(guān)閉服務(wù)器之前更換驅(qū)動器。

服務(wù)器發(fā)生故障倒塌并非是未知的,因為它已經(jīng)用完了驅(qū)動器空間。您必須為數(shù)據(jù)庫增加空間,進行備份以及處理大型數(shù)據(jù)庫事務(wù)留出空間。通過刪除臨時文件,不再相關(guān)的備份以及其他過時的數(shù)據(jù)來釋放空間。

群集效率很重要,如果要防止運行緩慢的查詢和數(shù)據(jù)庫錯誤,數(shù)據(jù)庫群集應(yīng)高效同步。同樣,早期檢測是關(guān)鍵,因為它可以防止代價高昂的數(shù)據(jù)庫崩潰。

仔細(xì)檢查SQL日志

當(dāng)您發(fā)現(xiàn)表損壞或索引問題時,您的MySQL服務(wù)器將記錄錯誤。審核日志將確保您對可能的數(shù)據(jù)庫故障有早期警告:充滿錯誤的日志是肯定的警告信號。

緩慢的查詢是需要注意的另一點。除了突出顯示整體性能問題之外,它還指出哪些特定查詢導(dǎo)致了性能問題,您可以對其進行調(diào)整以提高服務(wù)器性能。

最后,每月對服務(wù)器速度進行一次運行狀況檢查,將為您提供一條記錄以供繼續(xù)使用,以便您可以檢測到服務(wù)器何時開始出現(xiàn)瓶頸。然后,在出現(xiàn)更嚴(yán)重的問題之前,您可以更輕松地解決這些瓶頸。

總體而言,您將需要一定程度的服務(wù)器管理經(jīng)驗,才能真正了解可能會引發(fā)危險信號的服務(wù)器性能,這表明潛在的問題正在臨近。無論運行Web服務(wù)器,DB服務(wù)器還是其他服務(wù)器,預(yù)防性維護都是關(guān)鍵。

災(zāi)難恢復(fù):制定計劃以啟動并運行

預(yù)防性計劃是避免災(zāi)難的關(guān)鍵,但是即使是性能最佳的服務(wù)器環(huán)境也偶爾會遇到災(zāi)難。您如何回應(yīng)?顯然,最重要的目標(biāo)是使事情重新運行。

有了經(jīng)過深思熟慮的災(zāi)難恢復(fù)計劃,您可以在一分鐘或更短的時間內(nèi)啟動并運行。并非每個用例都需要這么快的周轉(zhuǎn)時間,如果某些網(wǎng)站所有者的網(wǎng)站停機一兩個小時,則不會對它們造成很大的損害。對于其他人來說,每分鐘的停機時間卻損失了收入。

有多種選擇可以最大程度地減少停機時間。這些包括高可用性集群,這些集群非常有助于確保業(yè)務(wù)連續(xù)性。具有容錯能力的硬件(包括冗余電源)可以與故障轉(zhuǎn)移鏡像一起使用,以確保硬件故障永遠(yuǎn)不會導(dǎo)致長時間的停機。

對災(zāi)難恢復(fù)至關(guān)重要:您的備份

我們在上一段中提到的一些要點實現(xiàn)起來很昂貴,并且超出了許多網(wǎng)站運營商的能力。但是有一點對健全的服務(wù)器維護計劃至關(guān)重要。這與您的備份有關(guān)。

首先,請確保您的備份實際上每天都在完成。檢查錯誤,并確保您的備份工具報告正確的狀態(tài)。接下來,您需要檢查是否可以還原備份:可以檢索數(shù)據(jù)嗎,是否有損壞?始終監(jiān)視可用磁盤空間,因為這是備份失敗的主要原因。最后,對恢復(fù)過程進行測試,以驗證該過程花費了多長時間以及它在第一次實例中是否成功。當(dāng)心意外的故障,例如連接問題,可能會使恢復(fù)變得困難。

制定恢復(fù)計劃

最后,在決定要如何制定恢復(fù)計劃以及投資多少時,應(yīng)仔細(xì)考慮應(yīng)用程序的要求。首先考慮您可以忍受多少停機時間:在損害變得無法忍受之前,您需要多長時間才能恢復(fù)服務(wù)?

接下來,找出制定災(zāi)難恢復(fù)計劃所需的計劃,軟件和最終硬件。這樣,您可以將可以接受的權(quán)衡與無法接受的權(quán)衡相匹配。但是,無論您做什么,都必須確保檢查并驗證備份策略。