新聞中心
聯系我們
Contact us
Contact us
- 總部電話010-51727811
- 客服熱線400 779 6696
- 更多聯系信息
SAN存儲技術進階知識介紹(二)
時間:2012-12-03 09:23 來源:飛客數據恢復 作者:飛客數據恢復工程師
SAN和集群
SAN可以被用作所有存儲資源的高級網絡主干,其中包括硬盤、磁帶、光纖通道的硬盤和遙控設備,它們在網絡上的所有服務器節點之間共享。支持SAN功能的集群使用了集群技術,也就是兩臺或多臺互相之間知道彼此配置和所提供的服務/應用的計算機系統完全協同工作在SAN拓撲環境中。一個真正意義上的SAN網絡早已超越了任意連通性、任意服務器到任意存儲系統的連通的觀念。事實上,通過將所有存儲系統從一個高速的網絡主干上隔離出來,或是通過在數據、存儲管理和使用這些數據的應用之間引入邏輯層/物理層,這種好處是相當巨大的。
為了實現無縫的存儲管理,SAN結構本來應該在所有存儲資源(如磁盤陣列、備份設備、邏輯卷的管理、文件系統管理和備份管理)以及所有需要這些資源的應用系統基礎之上,引進一個軟件層。那些運行在CPU數目滿足需求的服務器上的應用服務(如應用服務器、數據庫管理系統、中間件、HTTP服務器)能夠提供負載均衡和故障切換功能,而不需要專門的存儲設備。
這些應用服務并不知道數據存儲方面的有關信息,比如數據實際上究竟存放在什么地方、數據是否已經了鏡像和分布式處理等。所有基于網絡的RAID、分布式I/O、數據冗余、配置冗余、硬盤組、邏輯卷、動態的多個路徑、分層存儲、在線的高速備份等有關的問題都由存儲管理系統來處理。一個正確的SAN是一個能夠提供高可用性、增強的靈活性和改良的性能的基礎構架。
SAN能夠提供一個理想的拓撲結構來實現集群系統,因而其中一個系統的故障并不意味著所提供的服務會發生任何中斷。參與這一集群的其他一個或多個生還的結點將自動處理由故障結點所提供的應用或服務。支持SAN的集群的一個優點就是在集群環境中發生故障時恢復速度快。由于數據是持續可用的,問題僅僅是由備用或協同工作的應用來訪問原先由故障結點來訪問的數據。在能夠容忍的災難發生之后,SAN能夠通過光纖通道從10公里以外提供數據。
挑戰ERP和電子商務
在可用性、靈活性和性能要求很高的大型的、支持Web功能的ERP和電子商務環境中,SAN和支持SAN的集群解決了一些主要的技術問題,如更為靈活的備份手段、更快的恢復、正常運行時間更長。從更高層次來看,現在具有三層或更多層結構的ERP和電子商務體系都向著一個方向發展,同時Baan公司、Oracle公司、PeopleSoft公司和SAP公司等不同廠商的系統之間還存在差別。現今所有ERP和電子商務應用都是支持Web功能的構件,就象OLAP構件、應用構件、數據庫構件一樣,在邏輯上是互相獨立的。
在應用結構適合SAN以后,最嚴重的問題便是這些模塊化的應用所訪問的大部分數據都集中在一個或很少幾個數據庫中(數據相當集中)。在這種情況下,一般可以對數據進行復制,以支持數據倉庫或是其他負載分解方式。由于這些應用支持Web功能,使消費者能夠對全球范圍的用戶分發他們的操作執行動作,這就使大量協同用戶同時訪問這些ERP和電子商務應用成為可能。
而市場的這一趨向又帶來了系統的可伸縮性問題。由于這些用戶遍布世界各地,所提供的服務就要求不能因為時間原因而中斷。這一趨勢同樣帶來了可用性問題。隨著用戶以顯著的速度增加,所收集和分發的數據的總量也以幾何級數的速度快速增長。隨之而來的便是要求對通過ERP和電子商務系統所收集到的數據(數據已經復制到了數據倉庫)進行分析、加以分類,并通過現存的和新啟用的應用進行擴充,于是這又帶來了與性能和速度有關的問題。所有這些因素更加明確地向結構體系提出了要求,要能夠解決可用性、靈活性和性能問題。
可用性(Availability)
可用性是持續正常運行時間的一個衡量指標。當然,目標是100%的正常運行時間,這表明ERP和電子商務應用服務沒有停工時間。通過對基礎構造的所有構件部分都建立冗余(即使這一冗余是明顯多余的,這是完全有可能達到的。
為所有冗余部件建立冗余備份的觀念能夠應用到SAN中的所有硬件和軟件中,如處理器、應用服務器、中間件、DBMS等。如今,為了實現高可用性和容錯,在ERP和電子商務應用環境中集群扮演了統治地位的角色。基于共享(如Oracle公司的產品)或非共享(如Sybase公司的產品)結構將兩臺或多臺服務器組成集群協同工作,是目前常用的方式。
在這兩種結構中,在系統和它們的存儲單元之間都有著必須的大量冗余的互連,這一問題直到SAN出現才解決。隨著SAN和基于SAN的集群的推出,由于在存儲系統和服務器之間引入了一個邏輯/物理層,因而消除了這種連接要求。SAN中的每一臺參與集群工作的服務器都能夠訪問SAN中的存儲空間中的每一個字節,因而消除了系統和它們的存儲系統之間的所有的互連需求。
可伸縮性(Scalability)
如今,在SAN中的集群配置已經達到了32個結點,這一數字近來還有可能上升到128(例如,來自Veritas Software公司的Veritas Cluster Server軟件)。SAN這種結構體系使得在一個集群配置中包含大量的結點成為可能。隨著基于SAN的集群系統所提供的有效的負載平衡,真正的伸縮性和資源的有效利用也完全引入了ERP和電子商務系統。
作為一種體系結構,SAN能夠為資源的有效利用鋪平道路。假如一個服務器需要使用硬盤資源,另外的存儲資源就會被從網絡中拖拉出來,而無須增加額外的存儲子系統。假如一臺特定的服務器正嚴重缺乏處理器或內存資源,應用這些資源的服務將會轉移到另一個未充分利用的系統上運行。
網絡延遲的可以承受的水平僅僅由SAN中的存儲資源或硬盤容量這些限制因素決定。由于存儲容量的需求和數據庫及應用密切相關,因而在網絡延遲可以接受的前提下,盡量往SAN中添加資源就可以解決這一問題。從理論上說,運行在SAN中的系統和應用的可伸縮性是無限的。
網絡中的全部資源能夠被ERP和電子商務(要求具有內置的智能功能)的所有構件所使用,以有效地使用可用資源。因而從長遠眼光來看,這種網絡就好象是一臺計算機,而它的和處理器、內存相關的資源分布在多個分擔結點上。SAN中的存儲和訪問是集中處理的,為高級的應用機構、應用分割、故障恢復和負載均衡等提供余地。
所有這些發展表明可伸縮性主要受到SAN中的資源的可用性的影響。假如一個特定處理中的內存消耗使得可伸縮性受到影響,這一處理就可以分布到基于SAN的集群系統中的兩個或多個結點中并行處理。假如物理硬盤的I/O正在影響系統的可伸縮性,那么SAN中的基于網絡的RAID則可以使得這一狀況得到改善。假如所有的結點的使用率都已經達到了100%,則應該考慮在集群的SAN中增加結點,進而也應該對應用的配置也應該作出相應的調整。
性能(Perfermance)
假如資源需求影響到了一個特定構件的性能,這種問題可以通過將構件重新部署到網絡中,或是為構件在負載均衡的基礎上建立冗余來解決。直到SAN出現,從客戶機/服務器結構方面考慮集中備份,這種跨越網絡的高速備份和恢復才成為一種主要的觀念。應用如今的技術,具有許多服務器的網絡中的集中備份意味著網絡將會受到備份數據流的沖擊和妨礙,哪怕使用最先進的壓縮技術。
要將網絡上的所有服務器中的數據進行備份,也許要會花好幾個小時。這是因為每一個備份客戶端都要通過網絡將數據傳送到中心備份服務器中,而且有可能要通過廣域網連接。首先由客戶端機器從硬盤上讀出數據,然后從網絡的不同方向傳送到中心服務器上,最后由備份服務器將它寫到備份設備上。有了SAN,SAN中的中心備份服務器將從存儲設備讀出數據,直接將它們存儲到磁帶、CD光盤或者硬盤等備份設備上。由于備份和恢復都不會影響外部網絡的工作狀態,因而都能夠在相當快的時間內完成。
當進行了條帶化或是鏡像操作,RAID通常能夠防治因硬盤故障而造成數據丟失。由于通向冗余數據的通路丟失,位于冗余硬盤上的可用數據不能被訪問到,控制器故障和連接故障問題目前仍然沒有解決。在SAN上的存儲管理中使用了邏輯卷管理,可以在位于網絡上不同的存儲子系統中的硬盤之間建立條帶化和鏡像操作,因而增加了可用性。
由于到這一數據有多條通路可用,每次都使用最短的訪問路徑,這樣就大大提高了I/O性能。同樣,在SAN中,由于物理上的I/O分布完全不可能發生在位于存儲子系統中的硬盤上,但能夠被分布處理在網絡上進行負載均衡,因而I/O性能也得到了推進。
SAN的藍圖
總體上說,作為一種結構體系,SAN非常適用于任何要求可用性、可伸縮性和性能的計算環境中,特別是那種ERP和電子商務應用扮演主要角色的環境中。這種類型的結構體系能夠為運行于生產部門的基于事務的ERP和電子商務應用提供更高的可用性、增強的性能和提高的伸縮性。即使是在進行數據備份和歸檔,那些配備了冗余構件的服務器彼此之間還是能夠連續不斷地高速訪問數據。
不管是數據、代碼還是元數據,從底層來看它們都是數位和字節。在基于SAN的結構中隨著邏輯卷管理層(位于存儲服務器端)的引入,所有這些數位和字節被冗余地存儲在SAN中,并在需要時被訪問。