新聞中心
聯系我們
Contact us
Contact us
- 總部電話010-51727811
- 客服熱線400 779 6696
- 更多聯系信息
解析數據存儲的根本(一)
時間:2012-07-23 09:12 來源:飛客數據恢復 作者:飛客數據恢復工程師
在NAS的系統中存在如下的缺點:
其一是傳輸能力有限。在NAS中,數據的傳輸通過現有的局域網實現,但局域網原本是用來實現消息傳遞的,只適合短暫的突發數據傳輸,不能滿足大容量連續數據傳輸的要求;同時,網絡上大量計算機之間的通信也會占用有限的網絡帶寬,所以當網絡規模較大時,必然會導致數據傳輸速率減慢。
其二是可擴展性有限。雖然當存儲空間不足時,在網絡中增加一臺NAS設備非常容易,但新的NAS設備要求有新的IP地址,無法與原有的NAS設備集成為一體,不能形成一個連續的文件系統,從而增加了存取和管理的復雜度。
其三是數據備份能力有限并且不能對數據庫服務提供有效的支持。通常,NAS設備不能支持存儲設備之間的直接備份,只能采用基于網絡的備份,這樣會在數據備份時占用大量的網絡帶寬,嚴重影響網絡上其他應用的運行,而且數據備份的速度也相對較慢。
SAN存儲的特點
相對于NAS網絡存儲,SAN存儲有著如下的優點。
其一是為每臺主機提供了更多的可控存儲容量。SAN并沒有提高單個磁盤驅動器的容量,也沒有增加主機系統中支持的主機I/O控制器的數量,但它能顯著提高連接到每臺主機I/O控制器的設備數。它還提供了通過級聯網絡交換機和集線器來擴展容量的方法,例如,光纖仲裁環網能支持多達126臺設備,而對于交換結構的光纖網絡和IP網絡來說,SAN具有無限尋址的能力。
其二是可提供更高的傳輸帶寬。目前光纖網絡可提供4Gb/s的帶寬,而千兆以太網可提供1Gb/s的帶寬。此外,與共享帶寬的總線和網絡相比,使用交換網絡的SAN為數據存取提供了更好的可擴展性,網絡的傳輸帶寬可以成倍地增長。
其三是可提供更長的連接距離。SAN能以高速在很長的距離上運作,在采用光纖通道協議(FiberChannelProtocol,FCP)的FC-SAN中,使用單模光纖且不使用重發器,就可支持長達10公里的數據傳輸;而使用IP網絡進行數據傳輸的IP-SAN則可以在廣域網上傳輸數據,從而使數據的存取不再受區域的限制。
其四是在數據可用和共享方面的優勢。服務器和數據的分離以及面向網絡的集中存儲使數據的安全性和可用性大大提高。而且,利用SAN的遠距離連接能力,通過數據鏡像等操作,即使系統遭受區域災害(如洪水、火災、大規模電力故障等),也能很快完成數據的災難恢復。同時,面向網絡的集中存儲和多路徑的數據交換使數據共享變得非常容易。
架構中的基本概念
近線和離線存儲
所謂分級存儲,就是根據數據不同的重要性、訪問頻次等指標分別存儲在不同性能的存儲設備上,采取不同的存儲方式。這樣一方面可大大減少非重要性數據在一級本地磁盤所占用的空間,還可加快整個系統的存儲性能。在這里就涉及到幾種不同性能的存儲設備和不同的存儲形式了。
目前常用于數據存儲的存儲設備主要有磁盤(包括磁盤陣列)、磁帶(包括磁帶機和磁帶庫)和光盤(包括一切CD-R、CD-RW、DVD-R、DVD-RW等光盤塔和光盤庫設備)。從性能上來說,磁盤當然是最好的,光盤次之,最差的是磁帶。而從價格上來說,單位容量成本上升磁盤最貴、光盤次之,磁帶最低。這就為我們不同的應用追求最佳性價比提供了條件,因為這些不同的存儲媒介可應用于不同的存儲方式中。這不同的存儲形式包括在線存儲(OnStore)、近線存儲(NearStore)和離線存儲(OffStore)。
在分級數據存儲結構中,磁帶庫等成本較低的存儲資源用來存放訪問頻率較低的信息,而磁盤或磁盤陣列等成本高、速度快的設備,用來存儲經常訪問的重要信息。數據分級存儲的工作原理是基于數據訪問的局部性。通過將不經常訪問的數據自動移到存儲層次中較低的層次,釋放出較高成本的存儲空間給更頻繁訪問的數據,可以獲得更好的總體性價比。
今天企業的數據中心非常復雜,數據保護是其關鍵。但是,并非所有的數據都具有同樣的價值,也并非所有的企業都具有同樣的需求。的確如此,通常認為企業中的關鍵和非關鍵數據量也符合“二八原則”,就是只有20%的關鍵數據,而80%都是非關鍵的。系統中60%至80%的數據經常在一個月,甚至一年中都不會被訪問。而在經常訪問的數據中,重要性差別也十分突出,有的數據與用戶的業務聯系緊密,可靠性、可用性及性能要求都很高,有的盡管經常使用但是與業務聯系不是特別緊密。一般來說,重用數據的概率自數據創建3天之后就會下降50%,當數據創建30天后,重用的概率通常會降至很低,而高達90%的數據超過90天后就不會或很少被讀取。為了提供良好的數據保護,IT部門通常都保留巨大的空余空間,用以防止出現容量不足的現象。
IT企業總是要面對增長起來無休無止的數據量。各種應用都在創建越來越大的文件,用戶也很少刪除數據和存檔,這就導致要訪問舊一些的文件已經變得非常困難。之所以要采取分組存儲,是因為它既能最大限度地滿足用戶隨時訪問所有需要經常使用的數據,又可使存儲成本最小化。綜合起來,可以得出分級存儲的優點主要體現在以下兩個方面:
1.減少總體存儲成本
在傳統的在線存儲中,所有數據都存儲在一線磁盤存儲設備上,而由于絕大多數數據的訪問率并不高,占住了大量寶貴的磁盤空間,在一定程度上是一種浪費。如果把這些數據轉移到存儲性能稍低的磁盤(如IDE或SATA接口磁盤)或光盤存儲設備上,存儲成本可得以大幅降低。
2.提高整體系統性能
由于絕大部分數據轉移到下級存儲設備上,那需要時刻保持在線的數據就少了,系統資源的占用也就少了許多,整體系統性能自然也就提高了。如果采用了離線存儲方式對很少使用的數據保存在像磁帶這樣的離線存儲媒體上時,則不僅可提高系統性能,還可確保數據的安全性。
iSCSI技術
隨著TCP/IP在互聯網上的發展,TCP/IP已經成為了事實上的網絡協議標準,現有的架構、標準、協議如果結合FC-SAN,是否能夠減低SAN系統成本呢?廠商推出了IP-SAN和ISCSI,IP-SAN主要解決的是SAN的管理問題,ISCSI解決是SAN的成本問題。ISCSI的出現,標志著低價化SAN方案的問世,一圓中小企業也能夠建置SAN的夢想。
自2003年SNIA(存儲網絡產業協會;TheStorageNetworkingIndustryAssociate)通過ISCSI協議后,廠商有了統一的IP-SAN方案,另外2003年微軟宣布了在Windows2003中提供ISCSI支持,ISCSI在此之后獲得了很大發展。ISCSI理論上可以用在DAS、NAS、SAN各種存儲方案上面,不過目前主流還是在SAN上的應用。
所謂ISCSI就是通過IP協議將SCSI區塊數據轉換成網絡封包的一種傳輸標準,它和NAS一樣透過IP網絡來傳輸數據,但在數據存取方式上,則采用與NAS不同的,而與FC-SAN相同的BlockProtocol協議。IP協議使得ISCSI可以使用普通交換機,而不必使用昂貴的光纖交換機,而且懂得IP協議的人很多,比起光纖SAN的人員培訓要省不少費用;使用IP協議的另外一個好處是如果隨著以太網的速度進一步提升,ISCSI的網絡傳輸速度也會提升,采用10G以太網協議的ISCSI甚至會超過下一代光纖FC-SAN的4G標準;另一方面采用了與FC-SAN相同的BlockProtocol協議,雖然無法與FC-SAN想比,不過在存儲速度超過使用文件協議的NAS不少。
左下圖是一個比較簡單的iSCSI存儲系統結構圖,這是一個采用統一數據存儲中心的結構圖,通過上面我們清楚地知道該系統雖然是一個新建的iSCSI存儲系統,但它并沒有改變原有的網絡結構。
首先我們需要了解的是客戶端與數據存儲中心的連接,它們之間的連接有兩種方式。一種是在客戶端上采用普通網卡加協議轉換軟件的形式,另外一種是直接在客戶端采用iSCSI適配卡的連接方式。采用普通網卡加協議轉換軟件的形式雖然能節約資金投入,不過這種連接方式會造成CPU資源大量被占用,并且轉換率也不高。而采用iSCSI適配卡連接的方式,會大大提高數據傳輸速度,并且占有CPU資源非常小。實際上iSCSI適配卡也相當于一塊網卡,不過iSCSI適配卡價格比較昂貴。因此,用戶在選擇時一定要根據自己的實際情況決定。無論硬件還是軟件方式都稱為iSCSIInitiator。
iSCSI服務器主要的作用在于將SCSI指令封包并置入到TCP/IP封包里,也就是當客戶端發出請求后,iSCSI命令和數據達到iSCSI服務器進行處理,然后iSCSI服務器根據請求命令調用數據存儲中心的數據反饋給客戶端用戶,它主要用來為客戶端調用存儲空間或者存儲的數據。
交換機在系統中的作用跟網絡中普通的交換機一樣,只是起一個連接iSCSI存儲服務器和iSCSI存儲設備的作用。不過也有廠商推出專用的iSCSI交換機,如思科的5400系列iSCSI交換機。
iSCSI存儲設備主要是用來保存大量的數據,也就是我們通常所說的磁盤陣列等。在交換機與iSCSI存儲設備這里我們能看出,如果我們需要增加整個iSCSI系統的存儲容量,只需要購買存儲設備連接到iSCSI交換機上面就可以了,這樣就大大增加了整個iSCSI系統的可擴展性,并且在增加存儲設備的同時,我們并不需要關掉服務器等。
在存儲設備這端負責將SCSI協議從IP包中分離出來的設備稱為iSCSITarget。iSCSI存儲設備已經包含了iSCSITarget,如果僅僅是普通磁盤陣列那么就需要購買一個iSCSI網關作為iSCSITarget連接陣列和iSCSI交換機。