www涩-www黄网站-www黄色-www黄色com-国产免费拍拍视频在线观看网站-国产免费怕怕免费视频观看

技術(shù)筆記系列 - SAN存儲的長鏈條

2018-02-06 09:25:38 行禪與一心走路  點(diǎn)擊量: 評論 (0)
十幾年前學(xué)習(xí)DOS內(nèi)核的時候,是可以直接寫程序控制磁盤步進(jìn)電機(jī)的,磁頭放在什么位置,讀寫到盤片的哪兒都可以控制。但看看現(xiàn)在的SAN存儲,...

十幾年前學(xué)習(xí)DOS內(nèi)核的時候,是可以直接寫程序控制磁盤步進(jìn)電機(jī)的,磁頭放在什么位置,讀寫到盤片的哪兒都可以控制。但看看現(xiàn)在的SAN存儲,恍若已是隔世。
我們就以一條簡單的linux cat 讀文件命令,看看要經(jīng)歷怎樣的千山萬水,才能到達(dá)物理磁盤,取到真正的數(shù)據(jù)。
首先,在linux 命令行中輸入cat 命令,系統(tǒng)會調(diào)用相應(yīng)的system call, 進(jìn)入內(nèi)核態(tài)。在內(nèi)核里最早接受請求的是VFS(virtual file system)層, VFS 是一層抽象的文件接口,當(dāng)它發(fā)現(xiàn)實(shí)際請求是要訪問一個磁盤文件時,就會調(diào)用對應(yīng)的真正的文件系統(tǒng)接口,在linux中通常是Ext3. 在這個時候,如果該文件之前已經(jīng)被讀過,還放在buffer 中,那么恭喜你,你可以直接拿到數(shù)據(jù)了。

技術(shù)筆記系列 - SAN存儲的長鏈條

如果沒有,對不起,繼續(xù)往下調(diào)用塊設(shè)備存儲的驅(qū)動,塊設(shè)備存儲驅(qū)動會把讀取文件的指令轉(zhuǎn)換成讀取某個塊存儲設(shè)備的某個數(shù)據(jù)塊,這也是SCSI子系統(tǒng)的最高層接口,系統(tǒng)把存取指令按照SCSI協(xié)議命令打包,發(fā)給SCSI 控制器。如果linux是非虛擬機(jī),這個時候工作就交給硬件。
但是,如果linux還是臺虛擬機(jī)(現(xiàn)在大部分情況都是這樣,假設(shè)這臺linux是運(yùn)行在Vmware 的 EXSi host 上),讀取指令則會傳遞給一個虛擬的SCSI 控制器,這個虛擬SCSI控制器再傳遞給VMkernel, 對VMkernel而言,虛擬機(jī)的一個磁盤其實(shí)只是一個文件(datastore), 所以VMkernel還要二次轉(zhuǎn)換,轉(zhuǎn)成物理設(shè)備真正的位置,再把這些指令通過調(diào)用HBA驅(qū)動發(fā)給HBA卡。
HBA卡(host bus adapter)是光傳輸設(shè)備,它與光交換機(jī),SAN存儲一起構(gòu)成光纖傳輸網(wǎng)絡(luò),把讀取指令傳輸?shù)较鄳?yīng)的存儲設(shè)備上。
好,總算到目的地了。且慢,這還是萬里長征第一步,現(xiàn)在的SAN存儲可不僅僅是幾塊磁盤,就拿IBM8870來說,它其實(shí)是由兩臺高端P系列服務(wù)器組成的集群。當(dāng)我們的讀取指令到達(dá)SAN 存儲,SAN存儲會重新解析這些指令,如果該數(shù)據(jù)塊已經(jīng)放在存儲服務(wù)器龐大的內(nèi)存(Cache)中,則這些數(shù)據(jù)就會經(jīng)光傳輸網(wǎng)絡(luò)返回。否則,就要遍歷在linux端同樣的過程,一級一級調(diào)用底層接口,最后通過SCSI驅(qū)動,發(fā)出指令來操作實(shí)際的物理硬盤。
在這個過程中,存儲服務(wù)器已經(jīng)將數(shù)據(jù)的具體物理位置做了兩層封裝。首先是做RAID,比如IBM8870 中8個盤為一組,用RAID5,6,或10,實(shí)現(xiàn)數(shù)據(jù)冗余和高性能。所以看似連續(xù)的數(shù)據(jù)塊實(shí)際可能分布在一組磁盤上。第二層是extend pool, IBM8870可以將SSD盤,SAS盤,SATA 盤都放到同一個extend pool, 再分到同一個邏輯盤里。也就是說我們操作的邏輯盤其實(shí)際數(shù)據(jù)可能放在完全不同類型的盤中,而且,由于IBM78870提供了自動Easy tier 功能,系統(tǒng)可以根據(jù)數(shù)據(jù)的使用頻率調(diào)整使用不同的盤。如果某數(shù)據(jù)塊頻繁地被訪問,則該數(shù)據(jù)塊就會從 SAS盤轉(zhuǎn)到SSD盤 。所有這一切都是自動在后臺進(jìn)行,對用戶完全不可見。
現(xiàn)在還有一項流行的技術(shù),就是在服務(wù)器和物理存儲系統(tǒng)間再嵌入一層虛擬層,由它來管理控制所有存儲并對服務(wù)器提供存儲服務(wù)。比如IBM SVC (storage volume controller). linux 發(fā)出的數(shù)據(jù)讀取指令會先到SVC, SVC 實(shí)質(zhì)也是一臺服務(wù)器,同時對各物理存儲系統(tǒng)的盤有做了一層封裝。所有連SVC 的存儲系統(tǒng)將自己的磁盤呈現(xiàn)給 SVC組成 MDG (managed disk group),SVC 再將這些盤映射為自己的 VDISK. 當(dāng)用戶需要讀取某VDISK 中的數(shù)據(jù)時,SVC再翻譯成對應(yīng)的實(shí)際物理存儲系統(tǒng)的的位置,然后通知該物理存儲系統(tǒng)讀取相應(yīng)的數(shù)據(jù)。
我們可以看到,現(xiàn)代基于 SAN 的存儲系統(tǒng)其實(shí)已經(jīng)對物理磁盤做了多層封裝和虛擬化。在用戶這一層幾經(jīng)無法實(shí)際定位某一段數(shù)據(jù)真正放在物理磁盤上的哪個位置。

 

大云網(wǎng)官方微信售電那點(diǎn)事兒

責(zé)任編輯:任我行

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與本站無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。
我要收藏
個贊
?
主站蜘蛛池模板: 亚洲欧美一区二区三区不卡 | 亚洲最新在线视频 | 视频一区在线播放 | 久久99精品久久久久久国产越南 | 欧美成人亚洲欧美成人 | 亚洲国产精品国产自在在线 | 国产一级精品毛片 | 久久草在线精品 | 国产99精品一区二区三区免费 | 国产精品推荐 | avtt天堂网永久资源手机版 | 久久91亚洲精品久久91综合 | 高清一区二区三区四区五区 | 欧美日韩一区二区视频免费看 | 亚洲精品二区中文字幕 | 99视频国产在线 | 婷婷尹人香蕉久久天堂 | avtt天堂网永久资源手机版 | 国产孕妇孕交视频在线观看 | 久久久综合网 | 免费看欧美一级片 | 国产中文在线视频 | 19+韩国主播青草vip视频 | 日本 国产 欧美 | 欧美一级毛片在线一看 | 在线视频免费国产成人 | 亚洲精品欧美精品国产精品 | 久久怡红院亚欧成人影院 | 看美女毛片| 91av成年影院在线播放 | 欧美透逼 | youjizz日韩| 免费视频网站一级人爱视频 | 国产成人小视频在线观看 | 日韩a级片| 九色愉拍自拍 | 日韩精品无码一区二区三区 | 亚洲精品区在线播放一区二区 | 亚州久久| 国产片久久| 亚久久伊人精品青青草原2020 |