摘 要: 云數(shù)據(jù)庫是把各種關(guān)系型數(shù)據(jù)庫看成一系列簡單的二維表,并基于簡化版本的SQL或訪問對象進行操作的數(shù)據(jù)庫。云數(shù)據(jù)庫能夠為多個用戶同時提供類似于單節(jié)點數(shù)據(jù)庫的服務(wù)。在當前云計算技術(shù)不斷發(fā)展中,數(shù)據(jù)庫不斷發(fā)展進化,從原始的單節(jié)點數(shù)據(jù)庫逐漸發(fā)展成為云數(shù)據(jù)庫,數(shù)據(jù)存儲能力相對于過去提高了數(shù)倍。目前云數(shù)據(jù)庫服務(wù)不斷增多,在此背景下,討論了一種云數(shù)據(jù)庫的設(shè)計與核心子系統(tǒng)的實現(xiàn)。
關(guān)鍵詞: 云數(shù)據(jù)庫;云計算;數(shù)據(jù)分布;高可用;一致性hash
隨著計算機網(wǎng)絡(luò)的飛速發(fā)展以及網(wǎng)絡(luò)帶寬的不斷增長,利用網(wǎng)絡(luò)技術(shù)來建立云數(shù)據(jù)庫中心已經(jīng)成為可能。近年來,云數(shù)據(jù)庫已經(jīng)成為數(shù)據(jù)庫發(fā)展的新趨勢。云數(shù)據(jù)庫可以將分散在各個數(shù)據(jù)中心的數(shù)據(jù)庫資源有效地組織利用起來,構(gòu)成海量數(shù)據(jù)存儲中心。云數(shù)據(jù)庫能夠更快地、更好地解決各個客戶海量數(shù)據(jù)的存儲問題,能夠打破傳統(tǒng)的單節(jié)點數(shù)據(jù)庫的網(wǎng)絡(luò)帶寬和磁盤I/O的限制,為客戶提供高帶寬、高I/O、高并發(fā)的數(shù)據(jù)連接服務(wù)。同時,云數(shù)據(jù)庫中心具有系統(tǒng)設(shè)備利用率高、數(shù)據(jù)節(jié)點擴容方便、數(shù)據(jù)的多備份、數(shù)據(jù)高可用等特點。本文對云數(shù)據(jù)庫的各功能模塊進行研究,并分析了各功能模塊的實現(xiàn)方式。
1 云數(shù)據(jù)庫的設(shè)計
云數(shù)據(jù)庫建立在互聯(lián)網(wǎng)上的數(shù)據(jù)庫中心,能夠同時為多個客戶提供數(shù)據(jù)庫服務(wù),并且其互相之間不影響。系統(tǒng)整體框圖如圖1所示。
云數(shù)據(jù)庫對外提供統(tǒng)一的API,統(tǒng)一的API能夠屏蔽云數(shù)據(jù)庫內(nèi)部實現(xiàn)的細節(jié)。對外提供一種統(tǒng)一的數(shù)據(jù)庫連接協(xié)議,使用戶能夠通過不同的編程語言、不同的連接工具進行連接使用。
云數(shù)據(jù)庫的核心服務(wù)是為用戶提供數(shù)據(jù)庫服務(wù),其主要功能有:
(1)用戶檢測。引進用戶認證系統(tǒng)檢測多用戶狀態(tài),認證系統(tǒng)在用戶登錄、退出時進行狀態(tài)記錄,在用戶每次進行數(shù)據(jù)操作時,必須確定該操作是否安全。
?。?)安全檢測。安全系統(tǒng)全程監(jiān)控用戶的操作,以確認用戶的操作對數(shù)據(jù)庫中其他用戶和數(shù)據(jù)庫整體安全沒有影響,以及檢測來自網(wǎng)絡(luò)上的各種數(shù)據(jù)庫的攻擊。
?。?)多租戶。云數(shù)據(jù)庫多租戶服務(wù)是為解決多個用戶同時接入云數(shù)據(jù)庫系統(tǒng)而設(shè)計實現(xiàn)的。多個用戶同時接入云數(shù)據(jù)庫,不僅要求各個用戶之間互相隔離,而且要求各個用戶之間的數(shù)據(jù)互不影響,各個用戶只能訪問自己的數(shù)據(jù)庫。
?。?)數(shù)據(jù)分布。為了存儲用戶的海量數(shù)據(jù),將用戶的數(shù)據(jù)分布在數(shù)據(jù)庫集群中不同的節(jié)點上,這樣不僅方便系統(tǒng)的擴容,而且數(shù)據(jù)I/O操作被分配到多個節(jié)點上。數(shù)據(jù)的分布使用一致性hash[1]算法,保證在加入節(jié)點時,數(shù)據(jù)庫中的數(shù)據(jù)以最小的代價擴展到新節(jié)點中。
(5)數(shù)據(jù)高可用。云數(shù)據(jù)庫中的數(shù)據(jù)每份至少需要存在于3個副本中,3個副本進行實時同步,當某一數(shù)據(jù)節(jié)點宕機出現(xiàn)故障時,數(shù)據(jù)能夠在其他節(jié)點正常讀取。多副本的存在,還可以使用負載均衡算法,把數(shù)據(jù)I/O操作分散到負載低的數(shù)據(jù)節(jié)點[2]。
?。?)緩存?;诖髷?shù)據(jù)的負載特性,以內(nèi)存作為存儲介質(zhì),用以解決數(shù)據(jù)查詢性能延遲的問題[3]。使用Memcached或者Redis緩存系統(tǒng)[4],將數(shù)據(jù)放入內(nèi)存,讀寫時若能命中,系統(tǒng)的I/O能力至少能夠提高8~10個數(shù)量級。
(7)數(shù)據(jù)快照。數(shù)據(jù)快照功能能夠在某個時間點給用戶數(shù)據(jù)生成快照,該快照能夠供用戶下載保存,同時用戶能夠把數(shù)據(jù)回滾至該快照。
數(shù)據(jù)庫節(jié)點集群提供用戶數(shù)據(jù)實際的保存位置,該集群一般由多個數(shù)據(jù)庫中心組成,各個數(shù)據(jù)庫中心的數(shù)據(jù)互相備份,以保證在一個或多個數(shù)據(jù)庫中心遭到災(zāi)難性損壞時,云數(shù)據(jù)庫依然能夠正常運行。當各個數(shù)據(jù)庫中心的節(jié)點無法提供足夠容量時,可以動態(tài)地、無需關(guān)機地添加數(shù)據(jù)節(jié)點至云數(shù)據(jù)庫中心。
2 云數(shù)據(jù)庫的實現(xiàn)
云數(shù)據(jù)庫為了實現(xiàn)高擴展性,所有子系統(tǒng)均由單獨模塊構(gòu)成,所有模塊均可由新的相關(guān)功能模塊代替。云數(shù)據(jù)庫核心模塊包括:安全審計模塊、通信模塊、SQL解析模塊、路由管理模塊、消息分發(fā)模塊、策略管理模塊、緩存模塊、消息處理、結(jié)果集處理模塊、數(shù)據(jù)快照模塊。
2.1 系統(tǒng)核心流程
應(yīng)用系統(tǒng)發(fā)送數(shù)據(jù)庫請求,云數(shù)據(jù)庫通過通信管理模塊接收到請求,調(diào)用安全審計模塊進行安全審計[5]。安全審計模塊負責所有云數(shù)據(jù)庫連接的安全管理。通信管理模塊管理內(nèi)部消息的編碼解碼工作,管理著內(nèi)部所有的連接對象。
連接對象將消息轉(zhuǎn)發(fā)給消息轉(zhuǎn)換模塊;消息轉(zhuǎn)換模塊將發(fā)送過來的消息進行包協(xié)議處理,然后發(fā)送給SQL解析模塊;SQL解析模塊生成相應(yīng)的SQL對象。SQL解析模塊有SQL解析和SQL過濾功能,能夠過濾掉SQL中非法的字符串等。
SQL對象將數(shù)據(jù)流交給路由管理模塊。路由管理模塊進行SQL路由解析、SQL分發(fā)等SQL操作。同時,路由管理模塊監(jiān)控數(shù)據(jù)庫節(jié)點池中的數(shù)據(jù)庫節(jié)點和數(shù)據(jù)節(jié)點的心跳信息。路由管理模塊的配置只能由云數(shù)據(jù)庫管理員進行操作,其中配置規(guī)則包括:路由規(guī)則、虛擬節(jié)點規(guī)則、物理數(shù)據(jù)庫節(jié)點規(guī)則和數(shù)據(jù)快照規(guī)則。同時,數(shù)據(jù)快照功能直接作用于路由管理模塊,通過路由管理模塊的消息分發(fā)功能把快照命令發(fā)送到物理數(shù)據(jù)庫節(jié)點中。
策略管理模塊管理物理數(shù)據(jù)庫節(jié)點中的數(shù)據(jù)切分規(guī)則。數(shù)據(jù)切分規(guī)則使用一致性hash算法進行數(shù)據(jù)切分,當添加新的數(shù)據(jù)庫節(jié)點到數(shù)據(jù)節(jié)點池中時,能夠以最小的代價把數(shù)據(jù)遷移至新節(jié)點中。同時,云數(shù)據(jù)庫服務(wù)能夠保證在不影響用戶使用的情況下能夠完成節(jié)點的加入以及數(shù)據(jù)的遷移。
消息分發(fā)模塊接收來自路由管理模塊發(fā)送的消息隊列,把消息隊列中的消息按照規(guī)則發(fā)送至相應(yīng)的數(shù)據(jù)庫節(jié)點中,進行相應(yīng)的數(shù)據(jù)節(jié)點操作。把數(shù)據(jù)庫操作完成返回的信息通過結(jié)果集返回給結(jié)果集合并器,結(jié)果集合并器將合并的結(jié)果返回給通信管理模塊,最終響應(yīng)應(yīng)用系統(tǒng)的請求。當然,如果云數(shù)據(jù)庫接入緩存系統(tǒng),消息分發(fā)器首先會從緩存中查詢是否有需要的數(shù)據(jù)信息。如果有,直接操作緩存中的數(shù)據(jù)并返回給應(yīng)用系統(tǒng);如果沒有,則從數(shù)據(jù)節(jié)點中查詢出需要的數(shù)據(jù),并保存至緩存系統(tǒng)中,以備下次使用。
云數(shù)據(jù)庫核心數(shù)據(jù)流圖如圖2所示。
2.2 核心子系統(tǒng)的實現(xiàn)
本文所描述的云數(shù)據(jù)庫多租戶技術(shù)采用共享數(shù)據(jù)、隔離數(shù)據(jù)庫的架構(gòu)。物理數(shù)據(jù)庫使用數(shù)據(jù)庫集群中的數(shù)據(jù)庫。當初始化一個用戶時,默認會創(chuàng)建一個新的數(shù)據(jù)庫實例分配給該用戶使用,該用戶所有數(shù)據(jù)操作都在此數(shù)據(jù)庫中進行。用戶可以創(chuàng)建新的數(shù)據(jù)庫實例,為了確保系統(tǒng)資源的合理使用,用戶創(chuàng)建的數(shù)據(jù)庫實例數(shù)量是一定的。如果兩個用戶創(chuàng)建的數(shù)據(jù)庫實例名稱相同,云數(shù)據(jù)庫可以根據(jù)用戶的信息和用戶輸入的信息進行md5值計算,使用md5值作為創(chuàng)建數(shù)據(jù)庫實例的名稱。云數(shù)據(jù)庫把用戶信息、用戶輸入的信息和生成的md5值進行對應(yīng)保存,每次訪問時進行相應(yīng)的轉(zhuǎn)換。
云數(shù)據(jù)庫中數(shù)據(jù)的存放方式是根據(jù)數(shù)據(jù)不同的存放方式進行設(shè)置的。本文在此提出一種經(jīng)過大量實踐總結(jié)而得出的切分方式,該切分方式可以保證云數(shù)據(jù)庫在不減少性能損失的情況下,高效、快捷地切分數(shù)據(jù)。同時,在增加新的數(shù)據(jù)庫節(jié)點時,能夠使數(shù)據(jù)的遷移代價降到最低。
一致性hash算法的出現(xiàn)就是為了解決分布式系統(tǒng)中數(shù)據(jù)分布的問題。要使用一致性hash算法,首先,將需要映射的數(shù)據(jù)節(jié)點通過hash算法計算出其hash值,并分布在hash環(huán)上;其次,將需要存儲的數(shù)據(jù)經(jīng)過hash算法,獲得其hash值,并映射到hash環(huán)上;最后,從數(shù)據(jù)映射到的位置順時針開始查找,將數(shù)據(jù)保存在找到的第一個數(shù)據(jù)庫節(jié)點中。232與0重合,超過232則從0位置開始尋找數(shù)據(jù)庫節(jié)點,如圖3所示。
例如,存放數(shù)據(jù)的物理數(shù)據(jù)節(jié)點數(shù)為4個,則計算這4個數(shù)據(jù)節(jié)點的hash值,并分布在hash環(huán)上。一條數(shù)據(jù)寫入后,系統(tǒng)首先生成其唯一的ID,并計算該ID值對應(yīng)的hash值,根據(jù)hash值映射到hash環(huán)上,順時針尋找第一個遇到的數(shù)據(jù)庫節(jié)點,將數(shù)據(jù)保存至該節(jié)點中。假設(shè)該hash值落在數(shù)據(jù)庫節(jié)點1與數(shù)據(jù)庫節(jié)點2之間,則順時針找到的第一個數(shù)據(jù)庫節(jié)點為2,數(shù)據(jù)最終會被保存在節(jié)點2中。
如果,在數(shù)據(jù)庫節(jié)點2和數(shù)據(jù)庫節(jié)點3中增加一個數(shù)據(jù)庫節(jié)點5,則數(shù)據(jù)庫節(jié)點2到數(shù)據(jù)庫節(jié)點5中間的數(shù)據(jù)需要重新映射到數(shù)據(jù)庫節(jié)點5中。數(shù)據(jù)庫節(jié)點3刪除數(shù)據(jù)庫節(jié)點2到數(shù)據(jù)庫節(jié)點5之間的數(shù)據(jù),如圖4所示。
數(shù)據(jù)庫節(jié)點保存的數(shù)據(jù)都有多個備份,以防止單點的出現(xiàn)。同時,在數(shù)據(jù)庫節(jié)點增加或刪除時,可以使用備份節(jié)點提供服務(wù),從而使得整個云數(shù)據(jù)庫系統(tǒng)無需停機就能夠完成節(jié)點的擴展、移除。
云數(shù)據(jù)庫中的通信管理系統(tǒng)負責整個云數(shù)據(jù)庫中應(yīng)用系統(tǒng)到云數(shù)據(jù)庫之間通信過程的檢測。安全審計檢測系統(tǒng)使用了防火墻技術(shù),同時結(jié)合了數(shù)據(jù)過濾、包過濾技術(shù)。其核心是安全審計規(guī)則,規(guī)則配置得是否合理是安全審計系統(tǒng)能否正常、高效運行的基礎(chǔ)。
為了兼容多種應(yīng)用使用不同的連接方式連接至云數(shù)據(jù)庫,云數(shù)據(jù)庫中通信管理系統(tǒng)配置了多種消息編碼、解碼規(guī)則。當使用不同數(shù)據(jù)庫協(xié)議進行連接時,通信管理系統(tǒng)調(diào)用不同的規(guī)則進行編碼、解碼后,數(shù)據(jù)信息存放到數(shù)據(jù)節(jié)點中。例如,當使用MySQL協(xié)議連接云數(shù)據(jù)庫時,云數(shù)據(jù)庫系統(tǒng)通信管理模塊使用MySQL協(xié)議解碼連接,當需要發(fā)送給應(yīng)用系統(tǒng)結(jié)果時,通信管理模塊使用MySQL協(xié)議進行編碼。使用其他協(xié)議連接時,其過程相同。為了使云數(shù)據(jù)庫兼容更多的協(xié)議,不能使用某個數(shù)據(jù)庫的方言,應(yīng)該使用基于標準的SQL語言。
云數(shù)據(jù)庫中存放數(shù)據(jù)的物理節(jié)點可以使用多種不同的數(shù)據(jù)庫系統(tǒng)。當不同的數(shù)據(jù)庫系統(tǒng)接入云數(shù)據(jù)庫時,云數(shù)據(jù)庫使用后端中對應(yīng)的連接協(xié)議連接數(shù)據(jù)庫。使用該方法能夠使云數(shù)據(jù)庫兼容多種數(shù)據(jù)庫系統(tǒng),提高系統(tǒng)的可用性。
路由管理模塊是云數(shù)據(jù)庫核心模塊之一。數(shù)據(jù)節(jié)點分為虛擬節(jié)點、物理節(jié)點。物理數(shù)據(jù)庫節(jié)點組成虛擬節(jié)點,多個虛擬節(jié)點組成更大的虛擬節(jié)點。每個虛擬節(jié)點對云數(shù)據(jù)庫來說就是一個數(shù)據(jù)存儲點,云數(shù)據(jù)庫對數(shù)據(jù)的存取就是對虛擬節(jié)點的操作。虛擬節(jié)點中一般有多個物理數(shù)據(jù)庫節(jié)點,并且數(shù)據(jù)互為備份。當其中某個物理數(shù)據(jù)庫節(jié)點宕機,路由管理模塊中的心跳檢測機制能夠立即獲得節(jié)點掉線信息,并且把該物理數(shù)據(jù)庫節(jié)點操作分散到備份節(jié)點中。
路由管理模塊能夠把SQL解析器解析的SQL對象分發(fā)到不同的數(shù)據(jù)節(jié)點中。路由管理模塊的核心是路由規(guī)則,在該規(guī)則中,記錄該管理器下所有的節(jié)點配置信息,包括連接數(shù)、連接時長、超時時長等所有基本信息。同時,路由管理器還提供用戶虛擬數(shù)據(jù)節(jié)點、物理節(jié)點及用戶數(shù)據(jù)庫容量使用接口API查詢的功能。
3 性能測試
測試環(huán)境為:(1)云數(shù)據(jù)庫服務(wù)平臺:IBM高性能服務(wù)器,磁盤≥100 GB,內(nèi)存≥16 GB,網(wǎng)絡(luò)≥100 Mb/s,數(shù)量1臺;運行環(huán)境:Linux。(2)數(shù)據(jù)庫節(jié)點:IBM刀片機,磁盤空間≥1T,內(nèi)存≥4 GB,網(wǎng)絡(luò)≥100 Mb/s,數(shù)量4臺,運行環(huán)境:Linux。
測試環(huán)境架構(gòu)圖如圖5所示。
測試采用4臺數(shù)據(jù)庫節(jié)點服務(wù)器,兩兩備份,云數(shù)據(jù)庫數(shù)據(jù)按照數(shù)據(jù)生成ID切分,分別寫入節(jié)點數(shù)據(jù)庫1和節(jié)點數(shù)據(jù)庫3。節(jié)點數(shù)據(jù)庫2和節(jié)點數(shù)據(jù)庫4作為讀數(shù)據(jù)庫。表1是100線程并發(fā)數(shù)測試結(jié)果,表2是500線程并發(fā)數(shù)測試結(jié)果。
從測試結(jié)果可以總結(jié)出,云數(shù)據(jù)庫中單個用戶的并發(fā)數(shù)在500以下,不存在性能瓶頸問題;云數(shù)據(jù)庫的性能與服務(wù)器的配置存在很大的關(guān)系;云數(shù)據(jù)庫節(jié)點的增加對于服務(wù)的讀性能有很大提高,基本成水平增長;數(shù)據(jù)庫節(jié)點的寫性能在不開通事務(wù)的情況下也隨著節(jié)點數(shù)量的增加而增加,在開通事務(wù)時,對寫性能的影響很大。
參考文獻
[1] DARGER D, LEHMAN E, LEIGHTON T, et al. Consistent hashing and random trees: distributed caching protocols for relieving hot spots on the world wide Web[C]. ACM Symposium on Theory of Computing, 1997. 1997:654-663.
[2] 張青鳳, 張鳳琴, 王磊. 多數(shù)據(jù)中心的數(shù)據(jù)同步模型研究與設(shè)計[J].微型機與應(yīng)用,2013,32(12):60-62.
[3] Jia Zhen, Wang Lei ,Zhan Jianfeng, et al. Characterizing data analysis workloads in data centers[C]. In Workload Characterization(IISWC), 2013 IEEE International Symposium on. IEEE, 2013.
[4] 曾超宇,李金香.Redis在高速緩存系統(tǒng)中的應(yīng)用[J].微型機與應(yīng)用,2013,32(12):11-13.
[5] 梁鋼,茅秋吟.云計算IaaS平臺的信息安全和運維服務(wù)設(shè)計[J].電子技術(shù)應(yīng)用,2013,39(7):68-70.