面向日志結構化數據存儲的高效數據加載

摘要:近年來,隨著互聯網技術的快速發展,無論是互聯網企業還是傳統的金融機構,用戶量和業務處理數據量都在快速地增長.傳統的通過增加服務器并采用基于分庫分表的方法來解決擴展性問題,需要大量的人工維護成本和硬件開銷.為降低開銷和分庫分表帶來的各種問題,業界通常用新型數據庫系統替換原有的系統,其中,基于日志結構合并樹存儲的數據庫系統(如OceanBase)被廣泛采用,這類系統磁盤上存儲數據塊呈現全局有序的特征.在從傳統數據庫切換到新型數據庫過程中,需要將大量數據加載到新數據庫系統中,長時間加載的過程中可能出現數據庫節點宕機.為了減少總加載時間和故障恢復時間,提出了一種負載均衡且支持高效容錯的數據加載方法;為了支持負載均衡的數據加載,與預確定分區劃分數據的方法不同,考慮到目標系統默認存儲塊大小,采用通過基于文件大小和目標系統默認存儲塊大小預計算分區數目,并利用分庫分表的數據導出往往已經排序的特點,采用選取部分采樣塊和等間隔選取樣本的方式確定分區之間的切分點,避免了全局采樣和隨機或頭部樣本選取方式確定切分點帶來的高開銷;為了加快故障恢復速度,利用日志結構合并樹存儲系統的多備份減少故障恢復時的數據量,提出了基本副本局部故障恢復方式,避免了完全重新加載的故障恢復方式.實驗結果表明,相比采用預確定分區數目和全局選取采樣塊的隨機或頭部選取樣本方法,采用預計算分區數目和部分選取采樣塊的等間隔選取樣本確定切分點的方法,提高了數據加載的性能,并且驗證了基于副本局部故障恢復方法相比完全重啟加載恢復方法的高效性.

關鍵詞:
  • 數據加載  
  • 負載均衡  
  • 容錯  
  • 日志結構  
作者:
丁國浩; 徐辰; 錢衛寧
單位:
華東師范大學數據科學與工程學院; 上海200062
刊名:
華東師范大學學報·哲學社會科學版

注:因版權方要求,不能公開全文,如需全文,請咨詢雜志社

華東師范大學學報·哲學社會科學版緊跟學術前沿,緊貼讀者,國內刊號為:31-1010/C。堅持指導性與實用性相結合的原則,創辦于1953年,雜志在全國同類期刊中發行數量名列前茅。

主站蜘蛛池模板: 日本三级香港三级人妇99| 人人澡人人澡人人看添av| 人气排行fc2成影免费的| 久久乐国产精品亚洲综合| 18禁黄污吃奶免费看网站| 一区二区在线看| 8090在线观看免费观看| 999国产精品| 精品三级久久久久久久电影聊斋 | 国产精品蜜芽在线观看| 欧美香蕉爽爽人人爽| 日韩欧美亚洲视频| 国产精品国色综合久久| 国产精品毛片在线完整版| 肥臀熟女一区二区三区| 99久久99久久免费精品小说 | 亚洲综合色丁香婷婷六月图片| 久久五月精品中文字幕| 五月婷婷婷婷婷| 欧美成人午夜影院| 欧美国产伦久久久久| 1024在线播放| 国产chinesehd精品酒店| 亚洲国产韩国一区二区| 啊灬啊别停灬用力啊岳| 久久精品国产99国产精品| jizz性欧美12| 精品国产一区二区三区不卡 | 好男人社区www在线观看高清| 国产av夜夜欢一区二区三区 | 你懂的国产精品| 久青草国产免费观看| 国产免费AV片在线观看播放| 亚洲免费人成视频观看| 69视频在线看| 网址你懂的在线观看| 手机1024看片| 国产欧美日韩一区二区三区在线| 全部在线播放免费毛片| 久久黄色免费网站| 久久综合久综合久久鬼色|