計算機科學系學術講座(六)

發布時間: 2019-09-17 來源: 太阳集团1088vip

題  目:超大規模存儲系統快速低幹擾恢複方法研究

内容簡介:一些線上雲存儲系統部署在幾千甚至上萬節點規模的集群上。如此超大規模意味着更高的設備故障率,而提高數據恢複速率是降低數據丢失率、提高數據可用性的關鍵。雲存儲系統需要提供7×24的連續服務,在超大規模存儲系統中如何實現快速數據恢複而又對前台性能低幹擾是一個經典的兩難問題。

報告人團隊對阿裡雲線上系統的長時間負載行為進行分析觀察,提出一種能夠在超大規模存儲系統中實現快速低幹擾的恢複方法——Dayu(大禹)。Dayu核心思想是定期觀察前台負載并調整恢複計劃,并在每個時間片的調度框架中采用基于動态凸包的節點選擇算法、對高空閑帶寬低可用數據的節點進行優先調度、基于疊代式WSS的速率控制機制、落後任務重新調度等關鍵技術,實現了調度的快速和高質量。

在1000個節點的真實系統上的性能測試表明:在控制前台P90尾部延遲增長不超過4%的情況下,Dayu提高了阿裡雲線上系統的恢複速度3倍左右。相關論文發表在計算機系統領域頂尖國際會議USENIX ATC'19上。

報告人:清華大學  張廣豔  副教授

報告人簡介:博士生導師,主要從事計算機系統前沿理論和方法研究,包括大數據計算、網絡存儲與分布式處理等方面的研究工作。近年來提出大規模存儲系統構建及訪問的方法與關鍵技術,有效提高了存儲系統的性能、擴展性和可用性。研究得到包括國家重點研發計劃、973、863和國家自然科學基金等10餘項國家和省部級項目的支持。發表學術論文40餘篇,其中包括本領域頂級國際會議或期刊FAST論文2篇、USENIX ATC論文1篇、IEEE TC論文6篇、IEEE TPDS論文4篇、ACM TOS論文3篇。近三年獲美國發明專利授權1項(序1),國家發明專利授權5項(3項序1)。研究成果被國家審計署、北京市公安局、中興通訊、國信安辦、阿裡雲公司等多家單位使用,效果良好。主講的研究生課程《高等計算機系統結構》被評選為清華大學精品課程,指導的2名碩士生獲得“清華大學優秀碩士學位論文”稱号。

時  間:2019年9月18日(周三)下午3:30始

地  點:南海樓224室

 

熱烈歡迎廣大師生參加!

 

太阳集团1088vip

2019年9月17日