摘要:數(shù)據(jù)庫(kù)系統(tǒng)經(jīng)過(guò)近50年的發(fā)展,雖然已經(jīng)普遍商用,但隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)庫(kù)系統(tǒng)在2個(gè)方面面臨挑戰(zhàn).首先數(shù)據(jù)量持續(xù)增大期望單個(gè)查詢(xún)?nèi)蝿?wù)具有更快的處理速度;其次查詢(xún)負(fù)載的快速變化及其多樣性使得基于DBA經(jīng)驗(yàn)的數(shù)據(jù)庫(kù)配置和查詢(xún)優(yōu)化偏好不能實(shí)時(shí)地調(diào)整為最佳運(yùn)行時(shí)狀態(tài).而數(shù)據(jù)庫(kù)系統(tǒng)的性能優(yōu)化進(jìn)入瓶頸期,優(yōu)化空間收窄,進(jìn)一步優(yōu)化只能依托新的硬件加速器來(lái)實(shí)現(xiàn),傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)不能夠有效利用現(xiàn)代的硬件加速器;數(shù)據(jù)庫(kù)系統(tǒng)具有成百個(gè)可調(diào)參數(shù),面對(duì)工作負(fù)載頻繁變化,大量繁瑣的參數(shù)配置已經(jīng)超出DBA的能力,這使得數(shù)據(jù)庫(kù)系統(tǒng)面對(duì)快速而又多樣性的變化缺乏實(shí)時(shí)響應(yīng)能力.當(dāng)下機(jī)器學(xué)習(xí)技術(shù)恰好同時(shí)符合這2個(gè)條件:應(yīng)用現(xiàn)代加速器以及從眾多參數(shù)調(diào)節(jié)經(jīng)驗(yàn)中學(xué)習(xí).機(jī)器學(xué)習(xí)化數(shù)據(jù)庫(kù)系統(tǒng)將機(jī)器學(xué)習(xí)技術(shù)引入到數(shù)據(jù)庫(kù)系統(tǒng)設(shè)計(jì)中.一方面將順序掃描轉(zhuǎn)化為計(jì)算模型,從而能夠利用現(xiàn)代硬件加速平臺(tái);另一方面將DBA的經(jīng)驗(yàn)轉(zhuǎn)化為預(yù)測(cè)模型,從而使得數(shù)據(jù)庫(kù)系統(tǒng)更加智能地動(dòng)態(tài)適應(yīng)工作負(fù)載的快速多樣性變化.將對(duì)機(jī)器學(xué)習(xí)化數(shù)據(jù)庫(kù)系統(tǒng)當(dāng)前的研究工作進(jìn)行總結(jié)與歸納,主要包括存儲(chǔ)管理、查詢(xún)優(yōu)化的機(jī)器學(xué)習(xí)化研究以及自動(dòng)化的數(shù)據(jù)庫(kù)管理系統(tǒng).在對(duì)已有技術(shù)分析的基礎(chǔ)上,指出了機(jī)器學(xué)習(xí)化數(shù)據(jù)庫(kù)系統(tǒng)的未來(lái)研究方向及可能面臨的問(wèn)題與挑戰(zhàn).
注:因版權(quán)方要求,不能公開(kāi)全文,如需全文,請(qǐng)咨詢(xún)雜志社