I/O 2022:谷歌推出全管理型AlloyDB數據庫效率較PostgreSQL競品翻番
在I/O 2022 開發者大會首日,Google 隆重推出了名為AlloyDB 的全託管式PostgreSQL 數據庫。與亞馬遜雲服務(AWS)的Aurora PostgreSQL 競品相比,Google 宣稱AlloyDB 具有翻倍的效率。此外在相同的工作負載下,AlloyDB 的運行效率可達標準PostgreSQL 的四倍、分析查詢的速度也快了百倍。
熟悉Google Cloud 生態的開發者,或許不會對全管型PostgreSQL 數據庫服務感到陌生。
此前該公司已經為PostgreSQL 和Spanner 提供了CloudSQL,且Google Cloud 的全管理關係數據庫服務也提供了PostgreSQL 兼容接口。
AlloyDB 的核心,仍基於標準的PostgreSQL 數據庫來實現。只是為了能夠充分發揮谷歌自家基礎設施的實力,開發團隊才對於其內核進行了修改、同時努力保持在最新的版本狀態。
在AWS 工作了很長一段事件後,Andi Gutmans 於2020 年跳槽到了Google、並擔任數據庫產品的主管兼工程副總裁。
他表示,儘管Google 在幫助企業將MySQL 和PostgreSQL 遷移到雲端的工作中提供了很大的幫助,但還是未能充分照顧到那些想要遷移其遺留數據庫(比如Oracle)到開源服務的部分客戶。
究其原因,是因為許多企業用到了不止一個雲服務提供商,同時希望能夠盡可能靈活地在任何地方運行。在拖延了多年後,目前正有越來越多的客戶願意投入資源來擺脫相關束縛。
隨著Postgres 的崛起(以及MySQL 的衰落)、並逐漸成為開源關係數據庫的事實標準,Google 推動客戶向專用的高性能PostgreSQL 服務遷移的動力也變得更加充足。
Gutmans 補充道:許多Google 客戶正希望將他們的關係數據庫用於分析用例,因而該AlloyDB 開發團隊耗費了大量的精力來確保Postgres 能夠為這部分用戶帶來更好的性能體驗。
在AWS 工作期間,他曾帶領過AWS 諸多分析服務的管理工作,有機會了解到數據對客戶的重要性和關鍵性、並且積攢下了深厚的技術背景。
不過隨著行業風向的轉變,與之交談的不再一定是一線開發人員—— 甚至不少客戶來自業務部門、或以分析師的身份來接洽。
在看到現實世界在如此融合的同時,他也切實感受到了用戶希望從他們的數據中獲得實時的洞察力。
回到技術底層,可知AlloyDB 建立在Google 現有的基礎架構之上、可將計算和存儲剝離開來—— 與運行Spanner、BigQuery 和幾乎所有Google 服務的基礎架構層類似。
除了專注於PostgreSQL 的AlloyDB,相關服務也已在競爭中佔據了相當大的優勢。然而在努力支持多個數據庫引擎/ 查詢語言的時候,你並不總能開展面面俱到的優化。
鑑於企業要求使用Postgre 來遷移這些遺留數據,Google 最終決定在該領域做到頂尖。通過內核級的更改,該團隊已實現超過64 個虛擬內核的線性擴展。
而在分析方面,AlloyDB 團隊也打造了一套基於機器學習的定制緩存服務來學習客戶的訪問模式。然後將Postgres 的行格式轉換為內存中的列格式,以顯著提升執行的效率。