阿里數據庫真的超過Oracle了麼?
國慶期間,一則“阿里數據庫成績刷新Oracle塵封九年記錄”消息蔓延,讓不少行外人士為之一振。事情是這樣的:螞蟻金服自主研發的金融級分佈式關係數據庫OceanBase,不久前在被譽為“數據庫領域世界杯”的TPC-C 基準測試中打破了由美國公司Oracle(甲骨文)保持了9 年之久的世界記錄,成為首個登頂該榜單的中國數據庫產品。
但雷鋒網卻發現這件事在傳播過程存在信息缺失的問題,不可否認阿里OceanBase的努力,但也應該正確看待這項測試本身,綜合多方消息,雷鋒網希望呈現測試的原貌和代表的意義。
TPC-C 基準測試是什麼?
TPC(transaction processing performancecouncil)被稱為事務處理性能委員會,負責定義諸如TPC-C、TPC-H&TPC-R 和TPC-W 基準測試之類的事務處理與數據庫性能基準測試,並依據這些基準測試項目發布客觀性能數據,也正是因為其權威客觀,TPC-C是行業中公認的權威和最為複雜的在線事務處理基準測試,TPC-C基準測試成為OLTP(在線事務處理系統) 基準測試的工業標準。
TPC-C 於1992 年7 月23 日認可為新的基準測試,通過模擬倉庫和訂單管理系統,測試廣泛的數據庫功能,包括查詢、更新和mini-batch事務(隊列式小批量事務),TPC- C基準測試針對一種模擬訂單錄入與銷售環境測量,tpmC代表每分鐘能處理的事務數量。
記錄塵封九年,不是因為無法突破
非不能也,實不為也。
雷鋒網從數據庫行業人士獲悉,TPC-C 基準測試的準備至少要半年,阿里在後續公佈的信息中也披露,OceanBase團隊前後準備時間超過一年,全世界僅有的三個官方審計員有兩個參與到本次測試審計工作中。
而且九年間不只是Oracle,其他數據庫廠商也沒有選擇去刷新榜單,僅僅是因為Oracle的成績已經領先其他廠商九年麼?性價比是一個不得不提的因素。
突破這個測試能帶來多少有形的或者無形的回報,是廠商需要考慮的現實問題。自媒體特大號就指出,在TPC-C官方370多行的榜單中,只有螞蟻金福的測試結果是白背景,其他公司因為都是灰色背景。榜單備註著:“所有灰色背景的測試結果,由於軟硬件升級的原因而過期”。
九年之後,螞蟻金服排名第一60,880,800 tpmC,排名第二的是九年之前的甲骨文,成績為30,249,688 tpmC。
九年之後,螞蟻金服所用的測試系統總造價:380,452,842人民幣;服務器硬件為420顆英特爾至強白金8163,總核數6720,總線程13440;數據庫是OceanBase2.2。九年之前,Oracle所用的測試系統總造價:30,528,863美元≈213,702,041人民幣;服務器用了108顆SUN Sparc T3,內核總數1728,線程總數13824,數據庫為Oracle 11g R2。
硬件性能的提升雖然不能百分百反映在數據庫性能的提升上,不過實際轉換的性能也今非昔比,而且Oracle數據庫也已經迭代到19c版本,2020年1月將會發布全新版本Oracle Database 20c ,兩家廠商所使用的軟硬件差距都比較大。
前述行業人士認為,Oracle可能也覺得純刷榜單意義不大,本身準備測試耗時耗力,九年時間測試結果也說明從硬指標翻過Oracle也比較難,測試結果證明阿里數據庫性能能達到某個特定值,但是誤傳成比賽不太妥當。
拋開榜單,OceanBase也是第一梯隊
那麼,OceanBase有沒有必要去刷新這個榜單?雷鋒網認為還是有必要的。以往行業都在討論國產數據庫何時能翻過Oracle這座大山,而現在我們至少看到了山路。
雷鋒網獲悉,阿里目前自研數據庫分為兩個支線,OceanBase和POLARDB,OceanBase主要是螞蟻金服體系使用,作為阿里自研的國產分佈式數據庫,支付寶使用的就是OceanBase;POLARDB也是阿里自研的,定位是下一代關係型分佈式雲原生數據庫,是阿里雲主推的雲原生數據庫,目前OceanBase也在阿里雲上公測。

OceanBase產品架構
支付寶在自研之前使用的也是Oracle數據庫,阿里去IOE大潮下,2016年,OceanBase替換了支付寶最核心的賬務系統中的Oracle數據庫,OceanBase實現了OLTP聯機交易處理過程下,前台接收的用戶數據,可以立即傳送到計算中心進行處理並在很短的時間內給出處理結果。
OceanBase和POLARDB在阿里內部也存在部分競爭關係,但總體上都是為了下一代數據庫而努力。OceanBase在普通服務器上實現了金融級高可用,支持“三地五中心”城市級故障自動無損容災,同時具備在線水平擴展能力。
而從實際使用角度,測試所用的服務器和存儲等都很可能不是用戶真實場景,比如全閃變混閃,服務器利舊直接使用老款產品,Oracle的測試結果也是經過優化的,阿里OceanBase的成績已經足以滿足大部分場景的性能要求,而且重要的是價格低不少。比如在OceanBase的測試中,硬件成本只佔整體成本的18%左右,只考慮硬件的性價比大幅優於集中式數據庫。
對此,阿里可能也沒想到事態的發展,會向著“中國自研數據庫打破西方壟斷”的方向傳播,阿里內部人士也對雷鋒網表示,內部對此測試結果沒有太大反應。
此前業內專家向雷鋒網(公眾號:雷鋒網)表示,雲原生數據庫市場可能在未來的兩三年內就會爆發。公有云市場增速減緩,雲原生數據庫更迎合市場需求;當前國外數據庫廠商的技術壟斷逐漸被打破,國產數據庫崛起勢頭強勁有望進一步發展。
數據庫市場即將開始下半場角逐,雲廠商是影響這場戰役新的變量,與Oracle對標並做到Oracle這種程度是很長的過程,當下並不現實。廠商如何用對數據庫市場的理解,或者在數據庫技術上的優勢來去打動價值20-40億元的市場客戶,是擺在數據庫廠商面前的現實問題。
阿里和Oracle數據庫本身的定位就不同,OceanBase的優勢在於採用分佈式架構,硬件成本更低,可用性更好且能夠做到線性擴展,但是,OceanBase單機的性能離Oracle、DB2還有不小的差距,後續需要重點優化單機存儲性能。
此外,OceanBase的定位是在同一套引擎同時支持OLTP業務和OLAP業務,而目前OceanBase的OLAP處理能力還不如Oracle,後續需要加強存儲模塊對大查詢的處理能力,支持將OLAP算子下壓到存儲層甚至在壓縮後的數據上直接做OLAP計算。
九年前,雲計算在國內剛剛興起,如同雲計算對於專有IT基礎設施的衝擊,新的數據庫也在衝擊傳統數據庫,當性價比達到一定程度,雲計算的需求自然浮現,而且隨著技術的演進,雲計算能夠在某些場景體現出不弱於專有IT基礎設施的表現,數據庫領域正在重演九年前一幕。