
2020年9月,Snowflake上市,成為有史以來軟件行業最大的IPO案例,市值一度沖高到超千億美金,沉寂多年的數據倉庫市場再次被點燃。一時之間,誰會是中國的Snowflake,成了無數投資人和技術創業者最為關心的話題。時間來到2022年,這股勢頭非但沒有削弱,反而在國產替代的大背景下迸發出愈發旺盛的生命力,百倉大戰,一觸即發。與此同時,隨著云時代的到來,云數據庫成為近10年來數據庫領域最大的變化,而且這個趨勢目前來看依然會隨著云計算的普及而不斷延伸。第一階段是以RDS、EMR這類托管服務為代表的云數據庫1.0,這個階段核心技術是構建云管控平臺,具備基礎的開源數據庫內核修改能力,確保內核能及時更新并且發現重大bug時可以快速修復,對客戶的最大價值是提升了數據庫運維效率和穩定性;第二階段是以AWS Aurora、阿里云PolarDB引領的存儲計算分離架構為代表的云數據庫2.0,這個階段需要對數據庫IO架構深入理解,充分發揮云平臺的優勢,結合分布式存儲,把數據庫做成面向云的存儲計算分離架構,需要對數據庫的IO模型徹底改造,相比第一階段數據庫彈性擴展能力得到了顯著提升;第三階段是指在云上構建Serverless+HTAP的云原生數據庫,需要對數據庫做更徹底的重構,融入到云架構骨髓,并且要面向云建立新的商業模式,甚至重新定義面向數據庫的開發模式,NoSQL和數據倉庫已經有相對成熟的產品,但在云數據庫最重要的關系型模型方面還沒有完全突破。云計算尚未完全普及,目前三種產品還處在共存階段,但云化趨勢已成。根據Gartner的數據,目前數據庫市場營收已經達到整個軟件市場的18.4%,而云數據庫就貢獻了其中的68%。在此基礎上,云數據庫同樣成為眾多企業實現數字化轉型的抓手。如天翼云TeleDB數據庫憑借“多內核、全生態、社區兼容”的數據庫產品能力,助力中國電信成為全球首個核心IT系統采用自研數據庫全面替代的運營商,累計服務用戶7億+,承載數千套系統。同時在政務、物聯網、新能源、醫療等多個行業落地。相比傳統數據庫,云原生數據庫最為直接的優勢就是直接訪問性和運行時可伸縮性。因為云原生數據庫是完全存在于云上的,用戶不需要進行機房建設、人員招聘培訓等,服務器采購即用。而且可以隨時隨地從多前端訪問,提供云服務的計算節點,因而單點失敗對服務的影響較小。當需要升級或更換服務的時候,可以對節點進行不中斷服務的逐漸升級。同時,云原生數據庫與底層的云計算基礎設施分離,所以能夠靈活及時地調動資源進行擴容和縮容,從容應對流量激增可能帶來的壓力,以及流量低谷期因資源過剩造成的浪費。盡管云原生數據庫的出現,看起來很好地解決了傳統架構數據庫的諸多缺陷,讓企業能夠更高性能且靈活地訪問數據。但不可否認的是,云原生數據庫才剛剛邁出了第一步,還有許多難點有待解決。比如,當前的云原生架構雖然實現了存儲和計算分離,存儲獨立彈性,但是計算節點仍然包含了CPU和內存,無法真正實現秒級彈性擴容和Serverless;當前一寫多讀的架構,雖然實現了讀能力的擴展,但是寫能力仍然受到單機的限制,無法擴展,而采用分庫分表的分布式數據庫擴展,又會犧牲兼容性,需要應用感知和改造,以及較高的維持成本等等。挑戰的背后往往是新的機遇,唯有用發展的眼光發現問題、解決問題,勇于創新,方為中國數據庫產業發展的正解。