有一天你去銀行取錢,驚喜地發現:由于系統故障,你的賬戶顯示著馬云的數據……
這種事不可能發生,因為數據庫管理系統非常可靠。網上買火車票,或者將照片上傳云端,你都離不開它。
而商用數據庫管理系統的豐厚利潤,一直被甲骨文為首的幾家美國公司瓜分,中國產品望洋興嘆。
速度和可靠,兼顧是難題
查詢銀行賬戶時,我們不知道數字來自哪臺計算機,哪塊硬盤。有數據庫管理系統(DBMS)替我們干活。
DBMS就像圖書管理員:找到書架,存書,取書……說起來容易,但當圖書館特別大,而且書會拆開來放入相隔遙遠的架子時,管理起來就很麻煩了。
在數據庫開發與實施方面有豐富經驗的IBM分析領域架構師羅曦光舉了一個例子——用戶修改數據時,相關存儲區域會被鎖住,其他用戶只能排隊等,如果DBMS存儲位置不合理,就會耽誤許多時間。數據操作的理想狀況,如同幾十只手彈奏一架鋼琴,各彈各的,互不影響。
“數據庫管理系統,尤其是關系型數據庫管理系統(RDBMS)的方法論,教科書上寫得很明白;其功能和常見的圖書管理系統沒什么差別。但當數據量非常大,到了TB和PB級別,DBMS性能不下降就是一大挑戰。”羅曦光說。
比如一個普通的大型網站,每秒鐘要處理十萬個查詢請求,數據庫得同時執行幾十個查詢任務,而且響應時間極短。
“網絡用戶發送請求,期望一眨眼就得到結果。如果DBMS做得不好,響應時間長到10秒或20秒,用戶會喪失耐心,數據庫還可能經常掛掉。”羅曦光說,要永遠不出故障,達到高可用性,需要很多專門技術。
目前全世界最流行的兩種DBMS是Oracle和MySQL,都是甲骨文公司旗下的產品。競爭者還有IBM公司的DB2、Informix,微軟公司的SQLserver以及開源的MariaDB等等。甲骨文、IBM、微軟和Teradata幾家美國公司,占了大部分市場份額。
國產替代難,輸在穩定性
DBMS國貨也有市場份額,但只是個零頭。銀行、電信、電力等要求極端穩妥的企業,不會考慮國貨。20年前就有人呼吁國貨替代,但一線技術人員并不情愿。
“先發優勢、完善的售后技術支持和高額的遷移成本,是企業難以遷移到新系統的原因。”羅曦光說,國內一家電商平臺為了從Oracle遷徙到別的系統,最多曾用上百人的團隊花了十幾個月,成本不菲。
羅曦光認為,如今的開源DBMS做得很好而且免費,但銀行和傳統龍頭企業出于謹慎,對于將核心系統遷移到開源系統仍會持謹慎態度。
穩定壓倒一切。DBMS行業觀察家曉軍在《國產數據庫發展現狀分析》一文中指出,國內DBMS企業大多源自1990年代的高校,期望實現國產替代。但多年來,“產品的穩定性一直上不去,也不敢做有挑戰性的性能測試。所以,穩定性、性能都無法讓市場信服。結果就是:稍微重要一點的系統根本沒人敢用。”
另外,曉軍說,當年國貨往往模仿Oracle,追求大而全,而技術創新不足、沒有特點。相比之下,1990年代的美國小廠商極富創新力,開辟了一些全新的技術方向,在與甲骨文等巨頭的競爭中成功活了下來。
“這個年代,開源DBMS的源代碼可以隨便下載,國內應該不會有新的入場者再去做傳統的DBMS了。”羅曦光說。
浩瀚代碼的背后,是浩瀚人才
“Oracle的數據庫軟件……代碼量堪稱浩瀚。”曉軍說,“Oracle最有特色的地方就是功能非常繁多,語句極端豐富,即便大部分都不常用。”
曉軍說,小公司在這一點上試圖比肩甲骨文,猶如“乞丐與龍王爺比富”。
曉軍舉例說:“Informix的主要模塊的源代碼就有2000多萬行,Informix當年在美國的核心研發隊伍就有超過200人,加上測試和周邊團隊,不下500人。”
而國內付費使用IBM公司的Informix源代碼的幾家企業,相關隊伍都不超過40人,曉軍說,要快速追趕世界先進水平,閱讀代碼的團隊規模應該超過寫代碼的團隊。因此國內“面對十年前的巨量代碼一籌莫展,要弄通又得花很多年。”
而羅曦光認為,盡管國內公司沒有可以比肩甲骨文的,但“在參與開源軟件的意義上,中國不是沒有入場的資格。這是一個技術充分交流與共享的時代。”
羅曦光說,目前開源的RDBMS(如MariaDB)就有國內軟件開發人員大力支持,與大數據平臺緊密關聯的NoSQL數據庫(如HBase)的開發社區里也活躍著中國開發人員的身影。以阿里云為代表的國內云服務的底層,也包含借鑒開源系統打造的數據庫管理系統。
“今時今日,一個全新的公司來做項目,可能不會選擇國外廠商付費的DBMS。比如互聯網的初創企業,大概率會選擇國內廠商的基于云服務的包含DBMS的整體方案。”羅曦光說。
據統計,超過50%的上市小分子藥物均直接或間接源自天然產物或其化學結構啟發。這些由植物、動物、微生物在億萬年進化中淬煉出的天然分子,擁有人工合成難以企及的復雜結構與強大生物活性,是創新藥物發現的源泉。......
近日,寧波市土壤生物普查項目通過專家驗收,標志著浙江省首個市級土壤生物數據庫正式建成。該項目由寧波大學牽頭,聯合中國科學院城市環境研究所、武漢工程大學共同完成,系統摸清了寧波市土壤生物"家底......
植物性狀是表征環境適應策略與資源分配模式的關鍵指標,為理解物種分布、群落構建及生態系統功能提供了重要基礎。近年來,全球及區域尺度的植物性狀數據庫不斷完善,推動了宏觀生態學、功能生態學及生物多樣性保護等......
2025年4月13日,“中國尿計劃”第二次學術研究會在中國醫學科學院基礎醫學研究所召開,會議采用線上線下結合的方式,吸引了北京、上海、深圳等多地近200位業界學者參與。值此之際,分析測試百科網專訪了項......
來自愛爾蘭、法國和意大利的科學家攜手,成功構建了全球最大的數字微生物庫——“阿波羅”(APOLLO)。“阿波羅”囊括了247092個計算模型,其中包含迄今為止最全面的人體微生物組計算模型,有望增進科學......
9月4日,《自然》在線發表中外科學家的合作成果,該成果建立了全球最大的海洋微生物組數據庫,從中發掘塑料降解酶、基因編輯工具、抗菌肽等重要基因資源。山東大學微生物技術國家重點實驗室教授李盛英為文章共同通......
9月4日,國際頂級期刊《自然》(Nature)在線發表中外科學家的合作成果“Globalmarinemicrobialdiversityanditspotentialinbioprospecting”......
如果您在科研院所讀書或執教,享受學校或研究所購買的數據庫,查資料相對容易。一旦畢業離開學校,或換了一個環境繼續從事技術研究,獲得最新資料就成為非常艱難的事情。百科網為廣大科技人員排憂解難,推出了“an......
代謝組學(Metabonomics/Metabolomics)是繼基因組學和蛋白質組學之后新近發展起來的一門學科,是系統生物學的重要組成部分,已廣泛應用于食品及醫藥等領域。島津一直致力于為代謝組學研究......
財庫〔2023〕35號黨中央有關部門,國務院各部委、各直屬機構,全國人大常委會辦公廳,全國政協辦公廳,最高人民法院,最高人民檢察院,各民主黨派中央,有關人民團體,各省、自治區、直轄市、計劃單列市財政廳......