下個世紀(jì)是大數(shù)據(jù)的世紀(jì),是從IT走向認(rèn)知計算的時代。在IT時代成就了一家超級平臺,這就是淘寶,而認(rèn)知時代要做的是數(shù)據(jù)的生意,那是否有一個類似淘寶的超級數(shù)據(jù)平臺呢?IBM正在做這件事情。
IBM在全球布局了40多個基于Softlayer的數(shù)據(jù)中心,以Bluemix作為其主力云端開發(fā)平臺, 在之上通過合作和收購網(wǎng)羅了從Twitter到The Weather Company以及這些年投入250億美金收購的Cognos、SPSS、ILOG、Algo等諸多頂尖分析公司,再加上收購的Compose 所囊括的業(yè)界7大開源數(shù)據(jù)庫等,以期搭建一個“淘寶”式超級數(shù)據(jù)平臺。
2016年3月底,IBM向中國市場披露了其數(shù)據(jù)分析戰(zhàn)略——由多個專有及開源數(shù)據(jù)庫、多種大數(shù)據(jù)及商業(yè)分析算法以及多種數(shù)據(jù)源接入的“淘寶式”超級平臺,再通過優(yōu)化的后臺管理、運維和用戶體驗,為上至專業(yè)開發(fā)者下至普通小白用戶,提供各類數(shù)據(jù)服務(wù)。
跨越數(shù)據(jù)管理鴻溝
大數(shù)據(jù)時代的核心價值是數(shù)據(jù)分析,這個已經(jīng)成為共識。但數(shù)據(jù)分析需要有數(shù)據(jù),有數(shù)據(jù)就需要有數(shù)據(jù)庫和數(shù)據(jù)庫管理服務(wù)。
那么,現(xiàn)在一共有多少種數(shù)據(jù)庫產(chǎn)品?由澳大利亞IT咨詢公司solid IT創(chuàng)建的數(shù)據(jù)庫知識網(wǎng)DB-Engines,就監(jiān)控了全球260多種流行的數(shù)據(jù)庫產(chǎn)品,其中包括商用數(shù)據(jù)庫產(chǎn)品以及開源數(shù)據(jù)庫產(chǎn)品,涵蓋關(guān)系型和非關(guān)系型數(shù)據(jù)數(shù)據(jù)庫。
面對這么龐大的數(shù)據(jù)庫產(chǎn)品及服務(wù),即便是專業(yè)開發(fā)者也要忘而興嘆了。特別是當(dāng)數(shù)據(jù)庫與云服務(wù)結(jié)合形成了云數(shù)據(jù)服務(wù),即在混合云環(huán)境中部署數(shù)據(jù)庫及數(shù)據(jù)分析服務(wù),除了核心數(shù)據(jù)庫管理外,還涉及到跨云的數(shù)據(jù)存儲、遷移、熱備、整合等復(fù)雜的云管理技術(shù)。
異構(gòu)數(shù)據(jù)、異構(gòu)數(shù)據(jù)庫、異構(gòu)云環(huán)境,這就成為了現(xiàn)代企業(yè)面臨的數(shù)據(jù)管理鴻溝。對于IBM等企業(yè)級IT服務(wù)商來說,如何幫助企業(yè)跨越數(shù)據(jù)管理鴻溝,就成了繞不開的問題。于是就出現(xiàn)了IBM過去幾年大力收購數(shù)據(jù)及數(shù)據(jù)庫管理公司的現(xiàn)象。
大數(shù)據(jù)“淘寶”商城
IBM的數(shù)據(jù)分析戰(zhàn)略包括了數(shù)據(jù)分析服務(wù)、云數(shù)據(jù)服務(wù)、數(shù)據(jù)集成服務(wù)、數(shù)據(jù)治理服務(wù)、數(shù)據(jù)集市、跨云的數(shù)據(jù)連接、混合云管理及云存儲服務(wù)、行業(yè)解決方案和開發(fā)者服務(wù)等在內(nèi)的完整鏈條,這些構(gòu)成了IBM在大數(shù)據(jù)時代的“淘寶”商城。
在這個大數(shù)據(jù)“淘寶”商城中,最重要的“寶貝”就是云數(shù)據(jù)服務(wù)(提供DBaaS數(shù)據(jù)庫即服務(wù)),即各種流行數(shù)據(jù)庫的云化、集成、優(yōu)化與管理。這是什么意思呢?以IBM收購的Compose為例,2015年7月IBM收購了開源數(shù)據(jù)庫管理公司Compose。Compose是一家能為企業(yè)用戶管理MongoDB、PostgreSQL、Elasticsearch、Redis、RethinkDB、etcd、RabbitMQ等七種最流行開源數(shù)據(jù)庫的服務(wù)商。
Compose為用戶提供的增值服務(wù)包括:由專家負(fù)責(zé)的24×7全天候數(shù)據(jù)庫監(jiān)控與管理、數(shù)據(jù)庫的容器化及部署、不間斷和無故障的數(shù)據(jù)庫服務(wù)、不同數(shù)據(jù)庫之間的數(shù)據(jù)遷移等。目前,Compose已經(jīng)為數(shù)千家企業(yè)用戶創(chuàng)建和管理了超過十萬個數(shù)據(jù)庫。
而早在2011年IBM就已經(jīng)推出于基于Apache Hadoop的大數(shù)據(jù)分析服務(wù)商用版InfoSphere BigInsights和InfoSphere Streams。2015年,IBM進一步強化了實時數(shù)據(jù)分析,通過Apache Spark重新設(shè)計了超過15個核心分析與商務(wù)解決方案,例如基于Spark技術(shù)把數(shù)據(jù)準(zhǔn)備和優(yōu)化服務(wù)IBM DataWorks的代碼庫從4,000萬行代碼壓縮至500萬行。IBM還推出了基于Bluemix平臺的Spark-as-a-Service服務(wù)。
IBM在2014年收購的Cloudant更是大名鼎鼎,這家創(chuàng)業(yè)公司的產(chǎn)品是基于開源CouchDB架構(gòu)的托管數(shù)據(jù)庫。Cloudant的強項在于永不宕機、動態(tài)擴容以及分布式異地多活存儲,特別適合電商、在線游戲、金融支付等應(yīng)用場景。
當(dāng)然IBM自有的數(shù)據(jù)庫和數(shù)據(jù)倉庫產(chǎn)品,包括經(jīng)典的DB2數(shù)據(jù)庫、DB2 BLU(內(nèi)存列存儲加速)、dashDB(內(nèi)存列存儲數(shù)據(jù)倉庫)、Informix(TimeSeries)等,都擁有大批的傳統(tǒng)企業(yè)用戶,這些產(chǎn)品經(jīng)過云化后也成為IBM云數(shù)據(jù)服務(wù)的一部分。
目前,IBM提供了25種專有及開源數(shù)據(jù)庫的云數(shù)據(jù)服務(wù)。IBM大中華區(qū)副總裁、大數(shù)據(jù)與分析事業(yè)部總經(jīng)理丁少忠表示,IBM云數(shù)據(jù)服務(wù)的核心競爭力在于擁有這些數(shù)據(jù)庫的源碼,在源碼級為用戶提供管理服務(wù)(Managed Service),這極大降低了企業(yè)IT和開發(fā)者的負(fù)擔(dān)。
除了這25種數(shù)據(jù)庫即服務(wù)外,IBM還在2016年初推出了云化的中間件WebSphere Connect,其中包括了DataWorks、API Connect、APP Connect等組件,進一步擴展了IBM連接更多數(shù)據(jù)及云服務(wù)的能力。
引入預(yù)測分析和更多數(shù)據(jù)源
在IBM的數(shù)據(jù)分析戰(zhàn)略中,云數(shù)據(jù)服務(wù)是用戶當(dāng)前馬上就可以用到的服務(wù),而面向未來的預(yù)測性數(shù)據(jù)分析才是IBM真正希望帶來更高商業(yè)價值的服務(wù)。
目前IBM的預(yù)測性數(shù)據(jù)分析服務(wù)包括了Watson Analytics以及SPSS for Machine Learning兩大類。其中,基于認(rèn)知計算的Watson Analytics,以自然語言交互和可視化分析界面,把機器學(xué)習(xí)和預(yù)測性數(shù)據(jù)分析的門檻降低到了最低。
普通人沒有經(jīng)過專業(yè)訓(xùn)練,也能用Watson Analytics完成商業(yè)預(yù)測分析。市場營銷、HR專員、金融分析等能簡單直接地用Watson Analytics實現(xiàn)高級認(rèn)知分析,比如直接向Watson Analytics提問后,Watson Analytics能采集、提取、精簡數(shù)據(jù),并從中發(fā)現(xiàn)趨勢、預(yù)測成果、執(zhí)行可視化分析、創(chuàng)建報告或儀表板等,而且整個過程都可以用自然語言交互。
Watson Analytics分為免費版、個人版和企業(yè)版,其中的免費版就已經(jīng)能提供豐富的功能了。Watson Analytics在全球已有超過一百萬注冊用戶,在大中華區(qū)剛剛推出就獲得了近2萬個注冊用戶。
SPSS for Machine Learning則是基于經(jīng)典的統(tǒng)計分析軟件SPSS。2009年,IBM以12億美元收購了SPSS公司,隨后又?jǐn)U充了統(tǒng)計學(xué)分析運算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)等豐富的功能。有著40多年歷史的SPSS,是目前應(yīng)用最廣泛的數(shù)據(jù)挖掘預(yù)測工具。
除了向中國引進Watson Analytics和SPSS for Machine Learning外,IBM還引入了超過150種公共和免費數(shù)據(jù)源構(gòu)成的信息庫,其中包括了剛收購的The Weather Company。作為美國第四大使用最頻繁的App,Weather公司每天處理高達260億條云服務(wù)查詢,是IBM數(shù)據(jù)服務(wù)和Watson物聯(lián)網(wǎng)業(yè)務(wù)的支柱。
借助Weather公司的平臺,IBM現(xiàn)在可以收集來自世界各地數(shù)十億個物聯(lián)網(wǎng)傳感器的數(shù)據(jù),這些數(shù)據(jù)來自于汽車和飛機遠(yuǎn)程信息處理系統(tǒng)、建筑和環(huán)境傳感器、可穿戴的設(shè)備、醫(yī)用植入物、氣象站、智能手機、社交媒體、制造生產(chǎn)線和供應(yīng)鏈等。接下來,IBM在中國市場將率先推出針對航空公司、媒體、手機廠商等多個領(lǐng)域的服務(wù)與合作。
繼發(fā)力認(rèn)知商業(yè)和認(rèn)知計算后,IBM的大數(shù)據(jù)與分析業(yè)務(wù)也將在中國市場逐一落地,為中國的企業(yè)、開發(fā)者以及軟件開發(fā)商等,搭起一個面向認(rèn)知商業(yè)時代的“淘寶”式超級數(shù)據(jù)平臺。有了這個超級數(shù)據(jù)平臺,物聯(lián)網(wǎng)、智慧城市、智能制造等新經(jīng)濟、新業(yè)務(wù)形態(tài)才能真正發(fā)展起來。