logo

行業(yè)新聞

聯(lián)想大數(shù)據(jù)專家告訴你,如何大數(shù)據(jù)淘金?

點擊數(shù):3594來源:尚吉剛發(fā)布時間:2017-05-18

據(jù)IDC剛剛公布的《數(shù)據(jù)時代2015》預測報告數(shù)據(jù)顯示,到2025年全球數(shù)據(jù)量有望達到163ZB,將是目前全球數(shù)據(jù)量的十倍。由萬物互聯(lián)引發(fā)的數(shù)據(jù)大爆炸,對任何企業(yè)和個人而言,既是挑戰(zhàn),也是機遇。

如何在大數(shù)據(jù)時代利用大數(shù)據(jù)挖掘來獲得財富和機遇?傳統(tǒng)行業(yè)如何引入大數(shù)據(jù)技術為己所用?AI在大數(shù)據(jù)分析中有何作用和價值?圍繞業(yè)界普遍關心的熱點問題,近日,《老尚看科技》采訪了聯(lián)想企業(yè)級大數(shù)據(jù)分析平臺LEAP(下文統(tǒng)一簡稱為LEAP)的相關負責人和技術專家,通過他們的專業(yè)回答,我們可以逐步看清大數(shù)據(jù)挖掘的實現(xiàn)路徑。

大數(shù)據(jù)平臺要有什么絕招,才能應對數(shù)據(jù)大爆炸?

有專家曾經(jīng)預言,大數(shù)據(jù)將成為未來最重要的生產(chǎn)資料,大數(shù)據(jù)的挖掘、歸類、分析和利用能力的高低,很有可能會成為未來決定商業(yè)成敗的關鍵因素。就像石油驅(qū)動著現(xiàn)代工業(yè)不斷向前,用計算驅(qū)動數(shù)據(jù),正在成為驅(qū)動科技和社會進步的重要力量。

聯(lián)想是中國最早倡導和踐行中國智造的科技企業(yè)之一,而LEAP平臺則是聯(lián)想全球化運營和智能制造轉(zhuǎn)型的關鍵支點。據(jù)悉,目前聯(lián)想擁有大數(shù)據(jù)平臺開發(fā)與運維人員超過500名,大數(shù)據(jù)專家、 數(shù)據(jù)科學家、與業(yè)務專家人數(shù)超過了50名;在全球部署了 9個數(shù)據(jù)中心, 擁有超過2000臺服務器,目前存儲總?cè)萘恳?guī)模已達15PB, 數(shù)據(jù)實際總量達到 12PB以上,日新增數(shù)據(jù)量約30TB,日處理涉及數(shù)據(jù)超過150億條,是國內(nèi)最大的制造企業(yè)數(shù)據(jù)集群。聯(lián)想的大數(shù)據(jù)處理能力僅次于BAT三大互聯(lián)網(wǎng)巨頭,其LEAP平臺目前已實現(xiàn)99.9%的全球高可用性。

在聯(lián)想大數(shù)據(jù)高級經(jīng)理張建偉看來,簡單的把數(shù)據(jù)收集上來做統(tǒng)計與整合,即使效率再高也很難給客戶帶來價值,真正能給客戶帶來價值的是海量數(shù)據(jù)的高效計算能力。通過人工智能、深度學習、知識圖譜以及包括數(shù)據(jù)分析等在內(nèi)的高端建模,來使這些數(shù)據(jù)和實際業(yè)務產(chǎn)生關聯(lián),從而對業(yè)務的運營、營銷產(chǎn)生推動、指導,這樣才會產(chǎn)生所謂的“智”。

未來數(shù)據(jù)的激增,不只是企業(yè)數(shù)據(jù)中心產(chǎn)生的大量核心數(shù)據(jù),企業(yè)級計算機和設備產(chǎn)生的邊緣數(shù)據(jù),以及數(shù)以千億計的終端數(shù)據(jù)同樣也增長迅猛,那么如何應對大數(shù)據(jù)動輒七八年就要暴增10倍的挑戰(zhàn)?

張建偉認為,大數(shù)據(jù)時代真正來臨,有四大挑戰(zhàn)必須面臨和應對:

第一,海量數(shù)據(jù)的存儲。如何采集并存儲這些海量數(shù)據(jù)?這是聯(lián)想LEAP平臺、以及其他所有大數(shù)據(jù)平臺都面臨的問題。從平臺層面來看,要看平臺的橫向擴展應用是否可以無縫銜接。假如達到100個節(jié)點,擴展將非常復雜,很可能會遇到由于數(shù)據(jù)翻倍增長而帶來的處理時間不夠用等問題。 聯(lián)想企業(yè)級大數(shù)據(jù)分析平臺的優(yōu)勢則體現(xiàn)在,LEAP Manager可以實現(xiàn)數(shù)據(jù)整個計算節(jié)點的動態(tài)擴展,包括數(shù)據(jù)的動態(tài)分發(fā),這種方式不需要停機,不需要停止現(xiàn)有的業(yè)務就可將原來10個節(jié)點的數(shù)據(jù)集群擴展到100個,甚至更多,整體數(shù)據(jù)量會自動更新,客戶無需花費精力關注數(shù)據(jù)如何更新。

第二,基于技術的演進,如何讓用戶無感地進行更新。大數(shù)據(jù)是源于社區(qū)相關的技術,其演進迭代快速,基本上每年會有一個大版本的更新?;诓煌蟀姹镜难葸M,解決了包括產(chǎn)品自身的豐富性等問題。很多平臺在版本迭代時很難做更新,尤其是一些開源技術,在做大版本迭代的過程中,對底層日志或數(shù)據(jù)的存儲結構都做了很多優(yōu)化或修改,基于現(xiàn)有正在運行的業(yè)務系統(tǒng),很難將其業(yè)務及組件進行升級,而聯(lián)想LEAP平臺支持組件的滾動升級,通過LEAP Manager,用戶即可實現(xiàn)此項操作。

第三,海量數(shù)據(jù)的管理。物聯(lián)網(wǎng)的數(shù)據(jù)來自于多種終端,數(shù)據(jù)類型大多是是異構多元的數(shù)據(jù),如何管理?聯(lián)想LEAP平臺的DataHub,能夠提供標準接口和標準可配置的模板,可以快速地對接口進行擴展。如果是標準接口,不需要做額外工作,就可以快速對數(shù)據(jù)進行擴展,來滿足數(shù)據(jù)增長的新需求。

第四,新舊數(shù)據(jù)如何融合。聯(lián)想LEAP平臺上有自己的數(shù)據(jù)資產(chǎn)管理工具,能夠?qū)φw數(shù)據(jù)進行分類和標準化,對數(shù)據(jù)質(zhì)量和生命周期進行管理。海量數(shù)據(jù)進來后如何使用,一定是需要依靠企業(yè)內(nèi)部的業(yè)務人員、管理人員和相關的行業(yè)專家、數(shù)據(jù)專家等,共同解決海量數(shù)據(jù)進來后對客戶業(yè)務產(chǎn)生的影響、對業(yè)務優(yōu)化產(chǎn)生的新方向等問題。

為了應對數(shù)據(jù)大爆炸的挑戰(zhàn),聯(lián)想LEAP平臺還有一個秘密武器,即LEAP AI。LEAP AI可以通過深度學習相關的算法和行業(yè)應用,把聯(lián)想之前的成功案例和算法全部集中起來,幫助客戶快速認知新數(shù)據(jù)所帶來的業(yè)務價值,以及快速挖掘新數(shù)據(jù)所帶來的影響。

大數(shù)據(jù)挖掘,聯(lián)想有七種武器

大數(shù)據(jù)是一座公認的金礦,而如何挖掘各家各有套路。據(jù)張建偉介紹,聯(lián)想大數(shù)據(jù)的核心就是聯(lián)想LEAP平臺,圍繞LEAP平臺的核心計算能力、存儲能力以及數(shù)據(jù)采集能力,聯(lián)想構建了七種服務,也成為大數(shù)據(jù)分析的七種武器。

第一種服務,規(guī)劃和設計的服務。很多企業(yè)在做大數(shù)據(jù)或應用大數(shù)據(jù)的過程中走了一些彎路,究其原因,往往源于頂層設計不夠清晰,先從底層技術變革去推動,然后慢慢用敏捷迭代的形式去完善。所以,聯(lián)想在總結經(jīng)驗之后,把咨詢服務放在所有項目實施之前,聯(lián)想的大數(shù)據(jù)專家會基于聯(lián)想大數(shù)據(jù)LEAP平臺幫助客戶提供規(guī)劃設計服務。

第二種服務,平臺搭建服務。對于那些已經(jīng)很清楚數(shù)據(jù)來源及如何使用的行業(yè)客戶,他們?nèi)鄙俚氖前〝?shù)據(jù)計算、收集等在內(nèi)的基礎承載平臺。聯(lián)想的渠道伙伴中不乏一些行業(yè)應用經(jīng)驗豐富的ISV,但這些ISV缺乏底層的基礎平臺對大數(shù)據(jù)進行深度的挖掘和支撐。同時從大數(shù)據(jù)平臺的研發(fā)成本和時間周期上來看,很多ISV又無法把更多的精力側(cè)重于基礎平臺的研究。他們更多的是側(cè)重于行業(yè),包括某一個領域縱向的深入挖掘。這時,他們就需要一個強大的服務商或供應商,來幫助他們提供平臺,包括基于其業(yè)務場景的一些平臺大數(shù)據(jù)技術的深度優(yōu)化和服務。

第三,是數(shù)據(jù)質(zhì)量、數(shù)據(jù)管理服務。數(shù)據(jù)往往具有海量、多元、異構的特征,針對這些數(shù)據(jù),如何在企業(yè)層面對數(shù)據(jù)的標準、質(zhì)量、安全及整個數(shù)據(jù)生命周期進行管理很關鍵。這一套數(shù)據(jù)治理,不是一個工具可以解決的,更多的是通過咨詢、服務去幫助客戶梳理構建業(yè)務流程和體系,將整個數(shù)據(jù)資產(chǎn)梳理清楚,以便于其對數(shù)據(jù)資產(chǎn)更好地掌控及應用。

第四,是定制化的服務。在中國不同的行業(yè),甚至不同行業(yè)的不同環(huán)節(jié),不同的縱向生產(chǎn)環(huán)節(jié),服務都是不一樣的。在應用層面及大數(shù)據(jù)層面,除了底層的計算技術以外,偏應用層面的技術很多都需要定制化開發(fā)。比如,相關的算法,在不同的應用場景上都需要做針對性的優(yōu)化和調(diào)整。聯(lián)想LEAP平臺可以提供相關的定制化服務,包括聯(lián)想大數(shù)據(jù)科學家團隊、工程實施團隊,都可以專門為客戶提供更多的定制化開發(fā)服務。

第五,是集成開發(fā)。現(xiàn)在很多客戶,包括一些大客戶更喜歡交鑰匙工程,這就涉及到整體的系統(tǒng)集成,聯(lián)想有自己的硬件、軟件,又有自己的實施團隊,所以聯(lián)想可以提供給客戶一個完整的集成方案。

第六,統(tǒng)一的運維服務。現(xiàn)在大數(shù)據(jù)的平臺對很多企業(yè)而言,尤其對傳統(tǒng)企業(yè)而言,運維存在一定的風險和技術瓶頸。第一,技術不斷迭代,演進太快;第二,原有人員在學習大數(shù)據(jù)時需要時間、成本,還有一些企業(yè)將IT作為輕資產(chǎn),運維人員很難去滿足大數(shù)據(jù)相關的分析及運維相關的服務,因此,聯(lián)想認為有必要以統(tǒng)一運維的形式,給企業(yè)提供相關的運維服務。

第七,是數(shù)據(jù)變現(xiàn)服務。目前聯(lián)想在數(shù)據(jù)變現(xiàn)方面的合作伙伴,包括了很多行業(yè)巨頭,一起做數(shù)據(jù)變現(xiàn)的前沿探索,如何整合資源和渠道,將數(shù)據(jù)真正的去變現(xiàn)。

在張建偉看來,聯(lián)想LEPA平臺其實是一個端到端服務的提供者,既有產(chǎn)品的服務,又有相關的行業(yè)應用增值服務,還包括相關的運營服務,核心目的是利用上述的七種武器幫助客戶解決大數(shù)據(jù)應用及發(fā)展相關的問題。

要進行大數(shù)據(jù)分析,是不是非得推倒重來?

新建一座城市其實并不難,但改造一座歷史悠久的老城卻要難得多,因為要考慮用兼容并包來解決新老并存的問題?,F(xiàn)在很多企業(yè)和行業(yè)客戶,都躍躍欲試要做大數(shù)據(jù)深度挖掘和利用,但他們已有的IT系統(tǒng)是否就得推倒重來?進行大數(shù)據(jù)挖掘的新嘗試,能否盡可能利用和保護已有的IT資產(chǎn)?

張建偉在接受采訪時表示,如何保護已有的IT資產(chǎn),是在大數(shù)據(jù)項目實施過程中常遇到的問題。事實上,聯(lián)想LEAP平臺可以做到跨品牌兼容,無論部署聯(lián)想還是其他品牌的產(chǎn)品,聯(lián)想LEAP平臺都可以很好的兼容,但會對聯(lián)想產(chǎn)品有更深度的優(yōu)化,這能在很大程度上保護了用戶已有的IT投資。

但依照張建偉的經(jīng)驗,保護客戶已有的投資和利益,并不意味著要全盤接受那些已經(jīng)落伍陳舊的設備,像鋼鐵、鋁業(yè)等重資產(chǎn)行業(yè),一些老舊的設備可能服役已經(jīng)幾十年,想要在這些設備商采集數(shù)據(jù)難度非常大,所以聯(lián)想在幫用戶落地大數(shù)據(jù)分析平臺項目之前,會讓相應的技術專家對客戶的實際情況進行摸底,就像給房子做裝修服務,裝修設計師一定會先出設計,告訴用戶哪些還可以保留利用,哪些需要徹底重來,直到用戶對方案和預算認可之后才開始動工。

張建偉表示,大數(shù)據(jù)項目的實施,一味激進并不是好的選擇,聯(lián)想認為比較理想的方案推進可以分三步來走:第一,針對自己沒有想清楚大數(shù)據(jù)應該怎么做的客戶,或?qū)Υ髷?shù)據(jù)的分析存在很多疑惑的客戶,聯(lián)想LEAP平臺的專家們會先摸清其實際IT現(xiàn)狀;第二,會摸清其實際業(yè)務的痛點,上大數(shù)據(jù)最終是要解決業(yè)務的問題;第三,助其規(guī)劃整個大數(shù)據(jù)實施的戰(zhàn)略和Roadmap。這樣可以很好地幫助企業(yè)花最少的錢實現(xiàn)最佳的效果,同時也能節(jié)省更多的時間。

大數(shù)據(jù)掘金,不同于美國西部的淘金熱,憑借著簡陋的工具就可以試試運氣,說到底,大數(shù)據(jù)掘金必須依靠專業(yè)的計算、存儲和分析工具以及服務,而大數(shù)據(jù)采集、整理和分析利用能力,莫說是中小企業(yè),即便是大型企業(yè)也很難具備,所以像聯(lián)想LEAP平臺這樣專業(yè)的大數(shù)據(jù)分析和服務平臺會應運而生、順勢成長。大數(shù)據(jù)服務會成為未來熱門的社會化服務新品類,在云計算的驅(qū)動之下,成為商業(yè)模式創(chuàng)新和產(chǎn)品服務創(chuàng)新的重要支撐點。

面對數(shù)據(jù)大爆炸的現(xiàn)實挑戰(zhàn),是繼續(xù)被動觀望,還是主動擁抱變革?企業(yè)和行業(yè)客戶在今天所做的不同選擇,決定著未來不同的命運走向。

首頁 |方案|支持|案例|關于