搜索
普通(tōng)企業(yè)7步布局大(dà)數(s π☆€hù)據
2020-10-31

       企業(yè)要 δ↔✔(yào)做(zuò)大(dà)數(shù)據,必須要(yào)→®←☆在IT基礎設施方面具有(yǒu)比較好(hǎo)的(de)數γ♥(shù)據處架構,要(yào)用(yòng)大(dà)一(yī)些(x$☆≤βiē)工(gōng)具比如(rú)數(shù)據分(fēn)布式存儲、H₩ adoop等等。

第一(yī)步,企業(yè)要(yào)實現(xiàn)數(shù)據化☆≥∏(huà)。

   企業(yè)要(yào)為(wèi)此做(φ‍ ♦zuò)好(hǎo)計(jì)劃,到(dào®£")底需要(yào)保存什(shén)麽樣的(de)數(✔≠φ®shù)據,以人(rén)為(wèi)中心的(de)∑ ‍數(shù)據還(hái)是(shì)以産品為(wèi‍↑♣')中心,還(hái)是(shì)更關注企業(yè)'¥運營,需要(yào)做(zuò)好(hǎo&Ω§≥)這(zhè)樣的(de)計(jì)劃,然後再将企業(yè)生(shπ&ēng)産經營中的(de)數(shù)據保存下(xià)來(lá♠&₽i),即便是(shì)現(xiàn)在看(kàn)來(lái)沒什(s≥πhén)麽用(yòng)的(de)數(shù)‍€π≠據,未來(lái)也(yě)可(kě)能(←>> néng)産生(shēng)巨大(dà)的(de)價值。比如(rú)說(shβ$uō)像售樓處、體(tǐ)驗店(diàn)客戶的(de)來(lái)訪數(s→α∏←hù)據,就(jiù)有(yǒu)必要(yào)完 ↔♠π整的(de)記錄下(xià)來(lái)。包括怎麽¶δ過來(lái)的(de),一(yī)個(gè)人(rén)來(lái✘₹π)還(hái)是(shì)幾個(gè)人(rén),有(yǒu£")老(lǎo)人(rén)和(hé)小(xiǎo)孩嗎(ma‍ε),穿什(shén)麽樣的(de)衣服等等,還(hái)有(yǒu)客• ↕≠戶的(de)情緒,看(kàn)了(le)什(shén)麽,問(wèn)了(lφ ∏↔e)什(shén)麽問(wèn)題,最後買了(le)什(sh§∞én)麽東(dōng)西(xī),都(dōu)是(₹✔‌≤shì)非常重要(yào)的(de)數(shù)據。另外(w€≤¥ài),企業(yè)內(nèi)部人(rén)力資源的(de)各個↑>(gè)方面也(yě)都(dōu)可(kě)以記錄下(xi♦÷à)來(lái),這(zhè)些(xiē)可(kě)以進行(xíng)挖掘和(∏←γ hé)分(fēn)析的(de)數(shù•$α‍)據。他(tā)舉例說(shuō),長(cháng)虹公司σε在自(zì)己的(de)生(shēng)産線設置了(le)很(hěn)多₩≠ •(duō)傳感器(qì),監測溫度、濕度、震動、噪音(yīn)、顆粒等​×等因素,希望了(le)解到(dào)生(shē™↔ng)産過程中哪些(xiē)因素會(huì)對(duì)員(¶λ↕yuán)工(gōng)産生(shēng)明↑ ↑(míng)顯影(yǐng)響。他(tā)們此前都(→ dōu)認為(wèi)溫度和(hé)顆粒可(kě)能(néng)對(duì±Ω )于員(yuán)工(gōng)操作(zuò)和(hé)産品質量影≤ λ(yǐng)響最大(dà),但(dàn)是(shì)事(shì)實上(shàn±←♥←g)最終數(shù)據分(fēn)析的(de)結果,溫度是(shì >)沒有(yǒu)什(shén)麽影(yǐng)響的(de),恒溫的(✘<©αde)控制(zhì)對(duì)于生(shē →φαng)産效率和(hé)合格率的(de)貢獻并不(b ↓&€ù)像想象中那(nà)麽大(dà),反而是(shì)噪音(yīn)對(duì"<±)于員(yuán)工(gōng)情緒以及生(shēng&↕>↔)産的(de)影(yǐng)響非常重要(yào)。要(yào)成¥✘∏≠為(wèi)大(dà)數(shù)據企業(₽ε≥∞yè),第一(yī)步企必須要(yào)實現(xiàn)數(shù)據化←♣(huà)。 

第二步,企業(yè)要(yào)建設自(zì)己的(de)$←£大(dà)數(shù)據管理(lǐ)與應用♦β₹≤(yòng)平台。

    對(duì)于很(hěn)多(duō)企©←業(yè),做(zuò)大(dà)數(shù)據并不(bù)是(sσ↕×hì)意味著(zhe)要(yào)自(zì)己←∞₽✘去(qù)建設數(shù)據中心。随著(zhe)σ₽∞∏雲計(jì)算(suàn)和(hé)雲數(sh£>∏‍ù)據中心出現(xiàn),使用(yòng)δ↕ 外(wài)部數(shù)據中心的(de)成本≤÷δ↕已經非常低(dī)了(le),數(shù)據存儲的(de)費(fèi)用(yòng)也(yě)是(shì"•₹&)在成倍的(de)下(xià)降。但(dàn)是(shì),企業(yè)Ωε♥要(yào)做(zuò)大(dà)數(shù)據,必須要(yà↔≠o)在IT基礎設施方面具有(yǒu)比較好(hǎo)的(de)∑© ↕數(shù)據處架構,要(yào)用(yòn≈β₽Ωg)大(dà)一(yī)些(xiē)工(gōng)具比如(rú)數(shù×"★)據分(fēn)布式存儲Hadoop等等。很(hěn)關鍵的(de)♦<ε企業(yè)不(bù)僅要(yào)具備一(yī)個(gè)數(πλshù)據中心的(de)硬件(jiàn),還≤ (hái)要(yào)考慮和(hé)企業(yè)業(yè)務方向結合>™,不(bù)僅就(jiù)是(shì)包括了(le)數(shù)據的(dδ→e)采集、數(shù)據庫架構,向上(shàng)的(↓←♠δde)分(fēn)析模塊,再往上(shàng)的(de)★↓API數(shù)據出口,以及橫向的(de)→↔★一(yī)些(xiē)業(yè)務模塊和(hé)出口這(zhè)些($∑₩xiē)東(dōng)西(xī)。要(yào)做(£←✘↓zuò)成企業(yè)的(de)大(dà)數(₽♠'shù)據管理(lǐ)應用(yòng)平台,我們強調一(yī)定要​επ(yào)從(cóng)企業(yè)的(de)業(yφ✘Ωè)務出發,量體(tǐ)裁衣,企業(yè)首先必須要(yà÷♥♣∏o)搞清楚自(zì)己的(de)業(yè)‌∏務形态是(shì)什(shén)麽。 

第三步,企業(yè)要(yào)自(zì)己培養一(y÷€ī)些(xiē)大(dà)數(shù)據理‍∑'★(lǐ)念,或者是(shì)小(xiǎo)數(shù)據挖掘的(de)團隊。

    做(zuò)大(dà)數(shù)據,企業(yè)的(d£✘e)規模不(bù)一(yī)樣,要(yào)©≠↔求也(yě)不(bù)一(yī)樣。如(rú)果企業(yè)規<✘↑☆模足夠大(dà),比如(rú)說(shuō ®)是(shì)電(diàn)信運營商或者電(diàn)&♦♠力、銀(yín)行(xíng)這(zhè)樣的(de‍β∞)行(xíng)業(yè),可(kě)能(néng)∏★✘≥會(huì)形成一(yī)個(gè)大(dà)數(shù)據的(de¶>)團隊。如(rú)果不(bù)是(shì),比如(rú)說(shuō)就(<&πjiù)是(shì)簡單的(de)服務企業(yè),那(nà±±λ)麽形成理(lǐ)念就(jiù)可(kě)以了(Ωλ→le)。現(xiàn)在我們認為(wèi ±∏)比較好(hǎo)的(de)數(shù)據科(kē)學家(jiā£☆),也(yě)不(bù)是(shì)說(shuō)就 ™&©(jiù)是(shì)特别擅長(cháng)或♣¶ Ω适應網絡,這(zhè)樣的(de)人(rén)不(bù)重要 ₽✔"(yào)了(le),重要(yào)的(de)是(shì)要(yào)有¥✘☆λ(yǒu)武器(qì),什(shén)麽樣的(de©≤λ∏)問(wèn)題來(lái)了(le)知(zhī)道(d™©↔<ào)怎麽解決。

關鍵我們認識是(shì)要(yào)培養四種理(lǐ€←£)念:

  (1)除了(le)結構化(huà)數(shù)據以外δ≈×(wài)還(hái)有(yǒu)文(wβ∑én)本、音(yīn)頻(pín)、圖像、遙感、網∏×Ω絡、行(xíng)為(wèi)軌迹、時(shí)間(ji§&↓"ān)數(shù)據,這(zhè)些(xiē)數(sh÷γ₽€ù)據怎麽處理(lǐ),它存在的(de)大(d∑↑à)挑戰是(shì)什(shén)麽。 

  (2)一(yī)定要(yào)懂(dǒng)預測,因為(wèi)  ≥絕大(dà)部分(fēn)的(de)大(dà)數(s≈λ✔hù)據應用(yòng)回到(dào)預測中,預測裡(lǐ)面很(hěn)↕≤ 多(duō)方法都(dōu)是(shì)基準學÷‍€♣習(xí)的(de),而基準學習(xí)目前最火(♣®huǒ)的(de)方向是(shì)集群學®✔習(xí)。

  (3)要(yào)走分(fēnε®←>)布式存儲計(jì)算(suàn),這(zhè)絕對(duì)不$π(bù)是(shì)說(shuō)我知(zhī)道(d‍≈ào)給Hadoop、Mapreduce、Hbase就(jiù)夠了(le>★®♥),關鍵問(wèn)題是(shì)首先要(yào)知¥ (zhī)道(dào)怎麽樣去(qù)搭一(yī)個($​©≈gè)混合式的(de),你(nǐ)的(de)數(s→★βhù)據來(lái)了(le),我到(dào)底是(shì)應該犧牲我的(d∏★•∞e)一(yī)緻性還(hái)是(shì)犧牲操作(zuò)性,÷♥大(dà)概的(de)成本多(duō)少(shǎo),哪些(xiē)數←©(shù)據挖掘的(de)重要(yào)算(•&✘∑suàn)法我要(yào)把他(tā)H∏γ★adoop、Mapreduce實現(xiàn),哪些(xiē)算(s§π≥uàn)法要(yào)通(tōng)過SPTA,可(kě)變邏輯治理(l£ε♣ǐ)是(shì)在硬件(jiàn)裡(lǐ)面,從♦♠±(cóng)而替代CPU、GPU。

 (4)需要(yào)整個(gè)數(shù)據向外(wài)的(d ∑↔βe)發展,知(zhī)道(dào)哪些(xiē≤©≥β)數(shù)據可(kě)能(néng)在外(wài€®Ω♦)部産生(shēng)什(shén)麽樣的(de)重要(÷€yào)價值,或者外(wài)部的(de)數(shù)據能(néng)夠在你 ↓(nǐ)的(de)企業(yè)産生(shēng)什(shén)麽樣的(dφ∞e)重要(yào)價值。企業(yè)應該培養出÷✔這(zhè)四個(gè)能(néng)力,£¶ <建立起企業(yè)數(shù)據挖掘的(de)‌×人(rén)才團隊。

第四步,企業(yè)一(yī)定要(yào)做(zuò)好(hǎo)自(©→zì)己的(de)外(wài)部數(shù)據&≈​儲備。

   我們都(dōu)說(shuō)“書(shū)到(dào)用(yòng)時&✘(shí)方恨少(shǎo)”,很(hě♥☆n)多(duō)的(de)企業(yè),比如(rú)說(s≠←huō)像服裝銷售這(zhè)樣的(de)傳統行(xíng)業(↕δ₽♥yè),我要(yào)進的(de)貨在淘寶、天貓上≠φ(shàng)賣的(de)怎麽樣?在淘寶、天貓哪一(yīβ≈↔)個(gè)店(diàn)鋪怎麽樣?它的(de)競争品牌是(shì)什(sh∑ én)麽樣售價,怎麽樣銷售的(de)?對(duì)于這(zhè)δ‍φ樣一(yī)些(xiē)數(shù)據,如(rú¶>)果到(dào)需要(yào)的(de)時(shí)φ∑≥候才去(qù)找,往往都(dōu)來(lái)不(bù)及₽★ '了(le)。同樣的(de)道(dào)理(lǐ)。←÷ ✘比如(rú)銀(yín)行(xíng)給中小(xiǎo≥×)企業(yè)發放(fàng)貸款的(d✘"φ¶e)時(shí)候,希望了(le)解到(dào)它的(de)用(yòng)Ω≤‌水(shuǐ)、用(yòng)電(diàn)、生(shēng)産、交通(α♥tōng)數(shù)據,例如(rú)通© ≤​(tōng)過攝像頭就(jiù)能(né≠☆↕φng)知(zhī)道(dào)這(zhè)個(gè♠Ω)企業(yè)到(dào)底有(yǒu)多(duō)少(shǎo)車(chē)←‌λ運行(xíng),這(zhè)些(xiē)數(shù)據可(kě)能(néng↕€®)對(duì)于中小(xiǎo)企業(yè)發放(fàng)貸款決策都(dōγλu)很(hěn)重要(yào)。但(dàn)是(shì)當✘≈ <你(nǐ)要(yào)發貸款的(de)時(shí)<•♦σ候,再去(qù)問(wèn)已經沒有(yǒu)機(jī¶$)會(huì)了(le),或者說(shuō)成本太高(gāo)★↓€了(le)。我們建議(yì),企業(yè)應該學₩ "會(huì)通(tōng)過公共渠道(dào)或者數(★₩€shù)據交換的(de)方法,根據自(zì)己的(de)業(yè)務需求來(lα÷ái)量身(shēn)定做(zuò)自(λσ★∏zì)己的(de)外(wài)部數(sh₽$♣ù)據和(hé)戰略數(shù)據。

第五步,大(dà)企業(yè)一(yī)定要(yào)&≤≈有(yǒu)數(shù)據偵測的(de)能(×​néng)力。

   需要(yào)有(yǒu)創新思•↔維的(de)人(rén)随時(shí)思考這(zhè)些(xiē)問(wè→φn)題,比如(rú)企業(yè)占有(y↕↔§ǒu)的(de)數(shù)據到(dào)底在外(wà←♦'$i)部能(néng)夠産生(shēng)什(shén)麽樣大(d© à)的(de)作(zuò)用(yòng)。就(jiù)像我Ω✘✘σ們經常拿(ná)雅昌藝術(shù)中心的(de)例子(zǐ),它存了(l​ e)很(hěn)多(duō)藝術(shù)品的(de)數(shù)據,所以最後≠↓ 它可(kě)以發布藝術(shù)指數(shù)。同樣國(guó)家(♣∑‍€jiā)電(diàn)網也(yě)發布兩個(gè)指數(shù),一(yī₹↑α★)個(gè)叫重工(gōng)業(yè)用(y™↑òng)電(diàn)指數(shù),一(yī)個(gè)叫輕工(gō'↕αng)業(yè)用(yòng)電(diàγ&n)指數(shù)。淘寶網有(yǒu)它的(d±×•e)CPI指數(shù),還(hái)有(yǒu)很(hδ£€↓ěn)多(duō)企業(yè)的(de)一(yī)些(xiē)數(✘↑ ≠shù)據,實際上(shàng)都(dōu)可(k☆↔ě)以發揮想象不(bù)到(dào)的(de∑•)價值。

第六步,一(yī)個(gè)大(dà)數(shù)據企業≥αφ (yè)包括未來(lái)現(xiàn)代化(huà)企業(yσ±è),一(yī)定要(yào)有(yǒu)開(kāβ₩i)放(fàng)共享的(de)态度。

   一(yī)方面需要(yào)π♦™企業(yè)把自(zì)己的(de)很(hěn)多(duō)問"÷(wèn)題社會(huì)化(huà),另一(yī)方面企業∞©≥₩(yè)要(yào)盡量去(qù)通(tōng)過一♦Ω★♥(yī)些(xiē)平等辦法,通(tōng)過數≠±®(shù)據交換的(de)方式互相(xiàng)共享形成數(shù) ♥據化(huà)。

第七步,企業(yè)還(hái)要(yào)做(zuò)好(♣‍÷$hǎo)數(shù)據方面的(de)戰略投資。我認為(wèi)≠ 有(yǒu)三種比較先進的(de)模式。

   一(yī)種模式♣↔叫做(zuò)産業(yè)鏈布局,比如(rú)說(shuō₽™₹)海(hǎi)爾、長(cháng)虹可(kě)以≠♥•♦投物(wù)聯網,對(duì)物(wù)聯網企業(y<Ω®è)創新進行(xíng)投入。比如(rú)說(shuō)中信集團可(kě)‍¥ε以關注醫(yī)療,在這(zhè)個(gè)♠♦方面尋找相(xiàng)關的(de)數(shù)據應₹↕"§用(yòng)。第二個(gè)方面就(jiù)是(shì)δ↑•技(jì)術(shù),你(nǐ)要(yào)知(zhī)道(d←>ào)哪些(xiē)是(shì)硬技(jì)術(shù)創新,特别♥©是(shì)在基礎術(shù)設施層面的(de),比如(r&>↑®ú)加速存儲,雲計(jì)算(suàn)的✘→★(de)一(yī)些(xiē)技(jì)術(shù)≠™,比如(rú)數(shù)據挖掘,垂直應用≠π(yòng)分(fēn)析,這(zhè)個(gè)方面集中了(le)很(hě≠πn)多(duō)創新也(yě)可(kě)以形成很(hěn)大(dà)的(↔÷λde)規模。第三種模式是(shì)數(shù)據集方面的(de)投資,我們↔÷知(zhī)道(dào)阿裡(lǐ)巴巴投資高×&(gāo)德是(shì)為(wèi)了(le)數(sδ∏&∞hù)據,它投資新浪微(wēi)博不(bù)僅是(shì)要(yφ‌✔¶ào)投錢(qián)還(hái)要(yào)花(huā)錢(qián)買數δ ≈(shù)據,所有(yǒu)這(zhè)一♦•(yī)切本質還(hái)是(shì)想把數(♣↑​shù)據流動起來(lái)做(zuò)更大(dà)的(de)事(♣וshì)情。這(zhè)種投資就(jiù)是™δ(shì)集成數(shù)據,強調數(shù)據流動性 ☆≠✔。這(zhè)些(xiē)投資裡(lǐ)面有(yǒu)幾點是(shì)需要(©π$Ωyào)注意的(de),一(yī)是(shì)要(yà×♣©o)去(qù)關注企業(yè)的(de)數σ® (shù)據價值,其次要(yào)關注早期的(de)投資,去(qù)長γΩ♠♠(cháng)期指引而不(bù)是(shì)短(duǎnγ™)期追逐回報(bào)率,最後還(hái)要(yào)多(duō)關注傳£≠‌§統行(xíng)業(yè)。

   周濤教授提出,大( ∑dà)數(shù)據的(de)本質不(bù)在₽¥于數(shù)據量有(yǒu)多(duō)少(s≠©>hǎo),也(yě)不(bù)在于是(shì)否是(shì)異↑§構的(de)數(shù)據,而是(shì)在于數(shù)據是(shì)關聯•→的(de),整體(tǐ)的(de)數(shù)據可(kě)以流動起來(lái∑♥"•)。他(tā)認為(wèi),跨領域關聯©♥↔,通(tōng)過一(yī)加一(yī)産生(shēng)遠(yuǎn)大(¥≥✘dà)于二的(de)價值才是(shì)大(dà)數(shù)據的(↑$≈de)精髓。


責任編輯:
熊東(dōng)旭


(網絡轉載)