以下為鄒存璐先生的演講實(shí)錄:
首先非常榮幸有這么一個(gè)機(jī)會(huì),能作為嘉賓,作為相應(yīng)主題的一個(gè)分享,剛才也聽(tīng)了一系列嘉賓做了相關(guān)的服務(wù)創(chuàng)新的主題分享,實(shí)際上從剛才聽(tīng)到的一些內(nèi)容來(lái)講,大家不約而同都選擇了一些圍繞大數(shù)據(jù)、數(shù)據(jù)驅(qū)動(dòng)一些創(chuàng)新內(nèi)容。今天,我這邊分享的內(nèi)容也是跟數(shù)據(jù)相關(guān)的,就是叫數(shù)據(jù)科學(xué)助力企業(yè)服務(wù)創(chuàng)新。東軟大家可能都了解,是作為一個(gè)全國(guó)最大的IT解決方案的服務(wù)提供商,東軟面對(duì)的這些企業(yè),或者面對(duì)的這些客戶來(lái)講,更多的是傳統(tǒng)的大型的企業(yè)。在這里面,對(duì)于這種傳統(tǒng)大型企業(yè)里面,它們?cè)谶@一輪,尤其是互聯(lián)網(wǎng)+的新聞,這一輪的創(chuàng)新模式的創(chuàng)新,這種沖擊之下,它們?cè)谶@里面面臨的一些需求,面對(duì)這些需求,就是東軟接下來(lái)要進(jìn)行的一個(gè)應(yīng)對(duì)解決的一系列的問(wèn)題。
商業(yè)模式的創(chuàng)新,包括從傳統(tǒng)的解決方案,外包人力資源的方式,向IP資產(chǎn)這種產(chǎn)品方面的努力的一些突破。今天的主題,我這塊是來(lái)自于東軟先行產(chǎn)品事業(yè)部,主要是做大數(shù)據(jù)產(chǎn)品一系列的研發(fā),這次的主題是分享一系列的圍繞這個(gè)傳統(tǒng)大型企業(yè)里面的數(shù)據(jù)科學(xué)、人工智能方面創(chuàng)新的歷程分享,在這里面,今天的歷程主要是三個(gè)方面。
第一個(gè)圍繞數(shù)字化創(chuàng)新的探索歷程,接下來(lái)兩個(gè)都是一系列創(chuàng)新實(shí)踐的一些案例,包括對(duì)這些案例的理解和梳理,包括從大數(shù)據(jù)的轉(zhuǎn)變到因果關(guān)系,從傳統(tǒng)互聯(lián)網(wǎng)產(chǎn)生結(jié)構(gòu)化數(shù)據(jù)到半結(jié)構(gòu)化數(shù)據(jù)應(yīng)用的點(diǎn)。第一個(gè)面臨的文化就是企業(yè)級(jí)大數(shù)據(jù)的服務(wù)創(chuàng)新應(yīng)該怎么做?幾位嘉賓都分享不同領(lǐng)域的看法,有新零售業(yè)的,有做企業(yè)協(xié)同的,包括研究院旅游方面的創(chuàng)新,大概在六年前加入東軟的,之前我在做讀博之間做生物數(shù)據(jù)的分析,加入到東軟之后,面臨第一個(gè)問(wèn)題,當(dāng)時(shí)大數(shù)據(jù)正在起步,谷歌剛剛發(fā)布一些新技術(shù),一些大數(shù)據(jù)生態(tài)的系統(tǒng)。當(dāng)時(shí),我們面臨的第一個(gè)問(wèn)題就是圍繞大數(shù)據(jù)這個(gè)領(lǐng)域,我們要做哪方面的創(chuàng)新,要解決哪些客戶方面的痛點(diǎn)和需求問(wèn)題,畢竟大數(shù)據(jù)的概念是非常大的,當(dāng)時(shí)我們來(lái)看的,包括整個(gè)大數(shù)據(jù)的生態(tài)系統(tǒng),生態(tài)院里,解決Iaas基礎(chǔ)設(shè)施的,包括大數(shù)據(jù)基礎(chǔ)平臺(tái)的,有一些是做基礎(chǔ)服務(wù)的,做用戶畫(huà)像的標(biāo)簽輸送,有一些還做圍繞數(shù)據(jù)分析挖掘一些內(nèi)容。在這里面,尤其像東軟面臨的是傳統(tǒng)企業(yè),面臨跟互聯(lián)網(wǎng)新企業(yè)相比,在這種業(yè)務(wù)的探索方面,相對(duì)來(lái)說(shuō),在某一些方面是落后一些的,我們?cè)趹?yīng)對(duì)這種客戶的需求的時(shí)候,經(jīng)常會(huì)問(wèn)的第一個(gè)問(wèn)題就是:“我這塊有相應(yīng)的企業(yè)級(jí)的數(shù)據(jù),你幫我看看這塊有什么需求,怎么做一些創(chuàng)新的工作?!?/p>
這種服務(wù)來(lái)說(shuō),跟傳統(tǒng)東軟面臨的客戶需是截然不同的,東軟很早之前做人力外包的商業(yè)模式,比如說(shuō)像日本企業(yè)的服務(wù)外包,很有可能客戶提出的需求非常的細(xì)致,直接給開(kāi)發(fā)人員,就可以直接進(jìn)行編碼,這種模式在大數(shù)據(jù)模式下是行不通的,自己也沒(méi)有搞清楚應(yīng)該做什么。更多的是我現(xiàn)在有數(shù)據(jù),數(shù)據(jù)質(zhì)量不高,有一些企業(yè)在數(shù)據(jù)積累的階段,并沒(méi)有做好很好數(shù)據(jù)治理工作,數(shù)據(jù)質(zhì)量的保證等等一系列工作。在這里面,微少大數(shù)據(jù)在傳統(tǒng)企業(yè)的創(chuàng)新,首先要解決的就是針對(duì)傳統(tǒng)企業(yè)的現(xiàn)狀,我們?nèi)绾蝸?lái)幫助進(jìn)行一些相應(yīng)的規(guī)劃。為了解決這個(gè)問(wèn)題,我們也是做了一番大的思考,從兩個(gè)方面來(lái)看技術(shù)的方面,對(duì)于我們接下來(lái)要做企業(yè)創(chuàng)新也好,或者相應(yīng)創(chuàng)新產(chǎn)品也好。
第一,從技術(shù)角度發(fā)展來(lái)看。當(dāng)時(shí)在一年左右,大數(shù)據(jù)概念初現(xiàn)是谷歌發(fā)表的三篇論文,有存儲(chǔ)系統(tǒng),包括一些技術(shù)報(bào)價(jià),這套技術(shù)是奠定了大數(shù)據(jù)基礎(chǔ)計(jì)算的路程,推動(dòng)大數(shù)據(jù)的商業(yè)化和價(jià)值化最典型的應(yīng)用就是推薦系統(tǒng)的誕生,是亞馬遜系統(tǒng)應(yīng)用這種協(xié)同過(guò)濾的算法在網(wǎng)站上,結(jié)合用戶一系列的行為數(shù)據(jù),我們可以做一些個(gè)性化的推薦。這是第一次能把數(shù)據(jù)挖掘真正跟用戶緊密的結(jié)合起來(lái),能夠顯著的提高相應(yīng)的收益率。當(dāng)時(shí)亞馬遜公布的收益率,通過(guò)智能推薦引擎,整個(gè)銷售額提高到20%以上,后來(lái)除了商品以外,一個(gè)電影公司,從商品到虛擬的電影商品上面的推薦,又進(jìn)一步推進(jìn)了數(shù)據(jù)分析挖掘的在商業(yè)企業(yè)應(yīng)用的場(chǎng)景。另一方面,從數(shù)據(jù)發(fā)展的趨勢(shì)可以看到,整個(gè)的大數(shù)據(jù)的發(fā)展的熱潮,到互聯(lián)網(wǎng)化的趨勢(shì)來(lái)說(shuō),是一個(gè)必然的結(jié)果,看整個(gè)數(shù)據(jù)發(fā)展的歷程,最早的起源應(yīng)該是來(lái)自于天文學(xué),很早之前,人類第一次是從天文里面,通過(guò)望遠(yuǎn)鏡觀測(cè)到行星運(yùn)行的軌跡,做一些分析和預(yù)測(cè),預(yù)測(cè)太陽(yáng)、行星系的軌跡行為做一些天文方面的內(nèi)容,通過(guò)這個(gè)方面的發(fā)展,整個(gè)數(shù)據(jù)分析挖掘,一片繁榮之后,接下來(lái)到了一個(gè)微觀的世界,由于很多基因數(shù)據(jù)不斷的發(fā)展,相應(yīng)的DNA采樣的數(shù)據(jù)成本的降低,對(duì)DNA、蛋白質(zhì)數(shù)據(jù)的產(chǎn)生,圍繞數(shù)據(jù)分析的技術(shù)開(kāi)始向生物技術(shù)轉(zhuǎn)移,這個(gè)也是我在讀博期間做的內(nèi)容,通過(guò)一些疾病因素的分析,包括大家現(xiàn)在一直在生物學(xué)里面做一些探究,一些疾病跟基因的表達(dá),哪些基因表達(dá)會(huì)容易導(dǎo)致疾病,生物用藥的時(shí)候會(huì)影響相應(yīng)的疾病的一些治療。另外,隨著這種生物技術(shù),尤其是互聯(lián)網(wǎng)的發(fā)展,在互聯(lián)網(wǎng)上面產(chǎn)生了大量的行為的數(shù)據(jù),產(chǎn)生了一系列的內(nèi)容數(shù)據(jù),包括互聯(lián)網(wǎng)相應(yīng)技術(shù)的提升之后,采集到用戶在互聯(lián)網(wǎng)一系列的操作行為,這些有系列推動(dòng),圍繞互聯(lián)網(wǎng)方面的發(fā)展,說(shuō)到個(gè)性化推薦,提供一系列個(gè)性化推薦服務(wù)。下一個(gè)階段就是圍繞這種物聯(lián)網(wǎng)信息的發(fā)展,最近工信部推薦NBLT相關(guān)技術(shù)的基礎(chǔ)建設(shè),圍繞物的建設(shè)人工智能、大數(shù)據(jù)的發(fā)展會(huì)圍繞物聯(lián)網(wǎng)的趨勢(shì)上進(jìn)軍。
從技術(shù)的角度來(lái)看,從大數(shù)據(jù)相應(yīng)的技術(shù)里面,跟傳統(tǒng)的分析技術(shù)到底有什么區(qū)別,在互聯(lián)網(wǎng)這一輪大數(shù)據(jù)技術(shù)之前,有了一系列的BI商業(yè)智能的技術(shù),從純技術(shù)上考慮,大數(shù)據(jù)能處理的數(shù)據(jù)量很大,能進(jìn)行相應(yīng)的框架的橫向拓展,比傳統(tǒng)BI的傳統(tǒng)量容納的數(shù)據(jù)量會(huì)更多一些。除了量以外,處理的緯度更多了,在互聯(lián)2.0技術(shù)采用以后,像微信、大眾點(diǎn)評(píng)、美團(tuán)點(diǎn)評(píng),有大量文本數(shù)據(jù)的產(chǎn)生,這些傳統(tǒng)BI商是不會(huì)做這種處理,更多是針對(duì)結(jié)構(gòu)性的數(shù)據(jù),針對(duì)這個(gè)能力來(lái)說(shuō),有一個(gè)相應(yīng)技術(shù)的產(chǎn)生,推動(dòng)這種文本數(shù)據(jù)挖掘一些潛在的價(jià)值,又增加了一個(gè)緯度,傳統(tǒng)企業(yè)里面,80%的數(shù)據(jù)都是文本數(shù)據(jù),我們很多做的客服系統(tǒng),做一些咨詢的時(shí)候,都是非技術(shù)化的數(shù)據(jù),經(jīng)過(guò)這種語(yǔ)音轉(zhuǎn)文本的技術(shù)處理,轉(zhuǎn)變成半結(jié)構(gòu)化的文本數(shù)據(jù),這里面蘊(yùn)含了大量的價(jià)值,沒(méi)有被傳統(tǒng)的BI挖掘出來(lái),這個(gè)大數(shù)據(jù)相關(guān)的技術(shù)給了一個(gè)新的活力。
第三個(gè)就是時(shí)效性的問(wèn)題,大數(shù)據(jù)產(chǎn)生這種分布式的計(jì)算和分布式流的計(jì)算技術(shù),有一個(gè)顯著的增高。下面也是總結(jié),從業(yè)務(wù)的角度,傳統(tǒng)BI和高級(jí)分析的技術(shù)差異的區(qū)別是什么。傳統(tǒng)的BI的商業(yè)智能更多是圖形化的表達(dá),描述你過(guò)去發(fā)生了什么,最終是一個(gè)輔助決策,最終還是要給人看,人根據(jù)這種相應(yīng)的數(shù)據(jù)報(bào)告做最終的決策。新一輪就是第三階段到第四階段就是預(yù)測(cè)未來(lái)會(huì)發(fā)生什么,和決定未來(lái)要怎么做,這個(gè)內(nèi)容是大數(shù)據(jù)梳理效能提升的一個(gè)典型的特點(diǎn)。
有一個(gè)典型的例子,在傳統(tǒng)里面,面對(duì)傳統(tǒng)金融銀行的企業(yè),里面是他們?cè)谟蒙虡I(yè)智能是最早的一批用戶,他們是最早非常關(guān)注企業(yè)相應(yīng)內(nèi)部的數(shù)據(jù)的管理,尤其是傳統(tǒng)金融、銀行里面相應(yīng)資金比較雄厚,早期里面對(duì)這個(gè)投入比較前傾一些,整個(gè)的處理流程是這樣,所有銀行的分行,會(huì)把數(shù)據(jù)用戶交易信息的相應(yīng)數(shù)據(jù)的采集,總行做數(shù)據(jù)倉(cāng)庫(kù)和BI系統(tǒng)的建設(shè),分行把數(shù)據(jù)收集匯總到總行,總行做分析和預(yù)測(cè),哪些用戶有這種流失的風(fēng)險(xiǎn),經(jīng)過(guò)這種分析之后,會(huì)形成這樣一個(gè)客戶流失的列表,這個(gè)列表會(huì)下發(fā)到支行里面,支行根據(jù)客戶列表客戶,都有相應(yīng)的客戶經(jīng)理,根據(jù)這種客戶名單進(jìn)行一個(gè)比對(duì),發(fā)現(xiàn)有潛在流失客戶的可能,做適當(dāng)?shù)年P(guān)懷,我們了解這個(gè)周期下來(lái)大概是幾個(gè)星期,可以想象幾個(gè)星期的周期下來(lái),這個(gè)客戶早就流失掉了。
還有一個(gè)場(chǎng)景就是互聯(lián)網(wǎng)實(shí)時(shí)競(jìng)價(jià)的系統(tǒng),包括DRP也是生態(tài)系統(tǒng)里的一環(huán),根據(jù)互聯(lián)網(wǎng)采集的行為數(shù)據(jù),包括剛才說(shuō)的眾盟里面WIFI的探針,形成一些用戶畫(huà)像,在互聯(lián)網(wǎng)的網(wǎng)頁(yè)里面,都有一些廣告位置,這個(gè)是按照相應(yīng)的價(jià)值來(lái)進(jìn)行出售的,每一次用戶進(jìn)來(lái)之后,會(huì)根據(jù)用戶的畫(huà)像的特征,向不同的廠商進(jìn)行展示,會(huì)根據(jù)匹配度進(jìn)行價(jià)格的信息比對(duì),我就出1塊錢買這個(gè)廣告位,展現(xiàn)給客戶,覺(jué)得匹配度更低,我就出更低的價(jià)格,每一家廠商出價(jià)格之后,最后競(jìng)價(jià)高者展現(xiàn)在客戶面前,在這個(gè)運(yùn)行時(shí)間效率大概是在毫秒級(jí)??梢韵胂?,星期到毫秒級(jí)的差異,典型的一個(gè)問(wèn)題,如果達(dá)到了毫秒甚至秒級(jí)的時(shí)候,就不會(huì)有人的因素參與進(jìn)來(lái),有人的參與就不會(huì)達(dá)到即實(shí)的決策。這個(gè)傳統(tǒng)智能更多在第一第二階段,數(shù)據(jù)科學(xué)是高級(jí)分析,我們能做出相應(yīng)的決策。
數(shù)據(jù)科學(xué)并不是一個(gè)全新的學(xué)科,或者理念。實(shí)際上他是一個(gè)復(fù)合型的學(xué)科,傳統(tǒng)里面,我們更多是偏一些技術(shù)的人員都知道,都偏向于計(jì)算機(jī)科學(xué)技術(shù)、數(shù)學(xué)統(tǒng)計(jì)信息更多,大數(shù)據(jù)相關(guān)的技術(shù),在商業(yè)環(huán)境里面的應(yīng)用,就是領(lǐng)域知識(shí)的結(jié)合,沒(méi)有這個(gè)知識(shí)的結(jié)合,很難把相應(yīng)數(shù)據(jù)背后的價(jià)值進(jìn)行挖掘出來(lái),傳統(tǒng)里面,更多在技術(shù)里面強(qiáng)調(diào)技術(shù)牛人,現(xiàn)在更多強(qiáng)調(diào)的是技術(shù)商人的概念,怎么把技術(shù)跟現(xiàn)有的業(yè)務(wù)進(jìn)行一個(gè)有機(jī)無(wú)縫的對(duì)接,體現(xiàn)商業(yè)價(jià)值。
實(shí)際上在這里面,我是2011年加入東軟,那時(shí)候大家都在做HDFS,解決一些大數(shù)據(jù)低廉、高效查處的功能,更多的是圍繞數(shù)據(jù)的挖掘,定的整體的發(fā)展路線還是圍繞數(shù)據(jù)里面的一些價(jià)值,也就是現(xiàn)在咱們說(shuō)的人工智能,當(dāng)時(shí)探索之路,由于東軟是解決方案的提供上,本身來(lái)說(shuō),之前沒(méi)有自身業(yè)務(wù)的運(yùn)營(yíng),現(xiàn)在來(lái)說(shuō),東軟也是在做相應(yīng)的轉(zhuǎn)型,有了一系列自己的產(chǎn)品,有了一些商業(yè)模式運(yùn)營(yíng)的內(nèi)容,所以,當(dāng)時(shí)來(lái)說(shuō),要解決分析應(yīng)用的時(shí)候,更多的時(shí)候你的數(shù)據(jù)從哪里來(lái),當(dāng)時(shí)我們有很多的一些合作的客戶,讓他們這些有一些相應(yīng)的數(shù)據(jù),包括東軟內(nèi)部有一些運(yùn)維數(shù)據(jù),還有企業(yè)協(xié)作的場(chǎng)景,基于這些場(chǎng)景,我們做了一系列的,像亞馬遜這種個(gè)性化推薦的內(nèi)容,圍繞企業(yè)內(nèi)部這種協(xié)同辦公的數(shù)據(jù),發(fā)現(xiàn)企業(yè)內(nèi)部的一種意見(jiàn)領(lǐng)袖,他們的影響力做了一些分析,通過(guò)這些應(yīng)用場(chǎng)景的分析,我們進(jìn)一步的抽象,形成一種新的工具平臺(tái),機(jī)器學(xué)習(xí)的平臺(tái),文本挖掘的平臺(tái),又進(jìn)行一些新應(yīng)用的拓展,有向物聯(lián)網(wǎng)的拓展,還有預(yù)測(cè)性維護(hù)、異常檢測(cè)、效能優(yōu)化的場(chǎng)景。
從探索來(lái)講,經(jīng)過(guò)這么多年的實(shí)踐,總結(jié)下來(lái),包括一些報(bào)告也提到,現(xiàn)有企業(yè)級(jí)大數(shù)據(jù)相關(guān)數(shù)據(jù)驅(qū)動(dòng)的模式來(lái)說(shuō),核心的業(yè)務(wù)就是人、業(yè)務(wù)、物,很多智能場(chǎng)景都是這三者有機(jī)的合同和融合的應(yīng)用。具體來(lái)看一下,在這里面,首先是人跟業(yè)務(wù),非常典型的就是剛才提到的個(gè)性化的推薦,就是智能業(yè)務(wù)的產(chǎn)生分析人和業(yè)務(wù)系統(tǒng)之間交互的數(shù)據(jù),提供個(gè)性化業(yè)務(wù)辦理流程優(yōu)化,提高業(yè)務(wù)處理效率,就是個(gè)性化推薦,他們來(lái)做這個(gè)內(nèi)容,在業(yè)務(wù)辦理過(guò)程當(dāng)中,我怎么提高效率,尤其是這種海量的信息里面,我怎么加速用戶找到他感興趣的東西,需要的東西這都是人跟業(yè)務(wù)之間結(jié)合的場(chǎng)景。
另一個(gè)場(chǎng)景實(shí)際上就是物跟業(yè)務(wù),這個(gè)是比較未來(lái)的場(chǎng)景,現(xiàn)在來(lái)說(shuō),尤其是現(xiàn)在的手機(jī),移動(dòng)設(shè)備的增加,這個(gè)場(chǎng)景離我們也不是太遙遠(yuǎn)了,就是智能設(shè)備基于傳感器采集到環(huán)境信息,進(jìn)行智能自主控制的決策,比如說(shuō)設(shè)備智能自主效能的優(yōu)化。甚至來(lái)說(shuō),剛才我們講到的,很多現(xiàn)在的業(yè)務(wù)怎么促進(jìn)人在環(huán)節(jié)里面的體驗(yàn),那么,從未來(lái)的角度來(lái)說(shuō),很多的一些場(chǎng)景,這種決策購(gòu)買的內(nèi)容,很多是由物,智能設(shè)備來(lái)下達(dá)的,大家都開(kāi)汽車,很多的汽車,到達(dá)一個(gè)里程數(shù)量的時(shí)候,進(jìn)行一個(gè)傳感器監(jiān)測(cè)的時(shí)候,可以看到保養(yǎng)的時(shí)間,汽車可以根據(jù)自身的狀態(tài),向4S店自主發(fā)送相應(yīng)的請(qǐng)求,請(qǐng)求一些相應(yīng)保養(yǎng)的服務(wù),這樣由物直接產(chǎn)生業(yè)務(wù)的場(chǎng)景會(huì)越來(lái)越多,這種業(yè)務(wù)的辦理跟人的業(yè)務(wù)辦理的時(shí)候有很大的不同,物自主消費(fèi)的時(shí)候,更多是理性消費(fèi),會(huì)促進(jìn)新一輪業(yè)務(wù)模式的改變。
另一個(gè)就是人跟物的,在座的都有穿戴設(shè)備的,包括心率、心跳,拓展人行為的特征的數(shù)據(jù),從而提供一些智能信息推送的一些決策,可以根據(jù)心率、心跳、血壓提供一些健康的預(yù)警,提供一些急救自主的場(chǎng)景。人與人實(shí)際上就是現(xiàn)在看到這種社交化網(wǎng)絡(luò)的場(chǎng)景,基于人與人之間的網(wǎng)絡(luò),進(jìn)行一些機(jī)能的發(fā)現(xiàn),跟協(xié)同也是其中的一個(gè)問(wèn)題,大型企業(yè)有幾百人員工,新項(xiàng)目里面,找相應(yīng)的技術(shù)專家,東軟里面有兩萬(wàn)多人,高層和下面員工的時(shí)候,這個(gè)項(xiàng)目適合誰(shuí)來(lái)做,誰(shuí)做這個(gè)最合適,如何發(fā)現(xiàn)一些專家的技術(shù)的發(fā)現(xiàn),通過(guò)社交的關(guān)系,來(lái)做相應(yīng)技能的發(fā)展方式。
再未來(lái)一個(gè)就是物與物之間的協(xié)作,這個(gè)是一個(gè)新的理念,就是社交化物聯(lián)網(wǎng)的概念,未來(lái)來(lái)講,就是物與物之間的自主構(gòu)建社交化的關(guān)系,并通過(guò)網(wǎng)絡(luò)推理發(fā)現(xiàn)進(jìn)行協(xié)作完成業(yè)務(wù)目標(biāo)。最終來(lái)說(shuō),實(shí)際上是三者的大融合,進(jìn)行互相的協(xié)作的場(chǎng)景,這個(gè)有一個(gè)典型的場(chǎng)景例子是什么呢,就是剛才汽車的例子,人跟汽車還有一個(gè)智能的保險(xiǎn),或者理賠的業(yè)務(wù),這三者之間可以協(xié)作產(chǎn)生新的模式,比如說(shuō)未來(lái)的智能汽車,可以根據(jù)駕駛員的習(xí)慣、里程數(shù)進(jìn)行一個(gè)智能的投保業(yè)務(wù)的辦理,現(xiàn)在這種保險(xiǎn)大家都知道,就是固定的年限,按照去年的出險(xiǎn)的次數(shù)進(jìn)行定價(jià),不管你車的里程數(shù)是什么樣的未來(lái)保險(xiǎn)業(yè)務(wù)可能跟價(jià)值習(xí)慣,是一個(gè)駕駛的習(xí)慣這些信息,更多提供一個(gè)合理的報(bào)價(jià),你是一個(gè)激烈的駕駛員,就要付出更多額外風(fēng)險(xiǎn)的報(bào)價(jià),或者是成本吧。當(dāng)事故發(fā)生以后,智能的汽車設(shè)備會(huì)采集到人的體能信息,可以向醫(yī)院發(fā)生一些求助的信息,同時(shí)可以根據(jù)碰撞的內(nèi)容,向保險(xiǎn)業(yè)務(wù)進(jìn)行自動(dòng)的索賠,這三者來(lái)說(shuō),可以進(jìn)行一個(gè)大的融合,產(chǎn)生更多新的商業(yè)模式。
實(shí)際上從企業(yè)的整體圍繞數(shù)據(jù)分析和挖掘來(lái)看,各行各業(yè)都有,現(xiàn)在我們看到的實(shí)際上是一個(gè)碎片化,盡管我們看到很多的大型企業(yè)里面,都有這種數(shù)據(jù)分析的一些模型,但是即使是同一個(gè)行業(yè)里面,不同家的公司,業(yè)務(wù)里面的差異還是很大的,怎么去解決?很多像互聯(lián)網(wǎng),尤其像互聯(lián)網(wǎng)創(chuàng)新公司,我做一點(diǎn),把這一點(diǎn)做透了,就能保證企業(yè)的生存率,大企業(yè)很難做到這樣,互聯(lián)網(wǎng)那套的邏輯,之所以能成立,因?yàn)榛鶖?shù)非常大,一個(gè)小的比例的用戶,由于你的基數(shù)比較大,服務(wù)的人群還是比較多,獲得的利益還是比較多一些,像傳統(tǒng)的大型企業(yè)來(lái)講,每一家客戶里面,個(gè)性化、定制化的需求很多,很難滿足共性的內(nèi)容,還有一個(gè)大的基數(shù)。東軟應(yīng)對(duì)的策略,就是利用一系列平臺(tái)的產(chǎn)品跟業(yè)務(wù)的應(yīng)用相結(jié)合,實(shí)際上在平臺(tái)里面有一個(gè)高級(jí)分析的產(chǎn)品,就是知識(shí)服務(wù)平臺(tái),做一種個(gè)性化的推薦,做經(jīng)營(yíng)者的營(yíng)銷,做一些客戶的營(yíng)銷。做一些故障的診斷、一些性能的診斷和優(yōu)化。
圍繞一系列的產(chǎn)品里面,我們做了一系列的案例的實(shí)踐,從總結(jié)下來(lái)就是兩大方面。一個(gè)是從關(guān)聯(lián)關(guān)系到因果關(guān)系,另外一個(gè)就是從結(jié)構(gòu)化數(shù)據(jù)到半結(jié)構(gòu)化數(shù)據(jù)。關(guān)聯(lián)關(guān)系和因果關(guān)系就是啤酒跟尿布的故事,發(fā)現(xiàn)購(gòu)買啤酒的商戶,很可能同時(shí)購(gòu)買尿布的內(nèi)容,在現(xiàn)實(shí)里面,我們常常很多的一個(gè)場(chǎng)景會(huì)混淆關(guān)聯(lián)關(guān)系和因果關(guān)系的差異,關(guān)聯(lián)關(guān)系是知道這兩個(gè)事件會(huì)共同發(fā)生,不知道這兩者之間誰(shuí)影響誰(shuí),因果關(guān)系我們能發(fā)現(xiàn)誰(shuí)是因誰(shuí)是果,誰(shuí)是影響另外一個(gè)因素的關(guān)系。如果你有了一個(gè)關(guān)聯(lián)關(guān)系的時(shí)候,實(shí)際上可以做到相應(yīng)的預(yù)測(cè),如果有因果關(guān)系,在預(yù)測(cè)的基礎(chǔ)上可以做到相應(yīng)的控制,能影響干擾這個(gè)因,就可以作用到相應(yīng)的果。從大數(shù)據(jù)的角度,從數(shù)據(jù)挖掘的角度是一個(gè)很難挖掘定位的地方,把因果關(guān)系弱化掉了,只關(guān)心關(guān)聯(lián)關(guān)系,我是關(guān)心預(yù)測(cè),不是關(guān)心控制,因果關(guān)系是很難定義的,這里面經(jīng)常舉一個(gè)例子,在古代的時(shí)候,很多的部落,都會(huì)迷信,迷信什么呢,比如說(shuō),崇拜一些動(dòng)物,或者物體,比如說(shuō)有一些部落崇拜雞,當(dāng)一打鳴的時(shí)候,太陽(yáng)會(huì)升起來(lái),這就是關(guān)聯(lián)關(guān)系和因果關(guān)系混淆的一個(gè)場(chǎng)景。還有一種方法可以干預(yù)某一個(gè)事項(xiàng)的發(fā)生,干預(yù)這個(gè)事項(xiàng)發(fā)生之后,另一個(gè)因素會(huì)不會(huì)發(fā)生改變,我們把雞殺掉,太陽(yáng)照常升起,就可以把這個(gè)因素去掉,所以很多的因果關(guān)系在現(xiàn)實(shí)里面很難挖掘,更多的是強(qiáng)調(diào)關(guān)聯(lián)關(guān)系的場(chǎng)景。
場(chǎng)景的應(yīng)用是公安犯罪分析預(yù)警系統(tǒng)。在這里面有一個(gè)典型的關(guān)聯(lián)關(guān)系推的,哪些特征,哪些出行軌跡的行為特征,你更有可能是犯罪的同謀,或者犯罪行為。還有很多學(xué)術(shù)文章的發(fā)表,單單從人臉的微表情的特征,從證明照里面可以進(jìn)行識(shí)別,那個(gè)學(xué)術(shù)文章達(dá)到98%左右,這個(gè)文章還是非常有爭(zhēng)議的論文,這個(gè)是典型的關(guān)聯(lián)關(guān)系,不是你有這個(gè)行為導(dǎo)致你犯罪,而是犯罪人群有這樣一些共同的特點(diǎn)和內(nèi)容。
另一個(gè),做風(fēng)洞實(shí)驗(yàn)的,我們軍工的客戶,飛行器和導(dǎo)演的客戶,會(huì)進(jìn)行風(fēng)洞的實(shí)驗(yàn)進(jìn)行試吹,來(lái)調(diào)一些造型和設(shè)備的制造優(yōu)化的內(nèi)容,在這里面就是一個(gè)典型,我們要追求的是因果關(guān)系,要找到哪些參數(shù)會(huì)影響相應(yīng)的標(biāo)準(zhǔn)的指標(biāo),或者一些內(nèi)容,在這里面的案例,發(fā)現(xiàn)一些預(yù)測(cè)優(yōu)化,來(lái)幫助他們?cè)趯?dǎo)彈里面或者飛機(jī)制造里面做一些產(chǎn)品優(yōu)化。
還有一個(gè)軌道交通的客流量的預(yù)測(cè),要發(fā)現(xiàn)哪些因素會(huì)影響客流量的增長(zhǎng)或者減少,這里面更多的是向一些地鐵的客戶,除了交通,起來(lái)很多政府機(jī)關(guān)對(duì)客流量也是非常關(guān)注的,我們接觸的公安的一家客戶,他們對(duì)客流量的預(yù)測(cè)感興趣,原因是什么呢?去年舉辦過(guò)馬拉松的重大活動(dòng),對(duì)客流量預(yù)測(cè)沒(méi)有把控好,導(dǎo)致很多選手跑到選手之后,大部分都是走回家的,這里面由于沒(méi)有做好相應(yīng)預(yù)測(cè)的工作,沒(méi)有預(yù)測(cè)工作就沒(méi)有相應(yīng)合理資源的安排,導(dǎo)致相應(yīng)內(nèi)容的影響。還有旅游景點(diǎn),游客量暴增,會(huì)發(fā)生一些危險(xiǎn)事件,像天氣的因素、事件的因素等等一系列的因素,會(huì)不會(huì)能夠影響相應(yīng)客流量的增加或者減少,這個(gè)和政府等等一系列公共交通所關(guān)注因素非常的一個(gè)重要的點(diǎn)。
另一個(gè)是我們跟互聯(lián)網(wǎng)電影渠道的廠商做一些合作,這種廠商在新片上映的時(shí)候,都對(duì)電影內(nèi)容做全國(guó)院線的布局,這個(gè)電影知道哪個(gè)電影、導(dǎo)演、信息,能不能知道在哪個(gè)地區(qū),很多的電影在東北比較受歡迎,跑到南方就一片冷門,任何一個(gè)題材有一些地域性的特征,根據(jù)這些數(shù)據(jù),我們能否預(yù)測(cè)出來(lái)不同院線的信息,通過(guò)票房信息的預(yù)測(cè),可以進(jìn)行合理票房、院線的布局排版,做一些相應(yīng)營(yíng)銷的活動(dòng)。
另一個(gè)圍繞今天的會(huì)議,大連最大的一個(gè)會(huì)議中心,在這個(gè)會(huì)議中心來(lái)講,對(duì)耗電部分就是中央空調(diào)系統(tǒng),能效比的優(yōu)化是一個(gè)恒久話題,在一個(gè)非常復(fù)雜,中央空調(diào)系統(tǒng)COP從3.5優(yōu)化到5.2,很多中央空調(diào)的設(shè)備、壓縮機(jī)等等這些設(shè)備,涉及到每一個(gè)冷卻塔要開(kāi)多大功率、開(kāi)多少個(gè)冷卻塔,每一套中央系統(tǒng)出廠之前會(huì)有一些邏輯進(jìn)行相應(yīng)的控制,不會(huì)根據(jù)當(dāng)前這個(gè)設(shè)備安裝的位置,包括現(xiàn)在客流量的內(nèi)容做一些調(diào)整,實(shí)際上可以根據(jù)一些動(dòng)態(tài)的信息,來(lái)進(jìn)行一個(gè)自主的運(yùn)維,發(fā)現(xiàn)一個(gè)最優(yōu)的參數(shù),提升能效比的運(yùn)轉(zhuǎn)。
最后一個(gè)就是從結(jié)構(gòu)化數(shù)據(jù)到半結(jié)構(gòu)化數(shù)據(jù),主要是圍繞一系列文本數(shù)據(jù)價(jià)值的挖掘,最典型的是客戶的洞察服務(wù),像電信行業(yè),我們有很多的客服的系統(tǒng),咱們?cè)诖蚍?wù)電話的時(shí)候,都會(huì)有錄音的提醒,這些錄音的數(shù)據(jù),經(jīng)過(guò)語(yǔ)音轉(zhuǎn)文本的技術(shù),轉(zhuǎn)化成文本,這些文本數(shù)據(jù)蘊(yùn)含了非常大量的信息,對(duì)于一個(gè)商品評(píng)價(jià)的信息,對(duì)商品意見(jiàn)的傾向是好還是壞,對(duì)哪一部分最感興趣,都是產(chǎn)品優(yōu)化和生產(chǎn)、設(shè)備生產(chǎn)里面重大的依據(jù),通過(guò)一系列的熱點(diǎn)發(fā)現(xiàn)一些用戶的傾向。
還有一些電信行業(yè),受互聯(lián)網(wǎng)沖擊最大就是傳統(tǒng)出版商,用戶拿到報(bào)紙之后,所有的信息都斷開(kāi)了,不知道用戶讀者對(duì)你內(nèi)容感興趣的內(nèi)容程度是哪一點(diǎn),對(duì)信息內(nèi)容的意見(jiàn)是什么樣的,這里面的例子幫助他們做了一系列的在線的爬行技術(shù),發(fā)現(xiàn)用戶一些的評(píng)論、匯總,發(fā)現(xiàn)讀者感興趣的點(diǎn),提供給編輯來(lái)對(duì)未來(lái)出版物做一些相應(yīng)的依據(jù),這個(gè)實(shí)際上是新聞客戶端,也是咱們經(jīng)常在用的,像新聞?lì)^條,它里面做了大量個(gè)性化新聞的推送,這個(gè)是央視的新聞客戶端,更多的是做里面新聞的推送,里面涉及到一系列的產(chǎn)品,包括文本分析,還有用戶的興趣偏好,根據(jù)用戶的興趣跟文本內(nèi)容的結(jié)合,來(lái)做相應(yīng)個(gè)性化文章的推送,提高相應(yīng)用戶的體驗(yàn),讓讀者更容易發(fā)現(xiàn)他們感興趣的文章內(nèi)容。
最后,通過(guò)這一系列的內(nèi)容,進(jìn)行在線的智能問(wèn)答,很多這種常見(jiàn)的問(wèn)題,可能用自動(dòng)化的方式來(lái)進(jìn)行,京東里面都有這種服務(wù)的內(nèi)容,可以進(jìn)行提問(wèn),進(jìn)行相應(yīng)的智能的問(wèn)題回答,這個(gè)客戶更多是用傳統(tǒng)的政府企業(yè),像稅務(wù)方面的一個(gè)信息,可以做一些常規(guī)的稅務(wù)信息的問(wèn)答和用戶回答。今天主要分享的就是這些內(nèi)容,大家關(guān)心更多的內(nèi)容和服務(wù),可以觀眾我們東軟先行產(chǎn)品的官方公眾號(hào)謝謝大家!