【環球旅訊】(特約評論員 李洋)當(dang)下最流行(xing)的技術詞(ci)匯可(ke)以概括(kuo)為“云物移大(da)(da)(da)智(zhi)”,即云計算、物聯網、移動互聯網、大(da)(da)(da)數據和智(zhi)慧(hui)城市。“大(da)(da)(da)數據”在其(qi)中占據著重要(yao)的地(di)位,民航業是(shi)旅(lv)游行(xing)業中信息(xi)化(hua)水平比(bi)較高的,大(da)(da)(da)數據的應用(yong)更是(shi)首當(dang)其(qi)沖。如何(he)用(yong)好大(da)(da)(da)數據,是(shi)民航運輸(shu)鏈條(tiao)上每個企業必須要(yao)回(hui)答的問題。
一、數據的生命周期

大數(shu)(shu)據(ju)首先是(shi)數(shu)(shu)據(ju),既然是(shi)數(shu)(shu)據(ju),那(nei)么從數(shu)(shu)據(ju)產生那(nei)一刻起,數(shu)(shu)據(ju)就有其(qi)生命周期。
數(shu)(shu)據(ju)(ju)(ju)根據(ju)(ju)(ju)其屬性不(bu)(bu)同,實時價(jia)(jia)(jia)值耗(hao)散(san)曲(qu)線也不(bu)(bu)相同。如上圖所(suo)示,金融(rong)交易類(lei)的(de)數(shu)(shu)據(ju)(ju)(ju),其價(jia)(jia)(jia)值以毫秒計(ji)算,如股(gu)(gu)指(zhi)(zhi)期貨(huo)的(de)指(zhi)(zhi)數(shu)(shu)數(shu)(shu)據(ju)(ju)(ju),其價(jia)(jia)(jia)值瞬(shun)間就耗(hao)散(san),幾分鐘之前的(de)股(gu)(gu)指(zhi)(zhi)數(shu)(shu)據(ju)(ju)(ju)幾乎沒有任何價(jia)(jia)(jia)值。航班的(de)庫存(cun)(剩(sheng)余座位)信息,隨著機票銷售的(de)進行,剩(sheng)余數(shu)(shu)量(liang)在不(bu)(bu)斷變化中,可能(neng)20秒之前的(de)剩(sheng)余座位數(shu)(shu)據(ju)(ju)(ju)對現在已經不(bu)(bu)具備(bei)參考意義(yi)。天(tian)氣預報(bao)、實時路況和機票價(jia)(jia)(jia)格數(shu)(shu)據(ju)(ju)(ju),其有效(xiao)時間可能(neng)會稍(shao)長一(yi)些(xie),以小時計(ji)算。2、3個(ge)小時之前的(de)路況擁堵信息,已經不(bu)(bu)能(neng)作(zuo)為人們(men)出行的(de)參考依據(ju)(ju)(ju)了。還有一(yi)些(xie)數(shu)(shu)據(ju)(ju)(ju)有效(xiao)性可能(neng)會更長一(yi)些(xie),比(bi)如商品房的(de)售價(jia)(jia)(jia),汽車的(de)零售價(jia)(jia)(jia),商家報(bao)給消費者的(de)價(jia)(jia)(jia)格,有效(xiao)期會是(shi)幾天(tian)的(de)時間。
很多數據(ju)(ju)(ju)首(shou)先是(shi)快數據(ju)(ju)(ju),其次才是(shi)大數據(ju)(ju)(ju)。那么就需(xu)要正(zheng)確認(ren)識數據(ju)(ju)(ju)的(de)(de)(de)生命周期,充(chong)分(fen)利用數據(ju)(ju)(ju)的(de)(de)(de)實時價值,比如(ru)機票(piao)(piao)的(de)(de)(de)價格數據(ju)(ju)(ju),需(xu)要根(gen)據(ju)(ju)(ju)庫(ku)存情況(kuang)進行(xing)以(yi)小時為(wei)單位的(de)(de)(de)動(dong)態調整。航班(ban)起飛后,這(zhe)架(jia)航班(ban)上的(de)(de)(de)機票(piao)(piao)銷售數據(ju)(ju)(ju)就成(cheng)為(wei)歷(li)史數據(ju)(ju)(ju),實時價值喪失,這(zhe)時候可以(yi)作為(wei)大數據(ju)(ju)(ju)的(de)(de)(de)一部分(fen),成(cheng)為(wei)未來機票(piao)(piao)價格制定的(de)(de)(de)參考(kao)依據(ju)(ju)(ju)。
二、快數據與大數據的互補

《大數(shu)(shu)據(ju)時代(dai)》幾乎(hu)是(shi)大數(shu)(shu)據(ju)的(de)(de)(de)(de)起航(hang)(hang)號角,毫(hao)無疑問(wen)的(de)(de)(de)(de)成(cheng)為暢銷書,可以說在大數(shu)(shu)據(ju)行(xing)業幾乎(hu)人手必備。在《大數(shu)(shu)據(ju)時代(dai)》開篇列舉大數(shu)(shu)據(ju)的(de)(de)(de)(de)第一個案例就是(shi)Farecast的(de)(de)(de)(de)故事。美國(guo)著名的(de)(de)(de)(de)計算機(ji)(ji)專家(jia)發現航(hang)(hang)空(kong)公司機(ji)(ji)票(piao)價格(ge)(ge)制定比較混亂,不(bu)(bu)是(shi)越(yue)早買(mai)越(yue)便宜(yi)。于(yu)(yu)是(shi)就收(shou)集互聯網上廣泛存在的(de)(de)(de)(de)與機(ji)(ji)票(piao)價格(ge)(ge)有關(guan)的(de)(de)(de)(de)數(shu)(shu)據(ju),在多達12000個價格(ge)(ge)樣本的(de)(de)(de)(de)基礎(chu)上,預測(ce)未來40天機(ji)(ji)票(piao)價格(ge)(ge)可能走勢。然后通過不(bu)(bu)斷調優,票(piao)價預測(ce)的(de)(de)(de)(de)準確度已經高達75%。作者通過這個例子想(xiang)說明,大數(shu)(shu)據(ju)強調對于(yu)(yu)大量數(shu)(shu)據(ju)的(de)(de)(de)(de)處理,從而得出事物(wu)的(de)(de)(de)(de)相關(guan)性(機(ji)(ji)票(piao)價格(ge)(ge)的(de)(de)(de)(de)走勢),而不(bu)(bu)是(shi)因果性(機(ji)(ji)票(piao)價格(ge)(ge)為什么降低)。
但(dan)現實(shi)(shi)是(shi),作者關于(yu)Farecast的(de)(de)故事只(zhi)講了(le)一半。Farecast于(yu)2009年(nian)(nian)被微軟Bing搜索(suo)以(yi)1.15億美(mei)元(yuan)收(shou)購,整(zheng)合為Bing Travel的(de)(de)一個功能(neng)。在(zai)(zai)2014年(nian)(nian)4月,Bing宣布關閉Farecast的(de)(de)機票(piao)(piao)價格預測(ce)功能(neng)。在(zai)(zai)大(da)數(shu)據(ju)(ju)(ju)存儲能(neng)力(li)和處理(li)能(neng)力(li)越來(lai)越強大(da)的(de)(de)今天,為什么Farecast反而(er)停止(zhi)運行(xing)(xing)了(le)呢?原因不是(shi)Farecast出(chu)了(le)問題,而(er)是(shi)航(hang)空(kong)公(gong)(gong)司(si)(si)對于(yu)自身(shen)數(shu)據(ju)(ju)(ju)的(de)(de)充分利用(yong),讓Farecast的(de)(de)預測(ce)變得(de)沒有意(yi)義。歐(ou)美(mei)全服務航(hang)空(kong)公(gong)(gong)司(si)(si)過去(qu)普遍應用(yong)收(shou)益(yi)管理(li)系統(Revenue Management System)來(lai)制(zhi)定銷售(shou)(shou)策(ce)略,但(dan)由于(yu)收(shou)益(yi)管理(li)系統的(de)(de)數(shu)據(ju)(ju)(ju)輸入都是(shi)歷(li)史數(shu)據(ju)(ju)(ju),然后依靠數(shu)學算法進(jin)行(xing)(xing)模擬及預測(ce),給(gei)出(chu)待(dai)售(shou)(shou)航(hang)班的(de)(de)銷售(shou)(shou)策(ce)略。由于(yu)多種原因,收(shou)益(yi)管理(li)系統一直都是(shi)離線(xian)處理(li),航(hang)空(kong)公(gong)(gong)司(si)(si)很少根(gen)據(ju)(ju)(ju)實(shi)(shi)時(shi)銷售(shou)(shou)數(shu)據(ju)(ju)(ju)進(jin)行(xing)(xing)動態調(diao)整(zheng)。隨著IT技術(shu)的(de)(de)進(jin)步,航(hang)空(kong)公(gong)(gong)司(si)(si)不僅可以(yi)根(gen)據(ju)(ju)(ju)實(shi)(shi)時(shi)銷售(shou)(shou)情況進(jin)行(xing)(xing)調(diao)整(zheng),而(er)且還會綜合分析(xi)已經購票(piao)(piao)乘(cheng)客的(de)(de)行(xing)(xing)程,向旅(lv)客推薦復雜行(xing)(xing)程的(de)(de)購買(mai)建議(在(zai)(zai)哪里(li)轉機比較優惠)。
航空公(gong)司不(bu)(bu)(bu)僅(jin)根據(ju)(ju)歷史數(shu)據(ju)(ju)進行(xing)收(shou)益管理,同(tong)時利用(yong)快數(shu)據(ju)(ju)進行(xing)動態調優,使得自身(shen)的價格策略滿足了(le)不(bu)(bu)(bu)同(tong)層次(ci)和不(bu)(bu)(bu)同(tong)類型(xing)的消費者的需要。所以(yi)作(zuo)為單個出行(xing)的旅客,使用(yong)Farecast進行(xing)機票價格預測其意(yi)義(yi)已(yi)經不(bu)(bu)(bu)大了(le)。這可能是Farecast功能關閉的主要原因(yin),也是快數(shu)據(ju)(ju)與大數(shu)據(ju)(ju)互(hu)補的結(jie)果。
三、大數據關鍵詞:跨界、后驗、預測
大數(shu)據(ju)(ju)首先強調(diao)跨界。對(dui)于(yu)民(min)航(hang)業(ye)來說,就(jiu)是(shi)(shi)不僅僅拘泥于(yu)自(zi)身運行(xing)產生(sheng)的(de)(de)(de)(de)數(shu)據(ju)(ju),而(er)(er)是(shi)(shi)要(yao)多(duo)方合作(zuo),獲取不同行(xing)業(ye)的(de)(de)(de)(de)數(shu)據(ju)(ju)進行(xing)相互(hu)補充和相互(hu)印證。比如(ru),2014年11月是(shi)(shi)傳(chuan)統意(yi)義(yi)上航(hang)空淡季,但由(you)于(yu)北京(jing)舉(ju)辦APEC會(hui)議而(er)(er)意(yi)外獲得一(yi)個假期(qi)。這在任(ren)何收(shou)益(yi)管理系統中(zhong)都是(shi)(shi)無(wu)法(fa)根據(ju)(ju)歷(li)史(shi)經驗進行(xing)預測的(de)(de)(de)(de),如(ru)果是(shi)(shi)大數(shu)據(ju)(ju)模式,則可以通過對(dui)網絡新聞的(de)(de)(de)(de)輿情監控(kong)獲知這一(yi)新聞熱點,同時根據(ju)(ju)北京(jing)市民(min)通過搜索引擎對(dui)于(yu)旅游目(mu)的(de)(de)(de)(de)地的(de)(de)(de)(de)瀏(liu)覽信息(xi)增多(duo),尋找出熱點旅游城市,進行(xing)有(you)針對(dui)性的(de)(de)(de)(de)航(hang)班編排,提高(gao)主(zhu)要(yao)目(mu)的(de)(de)(de)(de)地機票售(shou)價。這樣不僅滿足了人們的(de)(de)(de)(de)假期(qi)出行(xing)需要(yao),而(er)(er)且還能獲得良好(hao)的(de)(de)(de)(de)收(shou)益(yi)。
其次(ci)大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)往往體(ti)現出后驗(yan)效(xiao)應。由于(yu)(yu)大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)獲取的(de)是多個領域產生的(de)歷史數(shu)(shu)(shu)據(ju)(ju)(ju),對于(yu)(yu)歷史數(shu)(shu)(shu)據(ju)(ju)(ju)的(de)整理與分析(xi),可(ke)(ke)(ke)以(yi)驗(yan)證各種情(qing)(qing)況發生因素。例如,對一個知名(ming)景區來說(shuo),可(ke)(ke)(ke)以(yi)根(gen)據(ju)(ju)(ju)移動運營商的(de)服(fu)務(wu)的(de)手機(ji)數(shu)(shu)(shu)量,結合景區監控(kong)視頻自動分析(xi),門(men)票售賣情(qing)(qing)況,以(yi)及周邊道路擁(yong)(yong)堵情(qing)(qing)況等(deng)(deng)多種信息,將這(zhe)些信息綜合為大(da)數(shu)(shu)(shu)據(ju)(ju)(ju)樣本,結合景區高峰時段接待人數(shu)(shu)(shu)和參(can)觀體(ti)驗(yan),可(ke)(ke)(ke)以(yi)梳(shu)理出一個模型(xing),當景區承載量達到多少(shao)的(de)時候,旅游(you)體(ti)驗(yan)開始下降,當周邊的(de)道路擁(yong)(yong)堵距(ju)離(li)多長的(de)時候,景區就(jiu)要(yao)采(cai)取預備的(de)限流(liu)措(cuo)施(shi)等(deng)(deng)等(deng)(deng)。這(zhe)些都是根(gen)據(ju)(ju)(ju)多方數(shu)(shu)(shu)據(ju)(ju)(ju)進行后驗(yan)分析(xi)的(de)結果。

最(zui)后,大(da)數據(ju)最(zui)重要的(de)(de)功能(neng)就是(shi)預測。如上(shang)圖所示,對于乘(cheng)(cheng)機(ji)旅客行為(wei)(wei)的(de)(de)分(fen)析,可以(yi)看出國內旅客乘(cheng)(cheng)機(ji)人數增長(chang)較(jiao)快,同時乘(cheng)(cheng)機(ji)頻次(ci)在(zai)(zai)下降,平均(jun)飛(fei)行距離(li)在(zai)(zai)上(shang)升。這(zhe)就說明,我國居(ju)民乘(cheng)(cheng)飛(fei)機(ji)出行越來越向普通人群擴(kuo)散,根(gen)據(ju)年(nian)齡(ling)分(fen)布可以(yi)看出,商務(wu)(wu)旅客以(yi)男(nan)性(xing)(xing)(xing)(xing)為(wei)(wei)主(zhu),而年(nian)輕(qing)女(nv)性(xing)(xing)(xing)(xing)的(de)(de)乘(cheng)(cheng)機(ji)出行比(bi)例高(gao)于同年(nian)齡(ling)段男(nan)性(xing)(xing)(xing)(xing)。如果航空公司結(jie)合(he)跨界的(de)(de)一(yi)些社(she)區(qu)數據(ju)(如女(nv)性(xing)(xing)(xing)(xing)購物交(jiao)(jiao)流社(she)區(qu)、驢友交(jiao)(jiao)流社(she)區(qu)),就可以(yi)針對家庭(ting)中(zhong)主(zhu)要負責旅游(you)決策的(de)(de)女(nv)性(xing)(xing)(xing)(xing)設計實用的(de)(de)組合(he)產品,針對年(nian)輕(qing)時尚的(de)(de)女(nv)性(xing)(xing)(xing)(xing)設計個性(xing)(xing)(xing)(xing)化的(de)(de)旅游(you)套餐(can),針對商務(wu)(wu)旅客的(de)(de)男(nan)性(xing)(xing)(xing)(xing)推廣便捷租車等商務(wu)(wu)綜合(he)服(fu)務(wu)(wu)。
四、大數據思維與大數據應用

用戶需要(yao)(yao)的(de)是五毫(hao)米的(de)鉆孔,但(dan)很不(bu)幸(xing)他需要(yao)(yao)購買一個電鉆。在大(da)數據(ju)領(ling)域,航空公司面對的(de)要(yao)(yao)么是大(da)數據(ju)概念的(de)宣(xuan)貫(guan),要(yao)(yao)么是大(da)數據(ju)的(de)技(ji)術(shu)講解(jie),如Hadoop、NoSQL。而(er)筆者理解(jie)真正的(de)大(da)數據(ju)服務模式,就類(lei)似(si)于民航的(de)飛(fei)機(ji)(ji),造飛(fei)機(ji)(ji)的(de)廠(chang)商是少數,他們真正掌握(wo)飛(fei)機(ji)(ji)的(de)設計原理和(he)技(ji)術(shu)細節,開飛(fei)機(ji)(ji)的(de)飛(fei)行員掌握(wo)駕馭(yu)飛(fei)機(ji)(ji)的(de)技(ji)術(shu),而(er)乘(cheng)客則只(zhi)要(yao)(yao)知道坐飛(fei)機(ji)(ji)可(ke)以(yi)快速(su)安全(quan)便(bian)捷的(de)到達目的(de)地就可(ke)以(yi)了。
未來真正掌握大(da)(da)數(shu)據(ju)技術的(de)(de)是少數(shu)的(de)(de)企業,它們(men)提供大(da)(da)數(shu)據(ju)的(de)(de)基礎設施,應(ying)用大(da)(da)數(shu)據(ju)的(de)(de)企業,不需(xu)要自建成本(ben)高(gao)昂(ang)的(de)(de)大(da)(da)數(shu)據(ju)儲存(cun)和處理(li)能力。作為(wei)航空公司,要想用好(hao)大(da)(da)數(shu)據(ju),既不是著急去(qu)(qu)學習大(da)(da)數(shu)據(ju)的(de)(de)Hadoop技術,也不是去(qu)(qu)購置大(da)(da)數(shu)據(ju)硬件,而是要普(pu)及大(da)(da)數(shu)據(ju)思維,掌握大(da)(da)數(shu)據(ju)應(ying)用的(de)(de)本(ben)領。
所謂大數(shu)(shu)據(ju)(ju)思維,就是要(yao)(yao)認識到不同屬(shu)性(xing)數(shu)(shu)據(ju)(ju)的(de)價(jia)值(zhi),將數(shu)(shu)據(ju)(ju)的(de)實(shi)(shi)時價(jia)值(zhi)用足(zu)用好,當數(shu)(shu)據(ju)(ju)實(shi)(shi)時價(jia)值(zhi)降低的(de)時候,作為(wei)歷史數(shu)(shu)據(ju)(ju)就可以成為(wei)大數(shu)(shu)據(ju)(ju)的(de)重要(yao)(yao)數(shu)(shu)據(ju)(ju)源(yuan)。不拘泥于本企業,本行(xing)業產生的(de)數(shu)(shu)據(ju)(ju),而是要(yao)(yao)圍繞著旅(lv)客,從旅(lv)客在其他領域活躍的(de)數(shu)(shu)據(ju)(ju)信(xin)息來判斷(duan)旅(lv)游群體的(de)特征,從而更好的(de)為(wei)旅(lv)客服務。
掌(zhang)握大數(shu)(shu)(shu)據(ju)應(ying)用(yong),就(jiu)是把(ba)握好(hao)大數(shu)(shu)(shu)據(ju)投(tou)資的火候。不是盲目去投(tou)資大數(shu)(shu)(shu)據(ju)基礎設施,而是緊(jin)跟行業發展(zhan)的趨勢,掌(zhang)握大數(shu)(shu)(shu)據(ju)應(ying)用(yong)的本領(ling),為(wei)企業更好(hao)地應(ying)用(yong)數(shu)(shu)(shu)據(ju)服務。
我(wo)們處在信息的(de)(de)時代,數(shu)(shu)據(ju)的(de)(de)時代,不能(neng)因為(wei)(wei)害(hai)怕落后被時代淘汰,就焦慮和盲從(cong);也要避免盲目的(de)(de)投資(zi)的(de)(de)沖動,為(wei)(wei)了大(da)數(shu)(shu)據(ju)而(er)大(da)數(shu)(shu)據(ju),從(cong)而(er)浪(lang)費企業寶貴的(de)(de)資(zi)源。大(da)數(shu)(shu)據(ju)時代一定會到來,航空公司正(zheng)確(que)理解數(shu)(shu)據(ju),聚焦數(shu)(shu)據(ju),才是(shi)迎接大(da)數(shu)(shu)據(ju)“風口(kou)”的(de)(de)“正(zheng)確(que)姿(zi)勢”。
評論
未登錄