隨著(zhù)大數據時(shí)代的來(lái)臨,大數據分析也應運而生。大數據作為時(shí)下最火熱的IT行業(yè)的詞匯,其爆炸式增長(cháng)在大容量、多樣性和高增速方面,全面考驗著(zhù)現代企業(yè)的數據處理和分析能力;同時(shí),也為企業(yè)帶來(lái)了獲取更豐富、更深入和更準確地洞察市場(chǎng)行為的大量機會(huì )。對企業(yè)而言,能夠從大數據中獲得全新價(jià)值的消息是令人振奮的。
然而,大數據時(shí)代是到來(lái),那么大數據意味著(zhù)什么,它到底會(huì )改變什么?如何從大數據中發(fā)掘出“真金白銀”則是一個(gè)現實(shí)的挑戰。僅僅從技術(shù)角度回答,已不足以解惑。如果來(lái)個(gè)必須,大數據只是賓語(yǔ),那么離開(kāi)了人這個(gè)主語(yǔ),它再大也沒(méi)有意義。所以我們需要把大數據放在人的背景中加以透視,理解它作為時(shí)代變革的力量。
作為通用的一種分析手段,我們不妨把這個(gè)主語(yǔ)化成“涂料行業(yè)”,分析大數據對涂料行業(yè)的影響,解讀為何大數據分析能為涂料行業(yè)帶來(lái)時(shí)代變革的力量。
涂料大數據應用案例
數據時(shí)代下 涂料行業(yè)的大數據分析
之一:油水之爭
近兩年,涂料行業(yè)討論最激烈的問(wèn)題就是水性漆將代替油性漆的時(shí)代已經(jīng)到來(lái)了。涂料行業(yè)發(fā)展到今天已經(jīng)算得上是成熟的行業(yè),傳統的油性涂料和現代創(chuàng )新性的水性涂料,究竟誰(shuí)的優(yōu)勢強,亦或者有界別于兩者的一種特殊涂料的存在,符合人們的時(shí)代發(fā)展需求。大數據分析的優(yōu)勢是可以通過(guò)收集起來(lái)的數據,預測未來(lái)涂料行業(yè)發(fā)展的大趨勢,通過(guò)這些預測,涂料企業(yè)便可以進(jìn)行有效的改革創(chuàng )新。
之二:電商領(lǐng)域的涂料企業(yè)
越來(lái)越多的涂料企業(yè)開(kāi)始涉足大數據平臺,利用大數據精準的分析能力,和海量的信息庫,對市場(chǎng)的需求方向進(jìn)行整體把握。對于涉足電商領(lǐng)域的涂料企業(yè)而言,大數據存在的意義是,它能通過(guò)網(wǎng)絡(luò )平臺反映的顧客“大數據”信息,使互聯(lián)網(wǎng)企業(yè)可以更加準確地對用戶(hù)進(jìn)行行為分析、需求挖掘。通過(guò)大數據提供分析,涂料企業(yè)便會(huì )對關(guān)注度高的產(chǎn)品進(jìn)一步加大推廣投入。借鑒服裝行業(yè)"打爆款"的策略思路,將一個(gè)單品做出一個(gè)成規模的量級,這對于企業(yè)來(lái)說(shuō)將是極大的利好。
之三:涂料企業(yè)的品牌宣傳
作為社會(huì )上一個(gè)不較為人所了解的領(lǐng)域,涂料行業(yè)一直都是在“摸著(zhù)國外的石頭過(guò)河”,其中,國外的石頭就是指立邦、多樂(lè )士、威士伯等國際著(zhù)名涂料品牌。在中國,由于相關(guān)媒體或機構對涂料行業(yè)的關(guān)注度一直都不高,所有,涂料行業(yè)很多數據價(jià)值一直都被人們所忽視,消失在歷史的輪轉中。過(guò)去,涂料企業(yè)對數據的認知也局限于一些宏觀(guān)數據,例如年產(chǎn)量、年增長(cháng)率、月產(chǎn)量等宏觀(guān)信息,對消費者的認知一般只是通過(guò)線(xiàn)下調查問(wèn)卷的方式來(lái)攝取。
知識普及:
大數據分析的五階段:
1.Sample:抽取一些代表性的樣本數據集(通常為訓練集、驗證集和測試集)。樣本容量的選擇標準為:包含足夠的重要信息,同時(shí)也要便于分析操作。該步驟涉及的處理工具為:數據導入、合并、粘貼、過(guò)濾以及統計抽樣方法。
2.Explore:通過(guò)考察關(guān)聯(lián)性、趨勢性以及異常值的方式來(lái)探索數據,增進(jìn)對于數據的認識。該步驟涉及的工具為:統計報告、視圖探索、變量選擇以及變量聚類(lèi)等方法。
3.Modify:以模型選擇為目標,通過(guò)創(chuàng )建、選擇以及轉換變量的方式來(lái)修改數據集。該步驟涉及工具為:變量轉換、缺失處理、重新編碼以及數據分箱等。
4.Model:為了獲得可靠的預測結果,我們需要借助于分析工具來(lái)訓練統計模型或者機器學(xué)習模型。該步驟涉及技術(shù)為:線(xiàn)性及邏輯回歸、決策樹(shù)、神經(jīng)網(wǎng)絡(luò )、偏最小二乘法、LARS及LASSO、K近鄰法以及其他用戶(hù)(包括非SAS用戶(hù))的模型算法。
5.Assess:評估數據挖掘結果的有效性和可靠性。涉及技術(shù)為:比較模型及計算新的擬合統計量、臨界分析、決策支持、報告生成、評分代碼管理等。數據挖掘者可能不會(huì )使用全部SEMMA分析步驟。然而,在獲得滿(mǎn)意結果之前,可能需要多次重復其中部分或者全部步驟。
|