探索性數(shù)據(jù)分析(EDA),你會(huì)使用嗎?
有人在發(fā)現(xiàn)這些特征后會(huì)迸出一些新的想法:通用電氣、??松梨诙际敲绹?guó)的企業(yè),中國(guó)企業(yè)的表現(xiàn)又如何的呢?我們可以在使用“泡泡圖”的同時(shí),在JMP中調(diào)用“數(shù)據(jù)篩選”功能就可以得到類似圖三的界面。
本文引用地址:http://www.ex-cimer.com/article/113459.htm從中可以清晰地觀察到,自2004年以來的7年間,共有392個(gè)次的中國(guó)企業(yè)登上了福布斯排行榜。雖然在數(shù)量上、市值、銷售額等經(jīng)營(yíng)指標(biāo)上與世界頂級(jí)企業(yè)有一定差距,但以中石油Petro China、中石化Sinopec China Petroleum等位代表的一批國(guó)有大型企業(yè)發(fā)展速度很快,令世界矚目。
圖二 JMP軟件中動(dòng)態(tài)泡泡圖與數(shù)據(jù)篩選的配合使用
實(shí)際上,探索性數(shù)據(jù)分析還遠(yuǎn)遠(yuǎn)不止這些。分析人士完全可以在數(shù)據(jù)分析的初期不受太多理論條件的束縛,充分展開想象的翅膀,多角度、多層面地對(duì)現(xiàn)有數(shù)據(jù)的規(guī)律進(jìn)行可視化的探索,新的線索往往就會(huì)自然而然地出現(xiàn)了,為下一步的統(tǒng)計(jì)建模與預(yù)測(cè)等精細(xì)化分析奠定良好的基礎(chǔ)。
總之,探索性數(shù)據(jù)分析強(qiáng)調(diào)靈活地探求線索和證據(jù),重在發(fā)現(xiàn)數(shù)據(jù)中可能隱藏著的有價(jià)值的信息,比如數(shù)據(jù)的分布模式、變化趨勢(shì),可能的交互影響,異常變化等等,而傳統(tǒng)的統(tǒng)計(jì)方法則側(cè)重于評(píng)估已經(jīng)發(fā)現(xiàn)的證據(jù),通常要求分析人員具備一定的統(tǒng)計(jì)學(xué)基礎(chǔ)。根據(jù)不同的業(yè)務(wù)目的和數(shù)據(jù)資源選用不同的技術(shù),或者綜合使用這兩類技術(shù),將會(huì)使我們更快地獲得更多的發(fā)現(xiàn)。對(duì)于大都不具備統(tǒng)計(jì)學(xué)功底但數(shù)據(jù)分析任務(wù)卻越來越多的企業(yè)人員(如市場(chǎng)分析人員、質(zhì)量管理人員等)來說,重視、學(xué)習(xí)并用好探索性數(shù)據(jù)分析往往能事半功倍。
評(píng)論