如今,大數據日益成為研究行業的重要研究目標。面對其高數據量、多維度與異構化的特點,以及分析方法思路的擴展,傳統統計工具已經難以應對。眾多新的統計軟件工具的出現成為了深入大數據洞察研究的重要助力。下面是幾款比較常用的統計分析工具。
一、SPSS
SPSS(Statistical Product and Service Solutions)是全球領先的統計分析與數據挖掘產品。成立于1968年,是世界上應用非常廣泛的專業統計和數據模型軟件之一。2009年IBM全資收購了SPSS公司,正式更名為“IBM SPSS”。SPSS Statistics是一款統計分析軟件,它使您能夠更快速、更深入地挖掘數據,這使其成為比電子表格、數據庫或標準多維工具更高效的分析工具,SPSS Statistics擅長理解復雜的模式和關聯數據;使用戶能夠得出結論并進行預測。它能夠快速處理數據操作和統計程序等任務,需要的時間僅為許多非統計程序的三分之一。
SPSS突出的特點就是操作界面極為友好,輸出結果美觀漂亮。它將幾乎所有的功能都以統一、規范的界面展現出來,使用Windows的窗口方式展示各種管理和分析數據方法的功能,對話框展示出各種功能選擇項。用戶只要掌握一定的Windows操作技能,精通統計分析原理,就可以使用該軟件為特定的科研工作服務。SPSS采用類似EXCEL表格的方式輸入與管理數據,數據接口較為通用,能方便的從其他數據庫中讀入數據。其統計過程包括了常用的、較為成熟的統計過程,完全可以滿足非統計專業人士的工作需要。SPSS針對初學者、熟練者及精通者都比較適用。并且現在很多群體只需要適當的練習,就能夠掌握簡單的操作分析,因此SPSS特別受非統計專業數據分析人員的青睞。
迄今SPSS軟件已有30余年的成長歷史,全球約有25萬家產品用戶,它們分布在通訊、醫療、銀行、證券、保險、制造、商業、市場研究、科研教育等多個領域和行業,是世界上應用極為廣泛的專業統計軟件。
二、Stata
Stata是一套提供其使用者數據分析、數據管理以及繪制專業圖表的完整及整合性統計軟件。它提供許許多多功能,包含線性混合模型、均衡重復反復及多項式普羅比模式。用Stata繪制的統計圖形相當精美。
統計功能
Stata的統計功能很強,除了傳統的統計分析方法外,還收集了近20年發展起來的新方法,如Cox比例風險回歸,指數與Weibull回歸,多類結果與有序結果的logistic回歸,Poisson回歸,負二項回歸及廣義負二項回歸,隨機效應模型等。
作圖功能
Stata的作圖模塊,主要提供如下八種基本圖形的制作:直方圖(histogram),條形圖(bar),百分條圖(oneway),百分圓圖(pie),散點圖(two way),散點圖矩陣(matrix),星形圖(star),分位數圖。這些圖形的巧妙應用,可以滿足絕大多數用戶的統計作圖要求。在有些非繪圖命令中,也提供了專門繪制某些圖形的功能,如在生存分析中,提供了繪制生存曲線圖,回歸分析中提供了殘差圖等。
矩陣運算功能
矩陣代數是多元統計分析的重要工具,Stata提供了多元統計分析中所需的矩陣基本運算,如矩陣的加、積、逆、Cholesky分解、Kronecker內積等;還提供了一些高級運算,如特征根、特征向量、奇異值分解等;在執行完某些統計分析命令后,還提供了一些系統矩陣,如估計系數向量、估計系數的協方差矩陣等。
三、Minitab
Minitab軟件是現代質量管理軟件的領先者,全球六西格瑪實施的共同語言,以無可比擬的強大功能和簡易的可視化操作深受廣大質量學者和統計專家的青睞。Minitab 1972年成立于美國的賓夕法尼亞州州立大學(Pennsylvania State University),到目前為止,已經在全球100多個國家,4800多所高校被廣泛使用。
Minitab功能菜單包括:基礎和高級統計工具:
假設檢驗(參數檢驗和非參數檢驗)
回歸分析(一元回歸和多元回歸、線性回歸和非線性回歸)
方差分析(單因子、多因子、一般線性模型等)
時間序列分析
圖表(散點圖、點圖、矩陣圖、直方圖、莖葉圖、箱線圖、概率圖、概率分布圖、邊際圖、矩陣圖、單值圖、餅圖、區間圖、Pareto、Fishbone、運行圖等)
蒙特卡羅模擬和仿真
分布分析
靈活的數據導入、導出和實時監控
SPC(Statistical Process Control—統計過程控制)
DOE(全因子、部分因子設計、響應曲面設計、田口設計、混料設計等)
MSA(交叉、嵌套、量具運行圖、類型I量具研究等)
可靠性分析(分布擬合、檢驗計劃、加速壽命測試等)
多變量分析
功效樣本量
強大的宏語言
Minitab軟件是為質量改善、教育和研究應用領域提供統計和服務的先導。是全球領先的質量管理和六西格瑪實施軟件工具,更是持續質量改進的良好工具軟件。