本文由中國科學軟件網整理
IBM SPSS Statistics統計分析應用軟件介紹
利用數據分析解決嚴峻的業務和研究挑戰
IBMSPSS Statistics 是集成的系列產品,有助于應對整個分析流程,從規劃和數據收集到分析、報告和部署。提供數十種完全集成的模塊供您選擇,您可以找到增加收入、超越競爭對手和改善決策所需的專業化的功能。
IBM SPSS Statistics各模塊介紹
IBM SPSS Advanced Statistics
功能強大的建模技術,用于分析復雜的關系
IBM SPSS Advanced Statistics 提供單變量和多變量的建模技術,幫助用戶在處理描述復雜關系的數據時,得到最準確的結論。通過頻繁應用這些成熟的分析技術,可以從各學科(例如,醫學研究、制造、制藥和市場研究)使用的數據中獲得更深入的洞察力。
SPSS Advanced Statistics 提供以下功能:
一般線性模型 (GLM)和混合模型程序。
廣義線性模型 (GENLIN),包括廣泛使用的統計模型,例如針對正態分布數據的線性回歸、針對二元數據的邏輯模型,以及針對計數數據的對數線性模型。
線性混合模型(也稱為分層線性模型,HLM)擴展了 GLM 程序中使用的一般線性模型,使您能夠分析具有相關性和非恒定可變性(non-constant variability)的數據。
廣義估算方程 (GEE) 程序擴展了廣義線性模型,適用于關聯的縱向數據和聚類數據。
廣義線性混合模型 (GLMM),用于分層數據和各種結果,包括序數值。
生存分析程序,用于檢驗生存期數據或持續時間數據。
線性混合模型的估算平均值
GLMM 提供估算的邊際均值,用于說明預測變量的影響。
廣義線性混合模型的模型摘要
GLMM 模型摘要展示了模型與數據的擬合程度。
廣義線性混合模型可視化
GLMM 提供了模型的可視表示,您可以直觀看到每個預測因素的強弱。在本示例中,promo 變量對銷售影響最大。
IBM SPSS Bootstrapping
創建更可靠的模型并生成更準確的結果
IBM SPSS Bootstrapping 是一種確保分析模型可靠且能生成準確結果的有效方式。它可用于測試整個 SPSS Statistics 產品家族中分析模型和程序的穩定性,包括描述性統計信息、平均值、交叉表、相關、回歸等。
SPSS Bootstrapping 支持您:
通過對原始樣本的替代項進行重抽樣,快速輕松地估算抽樣分布特征。
為數據集合創建數以千計的可替換版本,以更準確地了解哪些數據最有可能存在于總體中。
減少離群值和異常值的影響,幫助確保模型的穩定性和可靠性。
估算總體參數的標準誤和置信度區間,這些總體參數包括平均值、中值、比值、優勢率、相關系數、回歸系數等。
描述性表格
描述性表格提供了描述性的統計信息,以及這些統計信息的 bootstrap 置信區間。平均值的 bootstrap 置信區間 (86.39, 105.20) 與參數化的置信區間 (86.42, 105.30) 類似,表示“典型”員工大約具有 7 到 9 年的工作經驗。但是,工作經驗(月)呈偏態分布,因此平均值不能夠很理想地代表當前的“典型”工資,這里使用中值會稍好一些。
IBM SPSS Categories
預測結果,揭示分類數據中的關系
IBM SPSS Categories 方便地直觀呈現和探索數據中的關系,并根據您的發現預測結果。您可以使用先進的技術(例如,預測分析、統計學習、感知圖和首選項縮放),了解消費者心目中認為與您的產品或品牌相關性最高的特征有哪些,并了解消費者對于您的產品與其他產品之間關聯的認知。
SPSS Categories 包含先進的分析技術,用于幫助您:
更完整更輕松地分析和解釋多變量數據及這些數據之間的關系。
通過對分類數據執行額外的統計操作,將定性變量轉變為定量變量。
無論您調研的是何種類別類型,包括消費群、醫療診斷、政治黨派或生物物種,都能以圖形化方式顯示底層關系。
IBM SPSS Complex Samples
分析復雜樣本的統計數據并解釋調查結果
IBM SPSS Complex Samples 幫助市場研究人員、民意調查人員和社會學家通過將樣本設計整合到其調研分析中,提供更有效的統計推論。 SPSS Complex Samples 為您提供實施復雜樣本設計(例如,分層抽樣、整群抽樣或多階段抽樣)所需的專門規劃工具和統計信息。
將樣本設計整合到調研分析中,以獲得更準確的結果。
保留調查規劃參數供將來使用,從而加快分析速度,提高效率。
管理復雜的調查數據以開展徹底的詳細分析。
使用直觀的界面和實用的向導,更快速地分析數據和解釋調研結果。
分析規劃向導
要分析樣本數據,請使用由“分析規劃向導(Analysis Plan Wizard)”創建的分析設計,作為“復雜樣本描述性統計數據(Complex Sample Descriptives)”或“復雜樣本制表(Complex Sample Tabulate)”的輸入。
通用線性模型
構建線性回歸和方差分析模型,預測考慮樣本設計的情況下的數字結果。該程序在估算方差時將樣本設計考慮在內,抽樣方法包括等概率抽樣方法、PPS 抽樣方法以及 WR 與 WOR 抽樣方法。
參數估算
參數估算顯示每個預測變量對所花費金額造成的影響。截距項的值 518.249 說明,雜貨連鎖店可以預測,使用報紙以及有針對性的郵寄廣告上優惠券的家庭平均花費為 518.25 美元。參數估算有助于量化每個模型項的影響,但是估算的邊界均值表格也能輕松解釋模型結果。
抽樣規劃向導
指定抽樣框架以創建復雜樣本設計,該設計由復雜樣本附加模塊中的伴隨程序所使用。要對個例進行抽樣,請使用由抽樣規劃向導所創建的樣本設計,作為復雜樣本選擇程序的輸入。
IBM SPSS Conjoint
了解和衡量購買決策
IBM SPSS Conjoint 幫助市場研究人員增加對消費者喜好的了解,以便更有效地設計、定價和營銷成功產品。它支持研究人員對消費者決策過程進行建模,以便設計出包含對目標市場最重要的功能和屬性的產品。
SPSS Conjoint 可幫助研究人員:
使用設計生成器 ORTHOPLAN設計產品屬性組合的正交陣列。
制作并打印卡片供調研受訪者對備選產品進行挑選、排序或評級。
使用結合分析(conjoint analysis,一種專門定制的回歸版本)分析研究數據。
正交設計
正交設計的輸出結果是每個剖面(profile)具有對應的一行,而各種因素顯示為列。腳注可使實驗人員(而非其他測試參與者)了解哪些個例(如果有)為保留個例。
結果表
該表指出,在使用三個不同選擇概率模型的情況下,選擇每個模擬個案作為首選的預測概率。
模擬個案
聯合分析的真正威力在于,能夠對未經主體評級的產品概要信息預測首選項。這些即所說的模擬個案。模擬個案、來自正交設計的概要信息(profile)以及檢驗用的概要信息(profile)都包含在計劃中。
實用程序評分
該表顯示了實用程序(效用值)評分及其每個因子級別的標準誤。實用程序值越高,表示首選項越好。
IBM SPSS Custom Tables
分析數據并在更短的時間內創建定制表
使用 IBM SPSS Custom Tables 能輕松針對不同受眾以不同樣式總結 IBM SPSS Statistics 數據。它結合了多種分析功能,您可以構建人們非常容易閱讀和明白的表,幫助您從數據中了解更多信息。
該軟件對于那些定期創建和更新報告的用戶很實用,尤其是那些從事調查或市場研究、社會科學、數據庫或直銷、院校研究工作的人。
SPSS Custom Tables 幫助您:
執行深入的分析,以便更好地了解自己的數據并為決策者提供改進的報告。
在構建表時進行預覽,確保在更短時間內創建精煉、準確的報告。
定制表的布局和外觀,以清晰準確地表達結果。
通過提供人們無需進一步處理即可作為行動依據的信息,保證結果的易用性。
拖放式表構建方法
SPSS Custom Tables 直觀的圖形用戶界面使您不再需要靠猜測來構建表。其拖放功能和預覽窗格使您可在單擊“確定”之前,對表格的內容和外觀進行檢查。
圖形用戶界面
直觀的界面可幫助您輕松構建復雜的表,包括嵌套和堆積表。
可定制的表格式
SPSS Custom Tables 提供一系列選項,幫助您控制表格的外觀,包括添加標題和文字說明、指定列寬以及排列和隱藏類別的功能。
多個匯總統計
將各種統計信息添加至各個表單元格(從針對分類變量的簡單計數到離差測定),并按照使用的任何匯總統計信息對類別進行排序。
IBM SPSS Data Preparation
改進數據準備過程,生成更準確的結果
IBM SPSS Data Preparation 執行先進技術,以簡化分析過程的數據準備階段,從而更快速、更準確地提供數據分析結果。分析人員可以從完全自動化的數據準備過程中進行選擇,從而最快地獲得結果,或者從其他幾種方法中進行選擇來準備更具有挑戰性的數據集。
利用該軟件,您可以輕松發現可疑或無效的個例、變量和數據值。驗證數據工具幫助您發現活動數據集中可疑和無效的個例、變量及數據值。
SPSS Data Preparation 有助于:
自動執行數據準備過程- 消除復雜且耗時的人工數據準備工作。
無需人工檢查即可驗證數據- 更快速更準確地執行數據驗證。
防止異常值破壞分析- 自動檢測可能影響結果的異常情況。
自動數據準備
自動數據準備幫助用戶通過自動執行冗長且重復的任務,為分析準備數據。這可提高分析速度、預測能力和可信度,幫助用戶將可能在原始狀態下被排除的數據包含在內。
驗證數據
驗證數據工具幫助您發現活動數據集中可疑和無效的案例、變量及數據值。例如,為客戶提供月度客戶滿意度報告的數據分析人員,可使用該功能檢查不完整的客戶標識、范圍之外的變量值和經常錯誤輸入的變量值組合。
異常檢測原因匯總
該表匯總了每個變量作為主要原因的作用。此表匯總變量影響的統計信息,包括針對每個變量報告的最小影響、最大影響和平均影響,以及作為多個個例原因的變量的標準偏差。
驗證數據個例報告
該個例報告顯示了違反多變量規則的個例,以及違反單變量規則的個例。這些個例都需要進行報告,作為數據輸入以進行糾正。
IBM SPSS Decision Trees
輕松標識群組并預測成果
IBM SPSS Decision Trees 幫助您更好地標識群組,發現各個群組之間的關系,并預測未來事件。該模塊包含可視化程度非常高的分類和決策樹,支持您以直觀方式提供分類結果,以便更清晰地向非技術受眾解釋分類分析。它包含四種 tree-growing 算法,您可以嘗試不同的類型并發現最適合自己數據的算法。
該模塊提供專門的樹構建技術,用于在 IBM SPSS Statistics 環境內進行分類。四種 tree-growing 算法分別是:
CHAID- 一種快速、統計型的多向樹算法,用于快速高效地探索數據,并針對期望的結果構建分段和概要信息。
窮舉式 CHAID- CHAID 的一種變體,用于檢查每個預測項所有可能的分支。
分類和回歸樹 (C&RT)- 一個完整的二叉樹算法,用于對數據進行分區,并生成準確的同構子集。
QUEST- 一種統計算法,可快速高效地選擇不包含偏差的變量,并構建準確的二叉樹。
打開對話框
使用“決策”樹對話框,選擇要測量的因變量和自變量以及選擇樹生長方法。
CHAID 方法
樹形圖是樹模型的圖形表示。該樹形圖顯示,使用 CHAID 方法時,收入級別是信用評級的最佳預測變量。
風險和分類表
風險和分類表可以快速評估用于按信用等級對客戶分類的模型的有效性。
基于樹的分類模型
“決策”樹過程用于創建基于樹的分類模型。它將個例分類成群組,或根據自變量(預測變量)來預測因變量(目標)的值。
SPSS Direct Marketing
輕松識別合適的客戶,改進營銷活動結果
IBM SPSS Direct Marketing 幫助您更深入地了解客戶,改進營銷活動,最大程度實現市場營銷預算的投資回報 (ROI)。該軟件提供針對您客戶或聯系人的復雜分析 - 使您的結果具有極高的可信度。SPSS Direct Marketing 使用功能強大的分析、直觀的界面和“記分向導”幫助簡化數據記分。運行分析后,輸出的重要性已不言而喻。
SPSS Direct Marketing 支持數據庫工作人員和直銷人員:
針對各個客戶群開發市場營銷戰略。
確定哪些客戶有可能響應特定的促銷報價。通過僅向可能響應的客戶發送郵件,推動收入增長并降低成本。
比較直郵營銷活動的效果,并按郵政編碼標識對營銷活動的響應。
連接至 Salesforce.com來抽取客戶信息、收集商機詳細信息并執行分析。
從各種分析選項中進行選擇,包含 RFM 分析(recency, frequency and monetary value) - 最近購買時間,購買頻率和總購買金額)、集群分析、潛在客戶概要分析、郵政編碼分析、傾向性記分和控制包測試。
預防垃圾郵件投訴,方法是監控發送至每個客戶組的電子郵件的頻率。
IBM SPSS Exact Tests
準確分析小型數據集或包含偶發事件的數據集
IBM SPSS Exact Tests 支持您使用小型樣本,但仍能夠保持結果的可信度。如果您具有少量案例變量,其中某個類別響應百分比較高,或者必須將數據分為多個細目,那么傳統測試可能不正確。SPSS Exact Tests 可以消除這種風險。
利用 SPSS Exact Tests,您可以:
隨時運行測試,只需單擊按鈕即可。
從 30 余項精確測試中進行選擇,這些測試涵蓋從非參數數據到分類數據的整個數據范圍,包括小型或大型數據集、偶發事件表和關聯性測量。
將數據詳細分割為細目。不存在要求每個單元格中預期數據計數達到五個或更多才能獲得正確結果的限制。
在大型數據集中搜索偶發事件。
保留原始設計或自然分類(例如,區域、收入或年齡組)并按您的意圖進行分析。
IBM SPSS Forecasting
無需技能即可構建復雜的時間序列預測
IBM SPSS Forecasting 使分析人員能夠快速輕松地預測趨勢和制定預測,而無需具備專業的統計技能。不太熟悉預測的人員即可創建考慮多個變量的復雜預測,而經驗豐富的預測人員可以使用 SPSS Forecasting 來驗證其模型。時間序列預測示例包括預測每天呼叫中心所需員工數量或者預測特定產品或服務的需求。SPSS Forecasting 可為您的每一個步驟提供幫助,使您可以更快速地獲得所需信息。
SPSS Forecasting 可提供各種功能,例如:
指導性分析,通過模型構建過程為經驗欠缺的用戶提供支持。
更多選擇和定制選項,使經驗豐富的分析人員可以控制預測流程。
強大的時間序列建模過程,幫助您快速開發可靠的預測。
節省時間功能,允許您以快速可靠的方式創建和更新預測。
靈活的輸出選項,簡化向組織決策制定者提供易于理解的實用信息的過程。
時間因果關系模型
此圖顯示了與時間因果關系模型系統中的前 10 個模型(最匹配的模型)關聯的因果關系。監控關鍵績效指標并跟蹤各種可控指標(稱為杠桿)數據的企業希望確定杠桿與 KPI 之間的因果關系,以便了解哪些杠桿影響哪些 KPI。該公司還希望了解在各 KPI 之間是否存在因果關系。
IBM SPSS Missing Values
估算缺失數據時構建更好的模型
IBM SPSS Missing Values 軟件供調查研究人員、社會學家、數據挖掘人員和市場研究人員等用于驗證數據。該軟件支持您檢驗數據來發現缺失數據模式,然后使用統計算法估算摘要統計并對缺失值進行歸因。
利用 SPSS Missing Values 軟件,您可以對缺失數據進行歸因,得出更有效的結論并消除隱藏的偏差。
使用診斷報告快速診斷缺失數據歸因問題。
使用多個歸因模型將缺失數據值替換為估算值。
顯示和分析模式以獲取洞察并改善數據管理。
IBM SPSS Neural Networks
發現數據中更復雜的關系
IBM SPSS Neural Networks 軟件提供非線性數據建模程序,使您能夠發現數據中更為復雜的關系。您可以使用該軟件設置網絡學習的條件。您可以控制培訓停止規則和網絡體系結構,或者讓程序自動為您選擇體系結構。
利用 SPSS Neural Networks 軟件,您可以開發更準確且更有效的預測模型。
使用“多層感知器 (Multilayer Perceptron, MLP)”或“徑向基函數網絡 (Radial Basis Function, RBF)”程序,挖掘數據中的隱藏關系。
通過指定變量,從始至終控制過程。
結合其他統計程序或技術以獲取更深入的洞察。
多層感知器程序 (MLP)
多層感知器程序根據預測變量的值,針對一個或多個因(目標)變量產生預測模型。在本例中,我們通過構建模型來預測顧客流失率。
IBM SPSS Regression
利用高級回歸過程提高預測的準確性
IBM SPSS Regression 軟件使您能夠預測分類結果,并應用各種非線性回歸過程。您可以將這些過程應用于某些業務和分析項目,在這些項目中,普通回歸技術受限或者不適用,例如,研究消費者購買習慣、對治療進行響應或者分析信貸風險。
利用 SPSS Regression 軟件,您可以擴展 IBM SPSS Statistics Base 的能力,將其用于分析過程中的數據分析階段。
使用多項式邏輯回歸 (MLR),針對兩個以上的類別預測分類結果。
使用二元邏輯回歸,輕松將數據分類到各組。
使用非線性回歸 (NLR) 和受限非線性回歸 (CNLR)估算非線性模型的參數。
使用加權最小二乘法和二階段最小平方法滿足統計假定。
使用概率分析估算刺激值。
IBM SPSS Statistics Base
統計分析必不可少的工具
IBM® SPSS® Statistics Base 是一款統計分析軟件,提供執行全程分析所需的核心功能。它易于使用,包含范圍廣泛的過程和技術,能幫助您增加收入,超越競爭對手,開展研究并制定更好的決策。
SPSS Statistics Base 為分析過程的每一步都提供了必要的統計分析工具。
范圍全面的統計過程,用于執行準確的分析。
內置的技術用于快速方便地準備分析數據。
復雜的報告功能,以高效地創建圖表。
強大的可視化功能,清晰顯示您發現的重要性。
支持所有數據類型,包括超大型數據集。
登錄頁面
重新設計了登錄頁面,使用戶能夠快速輕松地找到所需的 SPSS Statistics 功能。