Stata是一套提供其使用者數據分析、數據管理以及繪制專業圖表的完整及整合性統計軟件。它提供許許多多功能,包含線性混合模型、均衡重復反復及多項式普羅比模式。新版本的STATA采用較具親和力的窗口接口,使用者自行建立程序時,軟件能提供具有直接命令式的語法。Stata提供完整的使用手冊,包含統計樣本建立、解釋、模型與語法、文獻等超過一千六百頁的出版品。
除了之外,Stata軟件可以透過網絡實時更新每天的更新功能,更可以得知世界各地的使用者對于STATA公司提出的問題與解決之道。使用者也可以透過StataJournal獲得許許多多的相關訊息以及書籍介紹等。另外一個獲取龐大資源的管道就是Statalist,它是一個獨立的listserver,每月交替提供使用者超過1000個訊息以及50個程序。
Stata的使用者能利用各式各樣的資源來幫助他們學習和解決任何不同難度的Stata問題。對于有關Stata的技術性問題,使用者可直接以電話,傳真,信件和E-mail的方式與StataCorpLP聯絡,或者至Stata的因特網討論區去發問或搜尋他們所需的解答。除此之外,StataCorpLP提供StataJournal,每兩個月更新且發給所有的訂閱者,里面匯集了在世界各地的使用者的寶貴心得和他們自行開發實用的Stata程序。這么完整的支持,Stata都有提供。
由于Stata在分析時是將數據全部讀入內存,在計算全部完成后才和磁盤交換數據,因此計算速度極快(一般來說,SAS的運算速度要比SPSS至少快一個數量級,而Stata的某些模塊和執行同樣功能的SAS模塊比,其速度又比SAS快將近一個數量級?。?。Stata也是采用命令行方式來操作,但使用上遠比SAS簡單。用Stata繪制的統計圖形相當精美,很有特色。
Stata軟件各版本比較
版本 | 更大變量數 | 更大自變量數 | 更大觀測值 | 是否支持64-bit | 是否支持并行計算 | 平臺 |
Stata/MP | 120,000 | 10,998 | 200億 | Yes | Yes | Windows, ? Mac, 或Unix |
Stata/SE | 32,767 | 10,998 | 21.4億 | Yes | No | Windows, ? Mac, 或Unix |
Stata/IC | 2,048 | 798 | 21.4億 | Yes | No | Windows, ? Mac, 或Unix |
適用平臺
Stata/MP支持以下操作系統:Windows 32位和64位處理器、MacOS 64位Intel處理器、Linux 32和64位處理器。
要運行Stata/MP,您可以使用具有雙核或四核處理器的個人計算機,也可以使用具有多個處理器的服務器。
計算機是否有獨立的處理器或多核處理器,這兩者沒有區別。更多的處理器或內核使Stata/MP運行得更快。
系統要求
硬件要求
Stata功能
數據管理(Datamanagement)
資料轉換、分組處理、附加檔案、ODBC、行-列轉換、數據標記、字符串函數…等。
Stata可以將分組變量轉換成指示變量(啞變量),將字符串變量映射成數字代碼。
Stata可以對數據文件進行橫向和縱向鏈接,可以將行數據轉為列數據,或反之。
Stata可以恢復、修改執行過的命令。
Stata可以利用數值函數或字符串函數產生新變量。
Stata可以從鍵盤或磁盤讀入數據。
基本統計(Basicstatistics)
直交表、相關性、t-檢定、變異數相等性檢定、比例檢定、信賴區間…等
線性模式(Linearmodels)
穩健Huber/White/sandwich變異估計,三階最小平方法、類非相關回歸、齊次多項式回歸、GLS
廣義型線性模式(Generalizedlinearmodels)
十連結函數、使用者-定義連結、ML及IRLS估計、九變異數估計、七殘差…等
二元、計數及有限應變量(Binary,count,andlimiteddependentvariables)
羅吉斯特、probit、卜松回歸、tobit、truncated回歸、條件羅吉斯特、多項式邏輯、巢狀邏輯、負二項、zero-inflated模型、Heckman選擇模式、邊際影響。
Panel數據/交叉-組合時間序列(Paneldata/cross-sectionaltime-series)
隨機及固定影響之回歸、GEE、隨機及固定-影響之卜松及負二項分配、隨機-影響、工具變量回歸、AR(1)干擾回歸無母數方法(Nonparametricmethods)
多變量方法(Multivariatemethods)
因素分析、多變量回歸、anonical相關系數
模型檢定及事后估計量支持分析(Modeltestingandpost-estimationsupport)Wald檢定、LR檢定、線性及非線性組合、非線性限制檢定、邊際影響、修正平均數Hausman檢定
群集分析(Clusteranalysis)
加權平均,質量中心及中位數聯結、kmeans、kmedians、dendrograms、停止規則、使用者擴充
圖形(Graphics)
Stata的作圖模塊,主要提供如下八種基本圖形的制作:直方圖(histogram),條形圖(bar),百分條圖(oneway),百分圓圖(pie),散點圖(twoway),散點圖矩陣(matrix),星形圖(star),分位數圖。這些圖形的巧妙應用,可以滿足絕大多數用戶的統計作圖要求。在有些非繪圖命令中,也提供了專門繪制某種圖形的功能,如在生存分析中,提供了繪制生存曲線圖,回歸分析中提供了殘差圖等。
調查方法(Surveymethods)
抽樣權重、叢集抽樣、分層、線性變異數估計量、擬-概似更大估計量、回歸、工具變量…
生存分析(Survivalanalysis)
Kaplan–Meier、Nelson–Aalen,、Cox回歸(弱性)、參數模式(弱性)、危險比例測試、時間共變項、左-右檢查、韋柏分配、指數分配…
流行病學工具(Toolsforepidemiologists)
比例標準化、病例控制、已配適病例控制、Mantel–Haenszel,藥理學、ROC分析、ICD-9-CM
時間序列(Timeseries)
ARIMA、ARCH/GARCH、VAR、Newey–West、correlograms、periodograms、白色-噪音測試,最小整數根檢定、時間序列運算、平滑化更大概似法(Maximumlikelihood)
轉換及常態檢定(Transformsandnormalitytests)
Box–Cox、次方轉換Shapiro–Wilk、Shapiro–Francia檢定
其它統計方法(Otherstatisticalmethods)
樣本數量及次方、非線性回歸、逐步式回歸、統計及數學函數
包含樣本范例(Samplesession)
再抽樣及模擬方法(Resamplingandsimulationmethods)
bootstrapping、jackknife、蒙地卡羅模擬、排列檢定