選擇讓你的數據說話的統計包
在過去的幾年中,在生物科學中使用統計測試的需求呈指數級增長,統計軟件的發展也是如此。現在,每個人都在基礎研究中使用某種統計數據是很常見的。在熟練的生物統計學家中,R是最流行的數據分析軟件但並非所有數據都需要如此先進的計算才能得出結論。
為了幫助您決定哪種軟件最適合用於您的數據,我編製了一個統計軟件包列表,對於統計測試領域的初學者來說,這些軟件包可能會派上用場。
Excel
測試:如果你需要簡單的描述性統計(如計算平均值和標準差)或基本的推理分析(假設檢驗,比較兩個或多個組)Excel能做得很好。要在Excel中執行統計測試,您可以使用數據分析插件(隻需從選項中安裝它),或者進入公式選項卡,在更多函數下,您將找到用於大量參數測試和其他簡單分析的公式。但是如果你的數據不符合高斯分布,要小心-非參數測試都不包含在Excel中。
可用性:它隨微軟Office軟件包一起提供,所以很容易獲得。
技能需求:如果你用過Excel做任何計算,幾乎沒有。它隻需要理解統計測試,因為它將指導您選擇數據數組和其他需求。
個人的建議:如果需要快速進行簡單的統計,可以使用它。通常情況下,您的數據已經導出到excel電子表格中,這使得進行一些快速假設測試或確定數據的分散性變得很容易。
IBM SPSS統計
它的名字來源於社會科學統計包,這是它最初開發的領域。它的用途現在廣泛得多,通常用於生物醫學研究領域。在IBM購買了SPSS軟件之後,它被正式命名IBM SPSS統計.
測試:SPSS配備了您在常規生命科學研究中需要的大多數統計測試。它包括描述性統計,參數和非參數檢驗,各種回歸方法,和相關分析。此外,生物標誌物發現領域的一個很好的特征是ROC曲線分析。
如果您需要更複雜的模式分析,SPSS提供了良好的多變量分析方法(因子分析、聚類分析、判別分析)以及決策樹算法(方便那些為診斷目的創建分類器的人)。
可用性:它是IBM的一個產品,在他們的許可下可用。據我所知,沒有可用的演示版本,這意味著你必須購買。
技能需求:界麵相當友好。它使用下拉菜單,通過它的大部分功能都是可用的。您還可以使用命令語法語言對其進行編程(當然,這是針對高級用戶的),從而支持更多的選項。但是,除非您正在尋找複雜的數據模式和連接,否則它不需要任何編碼,並且我認為它易於使用。
個人的建議:SPSS幾乎適用於所有類型的統計測試。我將它用於廣泛的數據分析,如果數據是非正態分布的,則用於初步分析。
R
“R”是著名的統計編程開源包。它最初是在1990年作為S編程語言的一種形式開發的,並一直在發展。因此,它現在有一個快速增長的用戶和開發人員社區,新版本不斷發布。R對於使用和開發包都是免費的,這種可塑性是它受歡迎的主要原因。
測試:有了R,你可以在地球上做任何可以想象到的統計測試。R包一直在設計中,一旦完成,用戶就可以使用。你可以用R來表示像a這樣簡單的東西學生t檢驗,和先進的CHAID決策樹算法.
可用性:這是一個開源軟件,您還可以免費下載R中的各種軟件包。不同的圖形用戶界麵也是免費的。
技能需求:這裏有一個關於R的問題——它是一種編程語言!唯一能利用它的方法就是學習如何用R編寫代碼對於大多數生命科學家來說,這聽起來並不有趣(除非你想專攻生物統計學,在這種情況下,你已經知道如何使用R,並且純粹出於拖延而閱讀這篇文章)。另一方麵,Web提供了大量的教程,解釋如何在R中執行各種測試(包括那些在Bitesize Bio!188bet手机版APP),也有許多在線課程可供學習這門語言,以及一個穩定的R社區。
個人的建議:要我說,這是目前最好的統計數據。它提供了最新開發的算法和測試,允許大量操作,而且是免費的!如果你需要比Excel更複雜的東西,而且沒有SPSS等授權程序,R是下一個最好的選擇(它是免費的,有豐富的教程)。然而,我不建議在時間是一個限製因素的情況下,因為學習編碼是一個相當耗時的過程。
SPSS Modeler
在過去被稱為克萊門汀,SPSS Modeler是一款功能強大的統計軟件,主要麵向銷售行業的用戶。然而,它提供的豐富功能和相對簡單的圖形界麵使它非常適用於生命科學研究。
測試:這是一款用於數據挖掘和數據建模的複雜軟件,顧名思義。它幾乎和r一樣裝備精良,這基本上意味著您可以找到軟件發布日期之前所有可以想象到的測試,但它主要麵向高級統計分析。如果你想從你的數據建立預測模型,它是完美的,它包含了大量的預測算法。它對決策也很有幫助(這在銷售分析和生物醫學研究中都是必要的)。
可用性:SPSS Modeler是授權的,它並不是最便宜的軟件。沒有演示版本。
技能需求:SPSS Modeler使用起來比SPSS Statistics更加複雜。它有一個獨特的用戶界麵,其中包括執行分析所需遵循的協議。然而,它不需要任何編碼來執行最頂級的分析。隻需要幾個教程,就可以讓Modeler用數據創造奇跡,這真的讓您感到敬畏。
個人的建議:如果您隻有基本的統計知識,但想嚐試對數據執行複雜的測試,這是很好的。Modeler可以為您決定哪個測試將從您的數據中得出最佳結論。它就像非編碼用戶的R。
如果你像我一樣,喜歡色彩豐富的總結,下麵是一個包含文章要點的表格:
統計軟件 |
測試 |
可用性 |
技術水平 |
推薦給 |
Excel |
描述性的,參數 |
微軟Office自帶 |
低,幾分鍾就能學會 |
快速參數分析 |
SPSS |
描述性的,參數的和非參數的,多元的 |
在IBM許可下 |
中等,需要幾個小時才能學會 |
廣泛的統計分析,更簡單的建模 |
SPSS Modeler |
描述,參數和非參數,數據挖掘和預測 |
在IBM許可下 |
高,需要上幾堂課才能學會 |
快速複合體分析 |
R |
人類所知的一切 |
開源 |
非常高,需要幾天或幾個月的學習(取決於你學習的速度) |
廣泛的複雜分析 |
最後,當你在尋找理想的軟件時,從回答這個問題開始——你希望你的數據告訴你什麼?然後您將知道使用什麼測試,這將帶您使用支持這種分析的軟件。
1評論
留下評論
你一定是登錄發表評論。
文章內容豐富,謝謝。