spss實習(xí)心得三篇
SPSS,全稱是Statistical Product and Service Solutions,即“統(tǒng)計產(chǎn)品與服務(wù)解決方案”軟件,是IBM公司推出的一系列用于統(tǒng)計學(xué)分析運算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù)的總稱。下面是學(xué)習(xí)啦小編為大家收集整理的spss實習(xí)心得,歡迎大家閱讀。
spss實習(xí)心得篇1
本科的時候有概率統(tǒng)計和數(shù)理分析的基礎(chǔ),但是從來沒有接觸過應(yīng)用統(tǒng)計分析的東西,SPSS也只是聽說過,從來沒有學(xué)過。一直以為這一塊兒會比較難,這學(xué)期最初學(xué)的時候,因為沒有認真看老師給的英文教材,課下也沒有認真搜集相關(guān)資料,所以學(xué)起來有些吃力,總感覺聽起來一頭霧水。老師說最后的考核是通過提交學(xué)習(xí)報告,然后我從圖書館里借了些教材查了些資料,發(fā)現(xiàn)很多問題都弄清楚了。結(jié)合軟件和書上的例子,實戰(zhàn)一下,發(fā)現(xiàn)SPSS的功能相當(dāng)強大。最后總結(jié)出這篇報告,以鞏固所學(xué)。
SPSS,全稱是Statistical Product and Service Solutions,即“統(tǒng)計產(chǎn)品與服務(wù)解決方案”軟件,是IBM公司推出的一系列用于統(tǒng)計學(xué)分析運算、數(shù)據(jù)挖掘、預(yù)測分析和決策支持任務(wù)的軟件產(chǎn)品及相關(guān)服務(wù)的總稱,也是世界上公認的三大數(shù)據(jù)分析軟件之一。SPSS具有統(tǒng)計分析功能強大、操作界面友好、與其他軟件交互性好等特點,被廣泛應(yīng)用于經(jīng)濟管理、醫(yī)療衛(wèi)生、自然科學(xué)等各個領(lǐng)域。具體到管理方面,SPSS也是一個進行數(shù)據(jù)分析和預(yù)測的強大工具。這門課中也會用到AMOS軟件。
關(guān)于SPSS的書,很多都是首先介紹軟件的。這個軟件易于安裝,我裝的是19.0的,雖然20.0有一些改變和優(yōu)化,但是主體都是一樣的,而且都是可視化界面,用起來很方面且容易上手。所以,我學(xué)習(xí)的重點是卡方檢驗和T檢驗、方差分析、相關(guān)分析、回歸分析、因子分析、結(jié)構(gòu)方程模型等方法的適用范圍、應(yīng)用價值、計算方式、結(jié)果的解釋和表述。
首先是T檢驗這一部分。由于參數(shù)檢驗的基礎(chǔ)不牢固,這部分也是最初開始接觸應(yīng)用統(tǒng)計的東西,學(xué)起來很多東西拿不準,比如說原假設(shè)默認的是什么。結(jié)果出來后依然分不清楚是接受原假設(shè)還是拒絕原假設(shè)。不過現(xiàn)在弄懂了。這部分很有用的是T檢驗。T檢驗應(yīng)用于當(dāng)樣本數(shù)較小時,且樣本取自正態(tài)總體同時做兩樣本均數(shù)比較時,還要求兩樣本的總體方差相等時,已知一個總體均數(shù)u,可得到一個樣本均數(shù)及該樣本標準差,樣本來自正態(tài)或近似正態(tài)總體。T檢驗分為單樣本T檢驗、獨立樣本T檢驗、配對樣本T檢驗。其中,單樣本T 檢驗是樣本均數(shù)與總體均數(shù)的比較的T檢驗,用于推斷樣本所代表的未知總體
均數(shù)μ與已知的總體均數(shù)uo有無差別;獨立樣本T檢驗主要用于檢驗兩個樣本是否來自具有相同均值的總體,即比較兩個樣本的均值是否相同,要求兩個樣本是相互獨立的;配對樣本T檢驗中,要正確理解“配對”的含義,主要用于檢驗兩個有聯(lián)系的正態(tài)總體的均值是否有顯著差異,跟獨立檢驗的區(qū)別就是樣本是否是配對樣本。這幾個方法用軟件操作起來都是相對簡單的,關(guān)鍵是分清楚什么時候用這個什么時候用那個。
然后是方差分析。方差分析就是將索要處理的觀測值作為一個整體,按照變異的不同來源把觀測值總變異的平方和以及自由度分解為兩個或多個部分,獲得不同變異來源的均值與誤差均方,通過比較不同變異來源的均方與誤差均方,判斷各樣本所屬總體方差是否相等。方差分析主要包括單因素方差分析、多因素方差分析和協(xié)方差分析等。這一部分在學(xué)習(xí)的過程中出現(xiàn)一些問題,就是用SPSS來操作的時候分不清觀測變量和控制變量,如果反了的話會導(dǎo)致結(jié)果的不準確。其次,對Bonferroni、Tukey、Scheffe等方法的使用目的不清楚,現(xiàn)在基本掌握了多重比較方法選擇:一般如果存在明確的對照組,要進行的是驗證性研究,即計劃好的某兩個或幾個組間(和對照組)的比較。宜用Bonferroni(LSD)法;若需要進行多個均數(shù)間的兩兩比較,且各組個案數(shù)相等,適宜用Tukey法;其他情況宜用Scheffe法。最后,對方差齊性檢驗、多重比較檢驗、趨勢檢驗理解不夠透徹,在方差檢驗中,Post Hoc鍵有LSD的選項:當(dāng)方差分析F檢驗否定了原假設(shè),即認為至少有兩個總體的均值存在顯著性差異時,須進一步確定是哪兩個或哪幾個均值顯著地不同,則需要進行多重比較來檢驗。LSD即是一種多因變量的三個或三個以上水平下均值之間進行的兩兩比較檢驗。
相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。相關(guān)分析研究現(xiàn)象之間是否相關(guān)、相關(guān)的方向和密切程度,一般不區(qū)別自變量或因變量。主要有雙變量相關(guān)分析、偏相關(guān)、距離相關(guān)幾個方法。雙變量相關(guān)分析是相關(guān)分析中最常使用的分析過程,主要用于分析兩個變量之間的線性相關(guān)分析,可以根據(jù)不同的數(shù)據(jù)類型和條件,選用Pearson積差相關(guān)、Spearman等級相關(guān)和Kendall的tau-b等級相關(guān)。當(dāng)數(shù)據(jù)文件包括多個變量時,
直接對兩個變量進行相關(guān)分析往往不能真實反映二者之間的關(guān)系,此時就需要用到偏相關(guān)分析,從中剔除其他變量的線性影響。距離相關(guān)分析是對觀測變量之間差異度或相似程度進行的測量,其中距離需要弄清楚,距離分析是對觀測量之間相似或不相似程度的一種測度,是計算一對觀測量之間的廣義距離。這些相似性或距離測度可以用于其他分析過程,例如因子分析、聚類分析或多維定標分析,有助于分析復(fù)雜的數(shù)據(jù)集。
接著是回歸分析。相關(guān)分析研究的是現(xiàn)象之間是否相關(guān)、相關(guān)的方向和密切程度,一般不區(qū)別自變量或因變量。而回歸分析則要分析現(xiàn)象之間相關(guān)的具體形式,確定其因果關(guān)系,并用數(shù)學(xué)模型來表現(xiàn)其具體關(guān)系。比如說,從相關(guān)分析中我們可以得知“質(zhì)量”和“用戶滿意度”變量密切相關(guān),但是這兩個變量之間到底是哪個變量受哪個變量的影響,影響程度如何,則需要通過回歸分析方法來確定?;貧w分析的目的在于了解兩個或多個變量間是否相關(guān)、相關(guān)方向與強度,并建立數(shù)學(xué)模型以便觀察特定變量來預(yù)測研究者感興趣的變量。運用十分廣泛,回歸分析按照涉及的自變量的多少,可分為一元回歸分析和多元回歸分析;按照自變量和因變量之間的關(guān)系類型,可分為線性回歸分析和非線性回歸分析。如果在回歸分析中,只包括一個自變量和一個因變量,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析。應(yīng)用回歸分析時應(yīng)首先確定變量之間是否存在相關(guān)關(guān)系,如果變量之間不存在相關(guān)關(guān)系,對這些變量應(yīng)用回歸預(yù)測法就會得出錯誤的結(jié)果。正確應(yīng)用回歸分析預(yù)測時應(yīng)注意:①用定性分析判斷現(xiàn)象之間的依存關(guān)系;②避免回歸預(yù)測的任意外推;③應(yīng)用合適的數(shù)據(jù)資料;
接下來是因子分析。因子分析是指研究從變量群中提取共性因子的統(tǒng)計技術(shù)。最早由英國心理學(xué)家C.E.斯皮爾曼提出。他發(fā)現(xiàn)學(xué)生的各科成績之間存在著一定的相關(guān)性,一科成績好的學(xué)生,往往其他各科成績也比較好,從而推想是否存在某些潛在的共性因子,或稱某些一般智力條件影響著學(xué)生的學(xué)習(xí)成績。因子分析可在許多變量中找出隱藏的具有代表性的因子。將相同本質(zhì)的變量歸入一個因子,可減少變量的數(shù)目,還可檢驗變量間關(guān)系的假設(shè)。因子分析的主要目的是用來描述隱藏在一組測量到的變量中的一些更基本的,但又無法直接
測量到的隱性變量。從顯性的變量中得到因子的方法有兩類。一類是探索性因子分析,另一類是驗證性因子分析。探索性因子分析不事先假定因子與測度項之間的關(guān)系,而讓數(shù)據(jù)“自己說話”。而驗證性因子分析假定因子與測度項的關(guān)系是部分知道的,即哪個測度項對應(yīng)于哪個因子,雖然我們尚且不知道具體的系數(shù)。這一部分不能用SPSS來操作,要用AMOS,用起來也很方便。
最后一部分學(xué)習(xí)的是結(jié)構(gòu)方程模型。結(jié)構(gòu)方程模型是一種融合了因素分析和路徑分析的多元統(tǒng)計技術(shù)。它的強勢在于對多變量間交互關(guān)系的定量研究。在近三十年內(nèi),其大量應(yīng)用于社會科學(xué)及行為科學(xué)的領(lǐng)域里,并在近幾年開始逐漸應(yīng)用于市場研究中。結(jié)構(gòu)方程模型是對顧客滿意度的研究采用的模型方法之一。其目的在于探索事物間的因果關(guān)系,并將這種關(guān)系用因果模型、路徑圖等形式加以表述。結(jié)構(gòu)方程模型與傳統(tǒng)的回歸分析不同,結(jié)構(gòu)方程分析能同時處理多個因變量,并可比較及評價不同的理論模型。與傳統(tǒng)的探索性因子分析不同,在結(jié)構(gòu)方程模型中,我們可以提出一個特定的因子結(jié)構(gòu),并檢驗它是否吻合數(shù)據(jù)。通過結(jié)構(gòu)方程多組分析,我們可以了解不同組別內(nèi)各變量的關(guān)系是否保持不變,各因子的均值是否有顯著差異。
這門課要學(xué)習(xí)完了,整個學(xué)習(xí)的過程是充滿曲折和挑戰(zhàn)的,我見證了自己從一無所知到困惑迷茫再到略懂再到會用的過程。甚至學(xué)完之后有些問題還沒有徹底搞清楚,自己接下來還會不斷的探索的。SPSS是個很神奇的工具,結(jié)合AMOS和EXCEL更是如虎添翼,相信學(xué)習(xí)了SPSS在以后的論文和數(shù)據(jù)分析中很有用。這門課給我的感覺是看起來很難,但是實際學(xué)起來就好很多,因為當(dāng)我結(jié)合具體實例和軟件的時候,很多抽象的問題就豁然開朗了。但是想給老師一個建議,這門課需要很強的統(tǒng)計和概率論的基礎(chǔ),要不然就會很難聽懂或者聽得半懂。然后這門課的很多方法的相關(guān)資料都是用在醫(yī)療衛(wèi)生、自然科學(xué)領(lǐng)域的,在管理中的應(yīng)用的資料不怎么多。老師希望我們上課的時候結(jié)合在管理中的應(yīng)用來學(xué)習(xí),但是資料有限,希望老師在這個方面多給學(xué)生一些引導(dǎo)。
spss實習(xí)心得篇2
學(xué)習(xí)SPSS在教育統(tǒng)計中的應(yīng)用心得體會
一、什么是SPSS?為什么要學(xué)習(xí)SPSS?
新學(xué)期開始時,在信息化教育測量與評價的課程中第一次接觸
到SPSS這個軟件,作為本科是計算機專業(yè)出身的我,當(dāng)時只知道SPSS是一套統(tǒng)計軟件,就是一套根據(jù)統(tǒng)計學(xué)原理所編寫出來的統(tǒng)計分析軟件,至于統(tǒng)計什么?分
析什么?我一無所知,尤其是看到老師推薦的《SPSS在教育統(tǒng)計中的應(yīng)用》這本書的時候,就簡單的把它理解為用SPSS軟件來統(tǒng)計、分析與教育相關(guān)的數(shù)據(jù),最終得出想要的結(jié)論而已,而現(xiàn)在看來,我當(dāng)初的想法未免有點簡單與無知。下面就來讓我們了解一下SPSS。SPSS軟件是一組專業(yè)的、通用的統(tǒng)計軟件包,同時它也是一個組合式軟件包,兼有數(shù)據(jù)管理、統(tǒng)計分析、統(tǒng)計繪圖和統(tǒng)計報表功能。它廣泛用于教育、心理、醫(yī)學(xué)、市場、人口、保險等研究領(lǐng)域,也用于產(chǎn)品質(zhì)量控制、人事檔案管理和日常統(tǒng)計報表等。SPSS軟件對計算機硬件系統(tǒng)的要求較低;對運行的軟件環(huán)境要求寬松,有各種版本可運行在WINDOWS XP、WIN7系統(tǒng)環(huán)境下, SPSS統(tǒng)計軟件采用電子表格的方式輸入與管理數(shù)據(jù),能方便地從其他數(shù)據(jù)庫中讀入數(shù)據(jù)(如Dbase,Excel,Lotus等)。
我為什么要學(xué)習(xí)SPSS呢?其實很簡單,一方面,做為一名
研究生,要具備一定的科研能力,如今量化研究的方法大行其道,一切要以事實說話、要以數(shù)據(jù)說話,有了數(shù)據(jù)支持的研究才能更容易被認可、被推論。另一方面,根據(jù)對AECT94定義的理解,教育技術(shù)
學(xué)研究的對象是學(xué)習(xí)過程和學(xué)習(xí)資源,包含大量的偶然現(xiàn)象和非精確現(xiàn)象。因此,要深入研究教育技術(shù)現(xiàn)象及其規(guī)律,必須運用統(tǒng)計描述、統(tǒng)計分析方法和模糊數(shù)學(xué)分析方法,才可能使這門學(xué)科達到真正完善的地步。教育技術(shù)學(xué)研究的現(xiàn)象多數(shù)是偶然的現(xiàn)象,其變化發(fā)展往往具有幾種不同的可能性,究竟出現(xiàn)哪一種結(jié)果,那是帶有偶然性的,是隨機的。這類偶然現(xiàn)象是遵循統(tǒng)計規(guī)律的,當(dāng)隨機現(xiàn)象是由大量的成份組成,或者隨機現(xiàn)象出現(xiàn)大量的次數(shù)時,就能體現(xiàn)統(tǒng)計平均規(guī)律。我們只有對數(shù)據(jù)資料作統(tǒng)計處理,才可能可以發(fā)現(xiàn)它們的內(nèi)在規(guī)律,掌握現(xiàn)象的特征,檢驗研究的假設(shè),才能得出準確的、可靠的研究結(jié)果。
二、對本SPSS各章節(jié)學(xué)習(xí)的心得
新課程老師帶領(lǐng)下,采取一種新的學(xué)習(xí)方式,老師講解了基礎(chǔ)部分后,全班同學(xué)采取小組分工、協(xié)作學(xué)習(xí),然后對全班同學(xué)進行講解學(xué)習(xí)內(nèi)容,教師進行當(dāng)堂指導(dǎo),這種方法改變了同學(xué)們的學(xué)習(xí)態(tài)度,同學(xué)們不再是課前不預(yù)習(xí),課下不復(fù)習(xí)的狀態(tài),每組都有自己的任務(wù),課前有一定的壓力,同學(xué)間的討論也明顯的增多,例如:一次課下同學(xué)們在一起吃飯,有幾位同學(xué)還在調(diào)侃說“兩個菜之間用SPSS進行分析后得出的結(jié)果不接受H0假設(shè),也就是兩個菜之間不相關(guān)”,雖然這只是一個課下的玩笑,但是這也可以體現(xiàn)出對學(xué)習(xí)的態(tài)度的轉(zhuǎn)變。下面就本學(xué)期的所學(xué)SPSS的各章節(jié)做一下歸納,這些歸納也是基于本人平時在課前預(yù)習(xí),課上及課后的一些所思所想,也許會有一些理解上的偏頗在內(nèi),但這僅限于心得而已。本學(xué)期學(xué)習(xí)各個章節(jié)
及分工如下表:
章節(jié)名稱
1.SPSS的認識
及數(shù)據(jù)文件的
處理
2.數(shù)據(jù)清理與
基本統(tǒng)計及測
量質(zhì)量分析
3.T檢驗
4.方差分析
1、 2人 3人 7.聚類分析 8.統(tǒng)計圖形 2人 1人 2人 6.卡方檢驗 3人 2人 5.相關(guān)分析 3人 分工人數(shù) 章節(jié)名稱 分工人數(shù) SPSS的認識及數(shù)據(jù)文件的處理心得體會
可能是由于是同學(xué)們第一次講,萬事開頭難,壓力很大,在大家認為最為簡單的內(nèi)容講解上,兩位同學(xué)并沒有完全展現(xiàn)出二人實際水平,大家在這一節(jié)課上都感覺到很壓抑,總的感覺是這節(jié)內(nèi)容很簡單,但是內(nèi)容又很松散,可講的東西太多,講的東西多就沒有突出重點和難點,所以聽過之后就有種無數(shù)的碎片漂浮在腦海中一樣,很難將知識系統(tǒng)化,課后總結(jié)一下無非就是兩塊,一塊是了解SPSS軟件的歷史及基本功能,還有一塊就是SPSS軟件當(dāng)中一個模塊叫做數(shù)據(jù)文件的處理,在認識SPSS軟件當(dāng)中了解到它是一組社會科學(xué)統(tǒng)計軟件包,誕生于1968年,當(dāng)時美國的3位大學(xué)生開發(fā)出了它,經(jīng)過這么多年的后續(xù)開發(fā),SPSS已經(jīng)有了很多的版本,具有了更的兼容性、和更友好的操作界面,也在很多的學(xué)科領(lǐng)域得到了應(yīng)用,而在教育中的應(yīng)用
只是它的一個分支。此外它對硬件的要求也很低,當(dāng)前一般的電腦都能安裝它,安裝的過程中也沒有什么特殊的方法,傻瓜式的安裝方式完全就可以滿足。在數(shù)據(jù)文件的處理方面,主要是要學(xué)會定義變量、處理變量兩方面;定義變量是要注意根據(jù)自己實際采集的數(shù)據(jù)來定義變量,例如是數(shù)值型的變量還是文本型的變量及變量的長度,小數(shù)點保留尾數(shù)等,總之就是一句話,根據(jù)實際調(diào)查的數(shù)據(jù)要求來定義相應(yīng)變量。變量定義只有只要細心的將實際調(diào)查的數(shù)據(jù)錄入到SPSS當(dāng)中即可,當(dāng)然也可以在SPSS軟件之外進行數(shù)據(jù)編制,可以通過EXECEL等編輯后可以直接導(dǎo)入到SPSS中。在處理變量模塊當(dāng)中,可以對變量進行添加、刪除、拆分與合并等操作,只要根據(jù)實際調(diào)查數(shù)據(jù),細心調(diào)整變量,使操作更加簡便和明了。
2、 數(shù)據(jù)清理與基本統(tǒng)計及測量質(zhì)量分析的心得體會
數(shù)據(jù)的清理與基本統(tǒng)計及測量質(zhì)量分析由兩名同學(xué)進行講解,由于吸取了上節(jié)課兩名同學(xué)的經(jīng)驗,本節(jié)講授的明顯好于上節(jié)課,這里我也是把它分為兩塊進行學(xué)習(xí),一塊是數(shù)據(jù)的清理,另一塊是相關(guān)統(tǒng)計理論的學(xué)習(xí)。在數(shù)據(jù)清理方面主要學(xué)習(xí)了奇異數(shù)據(jù)的檢查與清理,在這里本人覺得非常有必要進行數(shù)據(jù)清理,在實際的調(diào)查數(shù)據(jù)時難免會出現(xiàn)錯誤或者碰到極為特殊的典型案例,所以這些數(shù)據(jù)很難符合大眾規(guī)律,在統(tǒng)計、分析過程中可能會造成分析結(jié)果異常,從而直接影響最終的結(jié)論。所以覺得非常有必要進行數(shù)據(jù)檢查與清理。而我認為本節(jié)的難點不是怎樣熟練運用SPSS軟件,而是在第二塊中的,相關(guān)統(tǒng)計理論的學(xué)習(xí),學(xué)習(xí)這些理論需要一定的數(shù)學(xué)基礎(chǔ),只有明確這些
理(論如均值、標準誤差、中數(shù)、眾數(shù)、全距、四分位等)原理,知其然,知其所以然,這才是關(guān)鍵,在SPSS中想要實現(xiàn)對數(shù)據(jù)進行以上分析只需要輕輕點擊一下按鈕就可以是輕松實現(xiàn),但是如果不清楚到底用它們來做什么就無從談起做數(shù)據(jù)分析了,所以本節(jié)內(nèi)容知道分析原理的重要性要遠遠大用SPSS對數(shù)據(jù)做出相關(guān)分析的重要性??偨Y(jié)為一句話“知道它們是做什么的后才會讓它們?nèi)プ鲈撟龅墓ぷ鳌薄?/p>
3、 T檢驗的心得體會
T檢驗由兩名同學(xué)講解,在學(xué)習(xí)T檢驗時,首先要明確什么樣的數(shù)據(jù)適合T檢驗,T檢驗的結(jié)果要說明什么問題?經(jīng)過學(xué)習(xí)可以知道,T檢驗是對兩組數(shù)據(jù)間的平均水平或均數(shù)的比較,通過比較可以得出兩組數(shù)據(jù)間的顯著性水平,而這兩組數(shù)據(jù)都要符合正態(tài)分布,方差具有齊同性,T檢驗由兩種情況,一種配對提檢驗,要求兩組數(shù)據(jù)不可以獨立顛倒順序,如果顛倒順序就會改變問題的性質(zhì),這種T檢驗稱為配對T檢驗;另一種情況下的T檢驗是兩組數(shù)據(jù)可以任意顛倒順的檢驗稱為獨立樣本的T檢驗。但是這兩種情況都必須符合最先的要求,即都是符合正態(tài)分布,方差都具有齊同性。通過SPSS的相關(guān)操作可以輕松完成檢驗,但是在檢驗的過程中必須設(shè)置置信區(qū)間,一般設(shè)置為95%,在設(shè)置置信區(qū)間時必須要考慮到所做分析的數(shù)據(jù),如果像要得到顯著性差異的結(jié)果則可盡量將置信區(qū)間設(shè)置小些,如果想要得到不顯著差異就要將置信區(qū)間甚至大些,本人的理解為若置信區(qū)間小,則可以理解為在小范圍內(nèi)是可以相信的,但如果將分析結(jié)果的置信區(qū)間值調(diào)大則說明在很大的范圍內(nèi)這個結(jié)果可信,反之則不可信
spss實習(xí)心得篇3
以前學(xué)統(tǒng)計學(xué)的時候就聽老師講過SPSS有非常強大的統(tǒng)計功能,對我們學(xué)習(xí)、工作有很大的幫助,所以我一直認為SPSS很神秘。通過這個學(xué)期周老師的課讓我對此清楚了許多,也學(xué)到了SPSS強大的統(tǒng)計功能,更加讓我明白了SPSS與Excel的區(qū)別。
SPSS是“社會科學(xué)統(tǒng)計軟件包”(Statistical Package for the Social Science)的簡稱,是一種集成化的計算機數(shù)據(jù)處理應(yīng)用軟件。1968年,美國斯坦福大學(xué)H.Nie等三位大學(xué)生開發(fā)了最早的SPSS統(tǒng)計軟件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成長歷史,全球約有25萬家產(chǎn)品用戶,廣泛分布于通訊、醫(yī)療、銀行、證券、保險、制造、商業(yè)、市場研究、科研、教育等多個領(lǐng)域和行業(yè)。SPSS是世界上公認的三大數(shù)據(jù)分析軟件之一(SAS、SPSS和SYSTAT)。
在學(xué)習(xí)SPSS期間,我主要遇到的問題是后面幾章,SPSS的參數(shù)檢驗、方差分析、相關(guān)分析、線性回歸分析、聚類分析、因子分析等。
在參數(shù)檢驗中我不知道原假設(shè)是什么,導(dǎo)致分析的時候不知道該拒絕原假設(shè)還是接受原假設(shè),不能分析出統(tǒng)計結(jié)果。不會區(qū)分單樣本t檢驗和兩配對樣本t檢驗的區(qū)別,現(xiàn)在懂得了它們都要服從正態(tài)分布,基本思想是小概率反證法,反證法思想是先提出假設(shè)(檢驗假設(shè)H0),再用適當(dāng)?shù)慕y(tǒng)計方法確定假設(shè)成立的可能性大小,如果可能性小,則認為假設(shè)不成立,否則,還不能認為假設(shè)不成立。
在學(xué)習(xí)方差分析中,開始常常把觀測變量和控制變量弄混淆,在分析的時候應(yīng)分別送入哪個對應(yīng)框中,如果反了的話會導(dǎo)致結(jié)果的不準確。其次,對LSD、Bonferroni、Tukey、Scheffe等方法的使用不清楚,現(xiàn)在基本掌握了多重比較方法選擇:一般如果存在明確的對照組,要進行的是驗證性研究,即計劃好的某兩個或幾個組間(和對照組)的比較。宜用Bonferroni(LSD)法;若需要進行多個均數(shù)間的兩兩比較,且各組個案數(shù)相等,適宜用Tukey法;其他情況宜用Scheffe法。最后,對方差齊性檢驗、多重比較檢驗、趨勢檢驗理解不夠透徹,在方差檢驗中,Post Hoc鍵有LSD的選項:當(dāng)方差分析F檢驗否定了原假設(shè),即認為至少有兩個總體的均值存在顯著性差異時,須進一步確定是哪兩個或哪幾個均值顯著地不同,則需要進行多重比較來檢驗。LSD即是一種多因變量的三個或三個以上水平下均值之間進行的兩兩比較檢驗。
在學(xué)習(xí)相關(guān)分析的過程中,在繪制散點圖時,不知道哪個該做橫坐標,哪個該做縱坐標,明白了橫坐標是解釋變量,縱坐標是被解釋變量,還有對相關(guān)系數(shù)的種類分析不熟練等 。在學(xué)習(xí)回歸分析的過程中,對DW可檢驗的含義不理解,不記得對應(yīng)的DW表示的殘差序列的相關(guān)性。對解釋變量向前篩選、向后篩選、逐步帥選策略不能熟練掌握,特別是對向前向后篩選時到處的結(jié)果不會進行分析。
學(xué)習(xí)聚類分析中, 變量的選擇分不清,無關(guān)變量有時會引起嚴重的錯分,應(yīng)當(dāng)只引入在不同類間有顯著差別的變量,盡量只使用相同類型的變量進行分析 。 分類數(shù)不明確,從實用角度講,2~8 類比較合適 。 掌握了K-means Cluster 分析,樣本量大于100時有必要考慮,只能使用連續(xù)性變量。
學(xué)習(xí)因子分析的過程中,對提取出來的因子的實際含義不清晰,不能使因子具有命名解釋性。
學(xué)習(xí)了SPSS后,我不禁想到了SPSS與Excel的區(qū)別,這一點是針對像我這樣開始只懂得用EXCEL的人來說。從個人的體會來說,二種軟件有一定相似,操作都簡便,同時又有一些可以互補的地方。但是SPSS又比Excel更加強大:
一、圖型的表現(xiàn)力是SPSS的主要優(yōu)點之一
應(yīng)該說,Excel的圖型表現(xiàn)主要是簡便,對許多的人來說基本夠用,但對于科學(xué)的表現(xiàn),SPSS就更為詳細和準確,這一點據(jù)說在所有統(tǒng)計軟件中都突出。
二、通過SPSS檢驗方差齊性和數(shù)據(jù)分布
假設(shè)檢驗中,采用的t檢驗和方差檢驗都需要滿足二個要求,即
1.樣本方差齊性
2.樣本總體呈正態(tài)分布
在Excel中,提供了F檢驗來檢驗方差齊性問題,也就是可以先通過F檢驗確定方差齊性與否來選擇下一步用哪個T檢驗或方差檢驗分析工具。但只要數(shù)據(jù)多于二組則無從下手;通過描述統(tǒng)計大約能從峰度和偏度來了解樣本的分布實際工作中,只要分布單峰且近似對稱分布,也可應(yīng)用,但要具體確定樣本的分布也有難度。這二個問題在SPSS就可以解決
最后,在感嘆它的方便與快捷的同時,對軟件開發(fā)人員的智慧到了肅然起敬的地步。一直覺得計算機語言是最難的一門外語。雖然本科時曾經(jīng)對這種邏輯性很強的東西很感興趣,并在編程課上取得不錯的成績,但一直覺得這似乎不是我能掌控的東西。SPSS的神奇之處在于,它省去了使用者巨大的計算量,并提高準確性。它開發(fā)了開發(fā)者的智慧,卻弱化了使用者的大腦。
猜你喜歡: