考研統(tǒng)計學(xué)專業(yè)的知識點
我們在參加了考研統(tǒng)計學(xué)專業(yè)的時候,需要把一些復(fù)習(xí)的知識重點了解清楚。小編為大家精心準備了考研統(tǒng)計學(xué)專業(yè)的重點,歡迎大家前來閱讀。
考研統(tǒng)計學(xué):數(shù)據(jù)特征
一、集中趨勢:表明同類現(xiàn)象在一定時間、地點條件下,所達到的一般水平與大量單位的綜合數(shù)量特征,有以下3個特點:
1. 用一個代表數(shù)值綜合反映個體某種標志值的一般水平。
2. 將個體標志值之間的差異抽象掉了。
3. 計量單位與標志值的計量單位一致。
集中趨勢
1. 一組數(shù)據(jù)向其中心值靠攏的傾向和程度
2. 測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值
3. 不同類型的數(shù)據(jù)用不同的集中趨勢測度值
4. 低層次數(shù)據(jù)的測度值適用于高層次的測量數(shù)據(jù),但高層次數(shù)據(jù)的測度值并不適用于低層次的測量數(shù)據(jù)
集中趨勢的作用:
比較若干總體的某種標志數(shù)值的平均水平
研究總體某種標志數(shù)值的平均水平在時間上的變化
分析社會經(jīng)濟現(xiàn)象的依存關(guān)系
研究和評價事物優(yōu)劣的數(shù)量指標
計算和估算其他重要的經(jīng)濟指標
二、離中趨勢:
數(shù)據(jù)分布的另一個重要特征
反映各變量值遠離其中心值的程度(離散程度)
從另一個側(cè)面說明了集中趨勢測度值的代表程度
不同類型的數(shù)據(jù)有不同的離散程度測度值
離中趨勢度量的目的:
描述總體內(nèi)部差異程度;衡量和比較均值指標的代表性高低;為抽選樣本單位數(shù)提供依據(jù)
區(qū)別與聯(lián)系:
區(qū)別:集中趨勢是對頻數(shù)分布資料的集中狀況和平均水平的綜合測度;是一組數(shù)據(jù)向其中心值靠攏的傾向和程度;測度集中趨勢就是尋找數(shù)據(jù)水平的代表值或中心值。離中趨勢是對頻數(shù)分布資料的差異程度和離散程度的測度,用來衡量集中趨勢所測數(shù)據(jù)的代表性,或者反應(yīng)變量值的穩(wěn)定性與均勻性;是用來描述總體內(nèi)部差異程度及衡量和比較均值指標的代表性高低。偏度是用來反應(yīng)變量數(shù)列分布偏斜程度的指標,有對稱分布和非對稱分布,非對稱分布也即為偏態(tài)分布,包括左偏分布和右偏分布。峰度是用來反應(yīng)變量數(shù)列曲線頂端尖峭或扁平程度的指標。
聯(lián)系:為了反面描述研究對象的情況,僅僅用集中趨勢方法來測度集中性和共性是不夠的,還要用離散趨勢方法來測度其離散性和差異性,因此,而這需要結(jié)合使用。集中趨勢和離中趨勢是變量數(shù)列分布的兩個重要特征,但要全面了解變量數(shù)列分布的特點,還需要知道數(shù)列的形狀是否對稱、偏斜程度以及分布的`扁平程度等。偏度和峰度就是從分布特征作進一步的描述。
考研統(tǒng)計學(xué):參數(shù)估計
一、點估計
用樣本的估計量直接作為總體參數(shù)的估計值
2. 缺點:沒有給出估計值接近總體參數(shù)程度的信息,它與真摯的誤差、估計可靠性怎么樣無法知道。區(qū)間估計可以彌補這種不足。
點估計的方法有矩估計法、順序統(tǒng)計量法、最大似然法、最小二乘法等
二、 區(qū)間估計
在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減抽樣誤差而得到的。
根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量。
三、置信水平
將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平
表示為 (1 - a% )
常用的置信水平值有 99%, 95%, 90%;相應(yīng)的 a 為0.01,0.05,0.10
四、置信區(qū)間
ü 由樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間;
ü 統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間
ü 用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值,我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個
置信區(qū)間的表述:
總體參數(shù)的真值是固定的,而用樣本構(gòu)造的區(qū)間則是不固定的,因此置信區(qū)間是一個隨機區(qū)間,它會因樣本的不同而變化,而且不是所有的區(qū)間都包含總體參數(shù)
實際估計時往往只抽取一個樣本,此時所構(gòu)造的是與該樣本相聯(lián)系的一定置信水平(比如95%)下的置信區(qū)間。我們只能希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個
當(dāng)抽取了一個具體的樣本,用該樣本所構(gòu)造的區(qū)間是一個特定的常數(shù)區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值,因為它可能是包含總體均值的區(qū)間中的一個,也可能是未包含總體均值的那一個
一個特定的區(qū)間總是“包含”或“絕對不包含”參數(shù)的真值,不存在“以多大的概率包含總體參數(shù)”的問題
置信水平只是告訴我們在多次估計得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值,而不是針對所抽取的這個樣本所構(gòu)建的區(qū)間而言的
使用一個較大的置信水平會得到一個比較寬的置信區(qū)間,而使用一個較大的樣本則會得到一個較準確(較窄)的區(qū)間。直觀地說,較寬的區(qū)間會有更大的可能性包含參數(shù)
但實際應(yīng)用中,過寬的區(qū)間往往沒有實際意義
區(qū)間估計總是要給結(jié)論留點兒余地
影響置信區(qū)間寬度的因素:
1.總體數(shù)據(jù)的離散程度,用 s 來測度;2.樣本容量;3. 置信水平 (1- a),影響 zα/2 的大小
五、 參數(shù)估計標準:
無偏性:估計量抽樣分布的數(shù)學(xué)期望等于被估計的總體參數(shù)
有效性:對同一總體參數(shù)的兩個無偏點估計量,有更小標準差的估計量更有效
一致性:隨著樣本容量的增大,估計量的值越來越接近被估計的總體參數(shù)。
考研統(tǒng)計學(xué):假設(shè)檢驗
一、概念
先對總體的參數(shù)(或分布形式)提出某種假設(shè),然后利用樣本信息判斷假設(shè)是否成立的過程
有參數(shù)檢驗和非參數(shù)檢驗
邏輯上運用反證法,統(tǒng)計上依據(jù)小概率原理
什么小概率?
1. 在一次試驗中,一個幾乎不可能發(fā)生的事件發(fā)生的概率
2. 在一次試驗中小概率事件一旦發(fā)生,我們就有理由拒絕原假設(shè)
3. 小概率由研究者事先確定
怎樣通過假設(shè)檢驗去掉偶然性
利用P值進行檢驗就可以去掉偶然性。因為P值告訴我們在某個總體的許多樣本中,某一類數(shù)據(jù)出現(xiàn)的經(jīng)常程度,P值是當(dāng)原假設(shè)正確的情況下,得到所觀測的數(shù)據(jù)的概率。如果原假設(shè)是正確的,P值若很小,則告訴我餓們得到這樣的觀測數(shù)據(jù)是多么的不可能,相當(dāng)不可能得到的數(shù)據(jù),就是原假設(shè)不對的合理證據(jù),偶然性也就消除了。
二、原假設(shè)
1. 研究者想收集證據(jù)予以反對的假設(shè)。是關(guān)于總體參數(shù)的表述,它是接受檢驗的假設(shè)。
2. 總是有符號 =, £ 或 ³
3. 表示為 H0
n H0 : m = 某一數(shù)值
n 指定為符號 =,£ 或 ³
三、備擇假設(shè)
研究者想收集證據(jù)予以支持的假設(shè)。黨員假設(shè)被否定時另一種可成立的假設(shè)。
總是有符號 ¹, < 或 >
表示為 H1
n H1 : m <某一數(shù)值,或m >某一數(shù)值
四、結(jié)論與總結(jié)
原假設(shè)和備擇假設(shè)是一個完備事件組,而且相互對立
n 在一項假設(shè)檢驗中,原假設(shè)和備擇假設(shè)必有一個成立,而且只有一個成立
先確定備擇假設(shè),再確定原假設(shè)
等號“=”總是放在原假設(shè)上
因研究目的不同,對同一問題可能提出不同的假設(shè)(也可能得出不同的結(jié)論)
五、兩類錯誤
1. 第Ⅰ類錯誤(棄真錯誤)
原假設(shè)為真時拒絕原假設(shè)
第Ⅰ類錯誤的概率記為a。被稱為顯著性水平。常用的 a 值有0.01, 0.05, 0.10
2. 第Ⅱ類錯誤(取偽錯誤)
原假設(shè)為假時未拒絕原假設(shè)
第Ⅱ類錯誤的概率記為b (Beta)
影響b錯誤的因素:1. 總體參數(shù)的真值。隨著假設(shè)的總體參數(shù)的減少而增大
2. 顯著性水平 a。當(dāng) a 減少時增大 3. 總體標準差 s。當(dāng) s 增大時增大 4.樣本容量 n。當(dāng) n 減少時增大
控制:進行假設(shè)檢驗時總希望犯兩類錯誤的可能性都很小,然而,在其他條件不變的情況下,a與b是此消彼長的關(guān)系,二者不可能同時減小。若要同時減小a與b,只能是增大樣本量。一般總是控制a,是犯錯誤的概率不大于a,即a是允許犯棄真錯誤的最大概率值(而P值相當(dāng)于根據(jù)樣本計算的犯棄真錯誤的概率值,故P值又稱為觀測的顯著性水平)。但確定a時必須注意,如果犯棄真錯誤的代價較大,a可取小些,相反,如果返取偽錯誤的代價較大,則a宜取大些(以使b較小)
六、假設(shè)檢驗的結(jié)論表述
假設(shè)檢驗的目的就在于試圖找到拒絕原假設(shè),而不在于證明什么是正確的
拒絕原假設(shè)時結(jié)論是清楚的
例如,H0:m=10,拒絕H0時,我們可以說¹m10
當(dāng)不拒絕原假設(shè)時
并未給出明確的結(jié)論
不能說原假設(shè)是正確的,也不能說它不是正確的
例如, 當(dāng)不拒絕H0:m=10,我們并未說它就是10,但也未說它不是10。我們只能說樣本提供的證據(jù)還不足以推翻原假設(shè)
七、統(tǒng)計上的顯著與實際意義
1. 當(dāng)拒絕原假設(shè)時,我們稱樣本結(jié)果是統(tǒng)計上顯著的(statistically Significant)
2. 當(dāng)不拒絕原假設(shè)時,我們稱樣本結(jié)果是統(tǒng)計上不顯著的
3. 在“顯著”和“不顯著”之間沒有清除的界限,只是在P值越來越小時,我們就有越來越強的證據(jù),檢驗的結(jié)果也就越來越顯著
4. “顯著的”(Significant)一詞的意義在這里并不是“重要的”,而是指“非偶然的”
5. 一項檢驗在統(tǒng)計上是“顯著的”,意思是指:這樣的(樣本)結(jié)果不是偶然得到的,或者說,不是靠機遇能夠得到的
6. 如果得到這樣的樣本概率(P)很小,則拒絕原假設(shè)
在這么小的概率下竟然得到了這樣的一個樣本,表明這樣的樣本經(jīng)常出現(xiàn),所以,樣本結(jié)果是顯著的
7. 在進行決策時,我們只能說P值越小,拒絕原假設(shè)的證據(jù)就越強,檢驗的結(jié)果也就越顯著
8. 但P值很小而拒絕原假設(shè)時,并不一定意味著檢驗的結(jié)果就有實際意義
因為假設(shè)檢驗中所說的“顯著”僅僅是“統(tǒng)計意義上的顯著”
一個在統(tǒng)計上顯著的結(jié)論在實際中卻不見得就很重要,也不意味著就有實際意義
9. 因為值與樣本的大小密切相關(guān),樣本量越大,檢驗統(tǒng)計量的P值也就越大,P值就越小,就越有可能拒絕原假設(shè)
10.如果你主觀上要想拒絕原假設(shè)那就一定能拒絕它
這類似于我們通常所說的“欲加之罪,何患無詞”
只要你無限制擴大樣本量,幾乎總能拒絕原假設(shè)
11.當(dāng)樣本量很大時,解釋假設(shè)檢驗的結(jié)果需要小心
在大樣本情況下,總能把與假設(shè)值的任何細微差別都能查出來,即使這種差別幾乎沒有任何實際意義
12.在實際檢驗中,不要刻意追求“統(tǒng)計上的”顯著性,也不要把統(tǒng)計上的顯著性與實際意義上的顯著性混同起來
n一個在統(tǒng)計上顯著的結(jié)論在實際中卻不見得很重要,也不意為著就有實際意義。
【考研統(tǒng)計學(xué)專業(yè)的知識點】相關(guān)文章:
考研熱門統(tǒng)計學(xué)專業(yè)簡析08-20
統(tǒng)計學(xué)知識點:恩格爾系數(shù)02-28
應(yīng)用統(tǒng)計學(xué)專業(yè)介紹01-25
2017統(tǒng)計學(xué)專業(yè)排名08-20
應(yīng)用統(tǒng)計學(xué)專業(yè)排名01-20