統計學抽樣方法

時間:2023-08-08 17:07:56

導語:在統計學抽樣方法的撰寫旅程中,學習并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優秀范文,愿這些內容能夠啟發您的創作靈感,引領您探索更多的創作可能。

統計學抽樣方法

第1篇

統計學》是財經院校經濟類各專業的專業基礎課,本課程的設置旨在培養學生對統計學的基本理論和基本方法的掌握,為相關專業課程的學習提供定性和定量的統計分析方法。

《統計學》是研究社會經濟現象總體的數量表現和數量關系的方法論科學。

通過本課程的學習,使學生明確統計這個認識工具的特點、作用;掌握統計學的各種基本概念、基本原理和基本方法,尤其是各種定量分析的方法和技能,提高學生對社會經濟現象數量研究時分析問題和解決問題的能力。

為更好地掌握《統計學》課程,除課堂教學應有的54課時外,要求學生做到課前預習、課后總結,重視本課程作業練習這一環節,以實現本課程的既定目標。

二、課程的教學目標及總的教學要求、重點、難點

教學目標及總的要求:

社會經濟統計學是研究社會經濟現象總體的數量表現和數量關系的方法論科學。

通過學習本課程,要求學生明確統計這個認識工具的特點、作用;掌握統計學的各種基本概念、基本原理和基本方法,尤其是各種定量分析的方法和技能,提高學生在對社會經濟現象進行研究時的分析問題和解決問題的能力。

同時,為進一步學習各專業課程提供定性和定量分析的方法。

教學的重點:

統計學中的基本概念:統計總體、總體單位、標志、變量、統計指標和指標體系及其相互之間的區別和聯系。

統計調查的意義,統計調查的分類。

統計調查方案的內容,調查對象、調查單位、填報單位和調查表、調查時間等概念。

統計報表制度的意義、作用和內容。

各種專門調查的概念、特點和作用。

統計整理的意義、步驟。

統計分組的概念、作用和形式。

分配數列的概念和種類。

分配數列中的名詞概念,尤其是組中值的計算。

統計表的作用、結構和種類。

統計表的編制原則

總量指標的概念和作用。

總量指標的分類,尤其是時期指標與時點指標的區別。

相對指標的概念和作用及其表現形式。

各種相對指標的意義和計算方法。

正確運用相對指標的原則。

平均指標的概念和作用。

算術平均數、調和平均數、幾何平均數、眾數、中位數的意義和計算方法,注意算術平均數與強度相對指標的區別。

標志變異指標的意義和作用,各種標志變異指標的計算方法及特點,尤其是標準差的計算方法。

正確應用平均指標的原則。

動態數列的概念和作用。

動態數列的種類。

動態數列的編制原則。

各種動態水平分析指標和動態速度分析指標的意義和計算方法,這些指標相互之間的關系,如逐期增長量與累計增長量的關系、發展速度與增長速度的關系、環比發展速度與定基發展速度的關系、發展速度與平均發展速度的關系等。

序時平均數與一般平均數的異同點。

平均發展速度兩種計算方法的側重點。

動態數列的四種變動形態。

幾種常用的測定長期趨勢的方法:間隔擴大法、移動平均法,尤其是用最小平方法配合動態趨勢方程。

季節變動的測定方法。

指數的概念、作用和種類。

綜合指數的編制原理,數量指標指數、質量指標指數的計算。

平均數指數的編制原理,加權算術平均數指數、加權調和平均數指數的計算。

平均數指數與綜合指數的關系,以及平均數指數在實際工作中的應用。

平均指標指數的編制和分析方法。

指數體系的概念和作用。

運用指數體系進行因素分析,以及根據指數體系進行指數間的推算。

抽樣推斷的概念、特點和作用。

抽樣推斷的基本概念。

抽樣推斷的理論依據。

抽樣誤差的概念和抽樣平均誤差的意義,抽樣平均誤差的計算方法

抽樣極限誤差的意義及計算。

概率度的意義及其與抽樣推斷可靠程度的關系。

區間估計的方法與步驟。

抽樣方案設計的內容以及抽樣方案設計的原則。

主要的抽樣調查組織形式。

簡單隨機抽樣條件下必要抽樣單位數目的確定。

相關關系的概念和種類,現象之間相互聯系的兩種類型:函數關系、相關關系。

相關關系的特點。

相關關系的測定方法,相關系數的概念、計算方法和性質。

回歸分析的概念和一元線性回歸分析的特點、方法。

相關系數與回歸系數之間的數量關系。

估計標準誤差的意義及計算方法。

相關系數與估計標準誤差之間的數量關系。

國民經濟統計核算的概念及國民經濟核算體系的內容。

國民經濟核算中三大產值指標的核算方法以及國內生產總值的三種核算方法。

國民經濟統計核算中的五大平衡表及四大賬戶體系。

教學難點:

統計學中的基本概念。

調查單位與填報單位的區別。

普查、抽樣調查、重點調查、典型調查的區別。

總量指標和相對指標的分類,相對指標的計算方法。

各種平均指標的應用條件及計算方法。

標志變異指標的意義及計算方法。

各種動態分析指標的意義和計算方法,以及指標之間的關系。

數量指標指數與質量指標指數的區分和編制。

算術平均數指數與調和平均數指數的區分和編制。

因素分析法。

抽抽樣誤差、抽樣平均誤差、抽樣極限誤差、概率度的意義。

概率度與概率的關系。

區間估計。

必要抽樣單位數目的確定。

相關關系的種類。

相關系數的計算方法。

一元線性回歸方程的建立及其與直線趨勢方程的區別。

估計標準誤差的意義及計算方法。

第2篇

一、我國目前采用的樣本規模確定公式

(一)控制測試中樣本規模的確定內部控制制度符合性測試,即屬性抽樣,是依據統計學中假設檢驗的原理設計的。審計屬性抽樣,是指只有兩種可能結果(信賴和不信賴)的隨機試驗,其概率分布為二項分布。由于二項分布計算公式比較復雜,而泊松分布近似于總體很大的二項分布。統計學家編制了“累積泊松分布數值表”,這樣按照統計學確定樣本容量的思想,利用泊松分布確定過度信賴風險系數來體現統計抽樣規模計算式中標準差及系數;用可容忍偏差率上限,體現統計學中由極限誤差(Δρ)形成區間的上限。建立審計屬性抽樣樣本容量計算公式:

樣本容量=信賴過度風險系數÷可容忍偏差率

使用上列計算公式來計算樣本容量,在事先并不知道樣本容量為多少的情況下,樣本可能發生的偏差數很難預計。就是有了樣本預計偏差發生數,還要通過查表確定過度依賴風險系數,再用公式計算樣本容量,比較麻煩。為了提高審計效果和效率,人們根據泊松分布和不重復抽樣原理,編制了供實務應用的統計抽樣樣本規模確定表。我國準則指南中詳細介紹了樣本規模的確定,注冊會計師根據可接受的信賴過度風險選擇相應的抽樣規模表,然后讀取預計總體偏差率找到適當的比率。接下來注冊會計師確定與可容忍偏差率對應的列。可容忍偏差率所在列與預計總體偏差率所在行的交點就是所需的樣本規模。由此可見,在控制測試中,注冊會計師主要關注抽樣風險中的信賴過度風險。

(二)細節測試中樣本規模的確定

(1)傳統變量抽樣。設計傳統變量抽樣所需的數學計算,包括樣本規模的計算,對于手工應用來說顯得復雜且困難。注冊會計師在使用傳統變量抽樣時通常運用計算機程序確定樣本規模,一般不需懂得這些方法所用的數學公式。根據指南中樣本規模確定公式,

樣本容量=[預先估計的標準差×(可接受的誤受風險的置信系數+可接受的誤拒風險的置信系數)×總體規模÷(總體可容忍錯報-預計總體錯報)]^2

通過分析可知,以上樣本規模確定公式是在充分考慮了誤受風險和誤拒風險的基礎上得出的。

(2)PPS抽樣。樣本規模確定公式主要有兩種方法:一是公式法,樣本規模=總體賬面價值*風險系數/[可容忍錯報-(預計總體錯報*擴張系數)]其中,風險系數代表注冊會計師愿意接受的誤受風險。注冊會計師通過估計預計總體錯報而間接的控制誤拒風險,不需要特別控制誤拒風險。二是查表法,由于PPS抽樣以屬性抽樣原理為基礎,注冊會計師可直接使用控制測試中的統計抽樣樣本量表。此法與前面討論的屬性抽樣原理相同,在此不再贅述。

二、我國準則中關于樣本規模確定存在的問題

審計人員在進行審計測試時,可能發生兩種抽樣風險:一種是Ⅰ類風險,指抽樣結果使審計人員否定了真實原假設的可能性,又稱a風險,棄真風險;信賴不足風險和誤拒風險分別指符合性測試和實質性測試中的a風險。另外一種是II類風險,指抽樣結果使審計人員錯誤地接受了非真原假設的可能性,又稱β風險,存偽風險;信賴過度風險和誤受風險分別指符合性測試和實質性測試過程中的β風險。

通過上述分析可知,我國準則規定的樣本規模確定公式,除了細節測試中傳統變量抽樣考慮了a風險,其余均為考慮此類風險。

a風險,是影響審計效率的抽樣風險,β風險,是影響審計效果的風險。考慮到審計的目標,為了發表正確的審計意見,注冊會計師一般只關注β風險。但a風險影響審計效率,可能會增加不必要的實質性程序,增加審計成本,尤其是在細節測試中,如果在某類交易或賬戶余額的賬面金額可能不存在重大錯報時根據樣本結果得出存在重大錯報的結論,注冊會計師采用替代方法可能花費的成本大得多。

由于上述公式中存在沒考慮的風險因素,據以確定的樣本量必然小于實際應抽取的樣本量,因此樣本數據顯示的結果不能代表總體特征,使得審計風險增大。

三、樣本規模確定公式的改進

依據統計學原理,a風險和β風險屬于變動方向相反的風險,沒有一種假設檢驗可以使這兩類風險同時達到最小。若要同時控制兩類風險,一般地,在進行假設檢驗時,先是根據問題的要求,預先給出顯著性水平以控制犯a風險錯誤的概率,而后用選擇適當的樣本容量的方法,在某種意義上減少犯β風險錯誤的概率。在統計學中,通常會應用施行特征函數的方法求解。在此只簡單的說明樣本容量計算的原理,對于具體的計算公式的由來,由于涉及大量概率論與數理統計等方面的知識,與審計學本身關系不大,故不贅述。

如前所述,在審計抽樣中,為降低審計風險,必須同時考慮a風險和β風險。屬性抽樣下,審計人員同時控制a、β兩類風險的條件見圖1:

圖中P。表示預計總體偏差率,P1表示可容忍最大偏差率。假設H0:P=P0,H1:P>P1,P為實際總體偏差率。

由圖可見,審計人員只要適當地確定n(與分布的標準差有關)和V(臨界值),就同時控制了a風險和β風險。

從H。分布看,有:

V=P0+Z1-αx0=P0+Z1-α

從H1分布看,有:

V=P1-Z1-x1=P0-Z1-

聯立上述兩式解出(即屬性抽樣樣本規模確定公式):

n=

最后得出的樣本規模確定公式為:

n=()2

其中:N為總體規模;Z1-IR/2為正態標準差(IR:α風險、誤拒風險);Z1-IA為正態標準差(IA:?茁風險、誤拒風險);TM為可容忍誤差;EM為預期總體誤差;SD為估計標準差

上面公式(3)即為改進的屬性抽樣樣本規模的確定公式,同時考慮了兩類抽樣風險,保證審計效果的同時,提高了審計效率。

注冊會計師確定樣本規模受到多種因素的影響,且在控制測試和細節測試中有所不同。目前我國審計準則中規定的樣本規模確定公式基本考慮了影響樣本規模確定的重要因素,只是對于審計抽樣風險的第一類風險有所忽略。本文只是淺薄的應用相關統計學原理進行了簡單的分析說明,希望可以為審計抽樣理論與實務的發展提供點建議。

參考文獻:

第3篇

關鍵詞:頻率學派;貝葉斯學派;統計方法

統計學中幾大影響比較大的學派是頻率學派、貝葉斯學派和信念學派。在很長的時間內,頻率學派或稱經典學派的觀點、理論占據了主流地位,其余兩派并未得到足夠的重視。但是在實際應用中,卻早已應用貝葉斯學派的理念來處理問題。所以有必要在理解這幾大學派思想的基礎上,來了解不同思想的統計方法。

一、兩大學派的特點和分歧

頻率學派堅持對概率的看法是頻率的穩定性,所以,凡是不能重復進行的試驗的有關結果都不能應用概率作出判斷。但是很多時候,人們都是根據已有的知識和邏輯推理能力來對統計問題作出判斷。在實際經濟環境中,情況總是比較復雜,很難具備可以進行重復試驗的條件,這個時候頻率學派的理論就很難運用上了。與之不同,貝葉斯學派認為,概率是反映事件發生可能性的一個度量,既可以是反映重復試驗的頻率穩定性,也可以反映人們的某一些類型的主觀信念。只要可以接受到任何先驗信息,就都能對特定問題進行邏輯推理。

頻率學派和貝葉斯學派之間激烈的爭論,促進了統計學的發展,使得統計學最為一門信息科學在學科體系上和思想上更完善。這兩大學派爭論的分歧:其一,對概率這個概念的認識。經典學派認為概率是純客觀的,是頻率穩定性的內在依據。而貝葉斯學派則認為概率應包含客觀概率與主觀概率;其二,是對統計問題的看法。頻率學派研究的重點是樣本空間,認為樣本是變化的,參數是固定不變的,并從中尋找規律來推斷參數的性質。貝葉斯學派的重點是研究參數空間,認為樣本就是已觀測到的值,它已不再變動而參數則是隨機變量。需要探討的是,參數取值的變化規律;其三,利用信息的范圍不同。貝葉斯學派既利用樣本信息又利用先驗信息,而經典學派只局限于從樣本獲取的信息。其四,推斷的過程不同。貝葉斯學派是從參數的先驗分布到后驗分布。而頻率學派卻僅是根據樣本的信息對參數作出推斷。可以說,先驗分布這是區分這兩個學派的一個重要特征。

二、統計分析方法的基本思路

在參數估計的基本方法上,對于單一方程模型,最常用的有普通最小二乘法、廣義矩估計和極大似然估計法等。對于聯立方程模型有常用二段最小二乘法和三段最小二乘法等。基本的理論框架是對未知參數的模型建立,參數估計包括點估計、區間估計、假設檢驗和預測等內容。并以此來研究各種模型,如線性回歸模型、非線性回歸模型、聯立方程組模型,面板數據模型、時間序列模型等。

而貝葉斯分析則采用不同的思路,來進行參數的估計,檢驗和模型的比較。一般有如下思路:在得到樣本數據的基礎上,建立模型,求出似然函數,同時先驗信息得到先驗分布,運用貝葉斯定理,推導出后驗分布,分析得出的結論。

可以說,經典的統計分析方法與貝葉斯分析的方法,孰優孰劣,也不可以一概而論。經典的方法在發展體系上很嚴密,有嚴謹的數理基礎,而貝葉斯方法則是提供了一種新的思維方式,是推進現代統計及相關學科理論發展的強大力量。

三、統計計算方法和軟件的發展

隨著現代電腦技術的發展,統計學也獲得了飛快的發展,尤其是促進了統計的計算方法的發展,特別是在針對貝葉斯方法的計算得到了新的進展。這主要分為兩類,一類是通過直接的抽樣手段,得到后驗均值的估計值,主要包括直接抽樣、分層抽樣、篩選抽樣等;它們的缺陷在于只能用于比較簡單、低維的后驗分布。第二類為 MCMC(Markov chainMonte Carlo),近年發展迅速,在各個相關領域得到了廣泛的應用。在實際研究工作中,經常遇到的是高維的復雜數據,這時運用傳統的方法就遇到困難了。而MCMC方法為這一復雜的計算過程開辟了新的方向。它的基本思想是把一個復雜的抽樣問題轉化為一系列簡單的抽樣問題,而不是直接從復雜的總體中抽取樣本,并利用電腦技術模擬這個過程。

由于龐大的計算量,復雜的高維數據,單靠人工計算是不可行的,針對各種統計計算方法的軟件極大的促進了統計學各個分支的發展。在相關的經濟領域,分別有MATLAB、S-Plus和R版本,在相關的生物統計領域還有WinBUGS,使用比較廣泛,只是需要根據不同的模型自己來編寫程序。

第4篇

社會學學科體系由社會學理論、社會學研究方法和分支社會學(應用社會學)三個部分組成。1999年7月召開的全國高校社會學學科教學指導委員會暨社會學系主任聯席會議確定了大學本科社會學專業10門專業主干課,它們是:社會學概論、社會調查研究方法、國外社會學理論、中國社會思想史或中國社會學史、社會統計學、社會工作概論、社區概論、社會心理學、經濟社會學、發展社會學(社會現代化)[4],建立了社會學專業的課程體系。在社會學專業課程體系中,社會學研究方法系列課程涵括了社會研究方法(筆者所在學校沿用了傳統課程名稱:社會調查研究方法)、社會統計學兩門專業基礎課。一些高校還圍繞社會學研究方法開設了其他方法課程,如《統計軟件應用》、《質性研究方法》、《學術論文寫作》等,這些課程都可納入社會學研究方法系列課程體系中。本文僅涉及社會研究方法、社會統計學和統計軟件應用三門課程。社會研究方法介紹社會學研究的基本概念、基本原理和基本程序,從研究方法體系包括方法論、研究方式和具體研究方法及技巧;及社會學研究的完整過程包括選題、研究設計、收集資料、分析資料和撰寫研究報告五個階段等方面全面系統地介紹社會學研究方法的基礎。社會統計學介紹定量數據資料的統計原理和方法,包括單變量與雙變量的統計描述和統計推論方法。統計軟件應用介紹運用統計軟件處理定量數據資料的操作技術,包括統計描述和統計推論方法的具體操作技巧、統計圖表的制作與編輯等技術。這三門課程分別從不同角度和側重點介紹開展社會研究的方法和技巧,課程內容聯系緊密且各有側重。這三門課程是相互關聯,內涵著邏輯關系,是一個課程體系。[5]社會學研究方法系列課程(下稱系列課程)中的社會研究方法和社會統計學是社會學專業的核心課程,統計軟件應用也是社會學專業的專業必修課,這三門課在社會學專業課程體系中占據十分重要的地位。社會學恢復的初期,中國社會學界在“打開窗戶學習”的過程中,對西方社會學研究方法的關注和引進成為最主要的方面之一。[6]“在引進、借鑒美國社會學的初期,我們更多地表現出的是方法興趣而非理論興趣”[7]社會學及相關專業的學生要開展社會研究,必須完整地掌握這三門課程所包含的知識和技能,缺一不可。同時,系列課程也是社會學學科體系中應用特色最突出的部分,不僅要求學生掌握社會學研究方法的基本原理和邏輯過程,更要求學生通過調查實踐掌握社會研究的綜合技能和具體技巧,如設計合理的調查問卷、成功地實施調查收集資料、熟練并準確地操作統計軟件對調查資料進行統計分析及撰寫調查報告,要全面掌握這些方法必須通過社會學研究方法系列課程的系統學習和訓練。

二、社會學研究方法系列課程教學改革的必要性

(一)現有教學模式存在不足

作為社會學專業的重要課程,各高校通常對系列課程的重要性給予了充分的肯定,從開課時間的安排到學分及學時的分配等多個環節都會進行充分考慮。但許多高校也由于師資力量、培養經費等因素的影響,對社會學研究方法系列課程的教學安排不盡合理,教學效果不十分盡如人意,在一定程度上影響了社會學本科學生研究方法綜合能力和操作技能的提高,進而影響到社會學專業本科生的培養質量。當前存在的比較普遍的問題有:

1.系列課程的教學內容和教學方法還存在諸多不足,如教材選擇、教學大綱編寫、課程考核等諸多環節都是以每門課程為基本單位的,很少考慮系列課程之間的關系及不同課程對教學的特殊要求,缺乏從整體的角度對待系列課程之間的關系和協調,影響到學生從整體上把握社會學研究方法的系統知識。盡管每一門課的優化有利于研究方法系列課程整體水平的提高,但要真正提高社會學研究方法系列課程體系的綜合教學質量,必須對現有教學方式進行改革,從課程整合的角度將三門課程融會貫通,形成體系。

2.系列課程部分內容存在重復交叉,不僅浪費了教學資源,也容易影響學生的求知欲和學習積極性。社會研究方法課程是系列課程的基礎,從選題、研究設計、資料收集、資料分析到撰寫研究報告,比較全面地介紹了社會研究的基本程序,作為一個獨立的課程,社會研究方法教材中通常都包含了對定量資料分析方法的簡單介紹,與社會統計學的教學內容存在重復和交叉。再如抽樣方法是社會研究方法課程中十分重要的教學內容,而許多社會統計學的教材中也包含了抽樣方法的內容。如果系列課程三門課程是由不同教師分別授課,而教師們備課及授課時不積極溝通和交流,就容易造成多門課程內容交叉、重復講授,不利于系列課程教學效果的優化。

(二)系列課程的性質要求進行系列課程教學改革

系列課程包含的三門方法課程之間有非常緊密的聯系,社會研究方法課程是另外兩門課的基礎,只有了解了社會研究的基本原理和研究過程之后,才能更深刻理解社會統計學在社會研究中的地位和應用目標。同時只有充分理解了社會統計學的基本方法和主要作用,在學習統計軟件操作課程時才能真正掌握統計軟件的靈活應用,進而認識到統計軟件作為一個分析工具在社會研究中的應用價值和前景。多年的教學過程中,筆者屢次發現少數學生過分信賴統計軟件的操作便捷和計算速度,而對社會統計學課程重要性認識不足,結果在統計軟件課程學習時困難重重,不是不知如何選擇操作方法就是對計算結果無法正確理解。因此,首先必須正確認識每門課程的性質及教學目標,深刻理解系列課程之間的關聯,在此基礎上著手改變現有的三門課程獨立授課缺少聯系的模式,促進各門課程之間的相互滲透與貫通,實現課程之間的整合優化。

三、社會學研究方法系列課程教學改革的實踐探索

筆者所在的中南民族大學2001年開始開設社會工作專業、2002年開始開設社會學本科專業,2009年開始以社會學類專業合并招生,社會學研究方法系列課程是社會學類學生的專業必修課,學生進行專業分流前開設社會研究方法和社會統計學課程,進行專業分流后社會學專業和社會工作專業的學生分別開設統計軟件應用課程。筆者自學校開設社會學研究方法系列課程以來,一直承擔系列課程包含的三門課程的講授任務。在多年的教學實踐過程中,筆者逐步認識到系列課程教學安排及教學模式存在的不足,如早期教學安排中社會研究方法課程第二學期開課,社會統計學第四學期開課,而統計軟件則安排在第六甚至第七學科開課,三門課程的開設時間間隔太長,學生對前一門課程內容遺忘快,教師不得不安排大量課時復習前一課程教學重點,即使如此教學效果仍受到影響。經過不斷提出修改建議,學校教務部門幾次修改教學大綱后,目前三門課程的開設時間比較緊湊,比較容易實現三門課程教學內容的順利銜接和鞏固。同時學生較早地全面掌握了社會研究方法后,在接下來的學習過程中更有能力參與或申請各級研究項目的研究工作,對其他課程的學習也有推動作用。由于本校社會學研究方法系列課程由同一教師先后承擔教學任務,為順利實現三門課程之間的整合優化提供了便利。經過不斷摸索與努力,筆者開展了一系列推動研究方法系列課程整合優化的嘗試,并取得初步成效。

(一)系列課程教學內容整合優化

所謂整合,是指按照一定的目標,合并全部資源并集中加以運用,以獲得大于各個別資源所發揮效果之總和的整體效果。所謂優化,也稱最優化、最佳化、最適化,指在資源約束的條件下,采用適當的方法和手段,對資源加以充分和有效的利用,以獲得最理想的效果。[8]在教學實踐中,針對三門課程教學內容存在部分交叉重復的現象,筆者在安排每門課的教學內容時進行了適當的取舍和調整,力爭對三門課程的教學內容進行整合優化。如在第二學期開設的社會研究方法課程中,筆者只簡要介紹定量分析方法與定性分析方法的不同特點及其在社會研究過程中的作用,定量分析的具體內容則不展開講解。這樣既為第三學期開設的社會統計學課程的學習做了必要鋪墊,也使得這兩門課的重點更為突出。再比如,由于在社會研究方法課程中著重講解了抽樣方法,在社會統計學課程中就不展開講解抽樣具體方法,只在簡要回顧抽樣方法的常用類型后著重從社會統計學角度介紹不同抽樣方法帶來的概率差異及樣本容量的估算,這樣安排較好地銜接了同一主題的內容又避免了教學內容的簡單重復。其次,考慮到案例教學在社會學研究方法系列課程教學中的獨特作用,系列課程教學過程中均采用了大量案例材料。為了更好地推動系列課程教學內容的整合優化,筆者在教學案例的選擇和使用上做了不斷改進和完善。如在社會研究方法課程中講授問卷設計和抽樣方法時,筆者采用了中國婦女社會地位調查等許多大型抽樣調查的案例材料,向學生詳細介紹中國婦女社會地位調查的抽樣方案及調查問卷設計技巧。在社會統計學課程中講解單變量統計描述等相關方法時,筆者再次引用中國婦女社會地位調查后期發表的調查報告數據,使學生將調查問卷的設計與后期資料分析方法緊密結合起來理解。在統計軟件應用課程中,介紹變量編碼時筆者則再次以中國婦女社會地位調查問卷為例介紹問卷中不同變量的編碼方法,并從中選擇合適的問題編制成更有針對性的問卷供學生練習使用。通過對相同或相似案例的不同講解,不僅調動了學生的學習積極性(有些學生會順著這個思路將在前期課程中出現的案例主動與后期開設的方法課程建立聯系),也更好地體現了社會學研究方法系列課程之間內容的邏輯關系和知識體系的連貫性。在此基礎上,筆者開始嘗試通過不斷積累和改進,建立三門課程可共享的系列課程共享案例資源庫。希望系列課程共享案例資源庫建成之后,系列課程教學中可根據各門課程的知識點和課程性質選擇合適的案例穿插在教學中,教學內容也可根據各門課程的學時量和教學大綱的重點合理分布,從而有效避免某些交叉內容和案例的重復講解,使各門課程的重點和特色更突出。

(二)系列課程教學方法改革

系列課程的教學內容有緊密聯系,但課程重點和目標卻各有特色。因此在系列課程教學改革實踐過程中,除了對三門課程教學內容進行整合優化外,還要采取更適合不同課程性質和目標的教學方法。社會研究方法課程是系列課程的基礎,涉及面廣,內容較多,且既有強調理解和記憶的知識點,如社會研究方法體系、理論與研究的關系等;又有要求學生熟練掌握的具體技巧,如概念的操作化、調查問卷的設計等。因此這門課程要求教師采用形式多樣的教學方法。對于偏重理解和記憶的知識點,筆者主要采用課堂講授、案例分析等方法。對于概念操作化和調查問卷的設計等具體操作技巧等內容,筆者則努力調動學生參與教學及增強互動等方式提高教學效果,如分組討論、課堂模擬調查、分組開展小型社會調查并進行調查體會交流等。社會統計學課程則側重對基本統計原理的理解和各種統計方法的具體應用,在教學方法上,筆者通過課堂大量例題講解和布置適當課后練習,再進行集中或個別答疑等方法使學生扎實掌握社會統計的基本方法。統計軟件課程則從分別安排理論課和上機課的模式改進為理論和上機緊密結合的上機課模式,課堂上筆者結合知識點和統計軟件的操作特點分時段講解演示操作過程和方法,及時指導學生進行上機練習,環環相扣,步步跟進。結語在社會學回復重建三十多年來,社會學課程體系不斷完善。社會研究方法在這一時期也進一步多樣化、精細化,一些方法類的課程也有所增加,上海大學社會學系增設了質性研究方法、抽樣方法、SPSS操作等課程。南開大學社會學系增設了數據分析技術、市場調查與預測等課程。北京大學社會學系增設了數據分析技術、統計指標與社會項目評估、人口統計學、市場調查與預測等課程。

第5篇

關鍵詞:全期護理模式;圍手術期;護理

    為了對采用全期護理模式對臨床手術治療患者進行護理的臨床效果進行研究分析,使臨床對手術患者在圍手術期內的需要更加了解,為臨床提供對手術患者在圍手術期進行護理的最佳方式,使患者在圍手術期內的心理狀態和生命體征能夠保持平穩,組織進行了此次研究。在研究的整個過程中,抽取90例接受手術治療的臨床確診患者,將其分為兩組,在圍手術期內分別進行常規護理和全期護理干預。對兩組患者在圍手術期內的并發癥情況、生命體征情況、心理狀態情況、患者對護理服務的滿意度進行比較分析。現將分析結果報告如下。 1 資料與方法

1.1  一般資料:2009年4月~2011年4月采用臨床研究過程中常用的隨機抽樣方法,抽取來我院就診的90例接受手術治療的臨床確診患者病例,將其分為兩組。A組患者男24例,女21例,年齡25~79歲,平均42.8歲;B組患者男23例,女22例,年齡22~81歲,平均41.4歲。抽樣患者自然資料比較,差異無統計學意義(P>0.05),具有可比性。所有患者在接受治療前,均經過相關的臨床檢查后確診,并由患者本人或家屬在同意書上簽字。

1.2  方法:將抽樣中的90例臨床確診患者,采用隨機分組方法分為A、B兩組,平均每組45例。A組患者在圍手術期內進行常規護理;B組患者在圍手術期內采用全期護理干預。對兩組患者在圍手術期內的并發癥情況、生命體征情況、心理狀態情況、患者對護理服務的滿意度進行比較分析。

1.3  統計學處理:在本次研究過程中所得到的所有相關數據,均采用SPSS 14.0統計學數據處理軟件進行處理分析,以P<0.05為差異有統計學意義。

2 結果

    經過仔細研究后我們發現,B組患者在圍手術期內出現并發癥和不良反應的例數明顯少于A組患者,且差異有統計學意義(P<0.05);該組患者在圍手術期內生命體征表現明顯優于A組患者,且差異有統計學意義(P<0.05);該組患者在圍手術期內的心理狀態評分明顯低于A組患者,且差異有統計學意義(P<0.05);該組患者對臨床護理服務的滿意度明顯高于A組患者,且差異有統計學意義(P<0.05)。詳見表1~3。

表1  兩組患者護理前后心理狀態情況比較(,分)

組別

SAS

SDS

護理前

護理后

護理前

護理后

A組

61.7±2.3

57.2±2.4

63.1±2.6

59.2±2.2

B組

62.4±3.4

42.4±3.7

62.2±4.1

44.3±3.8

P值

>0.05

<0.05

>0.05

第6篇

一、 分類討論思想

【解析】這個活動是讓同學們通過普查的方式去經歷收集、整理、描述和分析數據得出結論的統計過程,在經歷這個統計調查的過程中,感受統計的思想,建立統計的觀念,體驗統計的作用,逐步建立用數據說話的習慣. 能完成這項活動,同學們必須將各種情況分類討論,才能設計出表格,這里體現了分類思想.

二、 特殊到一般的思想方法

例2 下列調查方式,你認為最合適的是( ).

A. 日光燈管廠要檢測一批燈管的使用壽命,采用普查方式

B. 了解衢州市每天的流動人口數,采用抽樣調查方式

C. 了解衢州市居民日平均用水量,采用普查方式

D. 旅客上飛機前的安檢,采用抽樣調查方式

【解析】檢測燈管的使用壽命和了解居民日平均用水量,若采用普查方式耗時耗力;旅客上飛機前的安檢,采用抽樣調查方式不能保證萬無一失.

例3 某校為了了解全校2 000名學生的課外閱讀情況,在全校范圍內隨機調查了50名學生,得到他們在某一天各自課外閱讀所用時間的數據,將結果繪制成頻數分布直方圖(如圖所示).

(1) 這50名學生在這一天課外閱讀所用時間的眾數是多少?

(2) 這50名學生在這一天平均每人的課外閱讀所用時間是多少?

(3) 請你根據以上調查,估計全校學生中在這一天課外閱讀所用時間在1.0小時以上(含1.0小時)的有多少人?

【解析】普查通過調查總體中每個個體的情況收集數據,調查的結果準確,但往往花費多,工作量大,而且有些調查也不宜使用普查. 抽樣調查通過調查樣本來收集數據,比較經濟,工作量較小,便于進行,但樣本的抽取是否得當,直接關系到對總體的估計. 為了獲得較為準確的調查結果,抽樣時要注意所選樣本的代表性.

三、 數形結合思想

(3) 在扇形統計圖中,計算出“騎車”部分所對應的圓心角的度數.

(4) 如果全年級共500名同學,請你估算全年級步行上學的學生人數.

(1) 該校對多少名學生進行了抽樣調查?

(2) 請分別在圖1和圖2中將“抖空竹”部分的圖形補充完整.

(3) 已知該校九年級學生比八年級學生多20人,請你補全上表,并利用樣本數據估計全校學生中最喜歡踢毽子運動的人數約為多少.

第7篇

關鍵詞:統計學;教學模式;EXCEL

進入21世紀,隨著我國市場化步伐的加快,社會對新知識的需求日益增加,無論是國民經濟管理,還是公司企業乃至個人的經營、投資決策,都越來越依賴于數量分析,依賴于統計方法,統計方法已成為管理、經貿、金融等許多學科領域科學研究的重要方法。教育部也將《統計學》課程列為財經類專業本、專科專業的核心必修課程之一。力圖通過《統計學》的學習,使學生掌握探索各學科內在的數量規律性,并用這種規律性的解釋來研究各學科內在的規律。同時,由于統計學所倡導的尊重客觀實事,通過調查研究用實事說話,這也有利于培養學生的實事求是的學習、工作和科學研究精神。

一、《統計學》課程教學面臨的挑戰

1、內容日益豐富。長期以來,在我國存在兩門相互獨立的統計學——數理統計學和社會經濟統計學,分別隸屬于數學學科和經濟學學科。20世紀80年代以來,建立包括數理統計學和社會經濟統計學在內的大統計學,逐步成為我國統計學界的共識。1992年11月,國家技術監督局正式批準統計學上升為一級學科。國家頒布的學科分類標準已將統計學單列為一級學科。隨著大統計學思想的建立和統計學在實質學科中的應用的需要,大多數學校和老師在財經類專業的本、專科專業《統計學》教學過程中,除了保留社會經濟統計學原理中仍有現實意義的內容,如統計學的研究對象方法、統計的基本概念、統計數據的搜集整理、平均及變異指標、總量指標、相對指標、抽樣調查、時間序列、統計指數等;同時也系統的充實了統計推斷的內容,如:統計數據的分布特征、假設檢驗、方差分析、相關與回歸分析、統計決策等。這一變化使得《統計學》的內容更適合相關實質學科的發展需要。

2、學生的學習難度加大。首先、結合《統計學》的課程特點——概念多而且概念之間的關系十分復雜、公式多且計算有一定難度等。如果學生不做必要的課外閱讀、練習和實踐活動,是很難理解和掌握的。對于財經類專業的本、專科專業的學生來說,本身的專業課學習負擔已不輕。其次、對于財經類專業的本、專科專業的學生來說,由于其本專業的課程體系要求,使得學生的數學或者數理統計的基礎不是特別好,對于專科學生來說更不用說,推斷統計將是他們學習的困難。再說,《統計學》作為專業基礎課,一般安排在一年級或二年級第一學期,在這個學習時段也是大多數專科生和本科生忙于計算機課程和英語課程的考證時段。如果以犧牲授課內容和降低要求來減輕學生的學習負擔,顯然有悖于《統計學》課程的教學和相關專業的發展要求。所有這一切對于學生學好這一課程面臨的困難可想而知。

3、教師的教學難度加大。授課內容越來越豐富;課程難度太大可能導致學生興趣下降;在倡導學生自主性學習的背景下,授課時數大為減少(一般安排一個學期共17~19教學周,每周2~3課時);高等教育擴招后,由于師資力量一時沒有跟上,大多數學校,授課班級學生人數越來越多,一個教師跨越不同專業授課不再新鮮。這要求授課教師必須深刻領會授課內容的核心和相互關系,學會控制和駕馭課堂教學,學會激發學生的興趣,注重統計學在不同專業領域的具體應用等等。作為這門學科的授課教師特別需要認真考慮該怎么辦?

二、《統計學》教學的發展趨勢分析

1、統計學從數學技巧轉向數據分析的訓練。在計算機及計算機網絡非常普及的今天,統計計算技術不再是統計學教學的重點了。統計思想、統計應用才應該是重點。現代統計方法的實際應用離不開現代信息處理技術。統計軟件的使用,不僅使統計數據的計算和顯示變得簡單、準確,而且使統計教學由繁瑣抽象變得簡單輕松、由枯燥乏味變得趣味盎然。所以,在統計教學過程中,大量的內容只需要給學生講清楚統計基本思想、計算的原理和正確應用的條件、正確解讀計算的結果,而對大量復雜具體的計算可以交給計算機去完成。

比如方差分析,手工計算量非常大,沒有計算機軟件的支撐,是很難教學實際問題分析的。現在我們只要講清楚方差分析要做什么,為什么方差分析要解決的中心問題是判斷有無條件誤差,而原假設又是K種不同水平下總體的理論均值是否相等,檢驗結果表示什么等就可以了,大計算量的工作讓計算機去完成。

2、通過統計實踐學習統計。也就是以學生為中心,通過課堂現場教學、引導學生先讀后寫再議、模擬實驗、利用課余時間完成項目、利用假期時間,通過參加學校組織的某些團隊、小組或自己組織去開展一些與專業有關的活動,如社會調查、專題研究、提供咨詢、參與企業管理等方法。全方位地激發學生的學習興趣、培養學生的專業能力、方法能力和社會能力。

比如依同學們在設計調查問卷和調查方案的基礎上,讓他們組成若干調查小組(如以寢室為單位),在校園內真正進行一次統計調查活動,從具體調查對象和單位的確定,樣本的抽取(不一定要很大),問卷的發放、回收與審核,數據輸入與資料整理,估計與分析,一直到調查報告的編寫,調查總結或體會的形成,全部由同學自己來完成。這樣,同學們就親身參與了統計調查、統計整理和統計分析(含統計推斷)的整個過程,效果很好。

三、基于EXCEL的《統計學》教學設想

如何從煩瑣的數理統計技巧轉向數據處理的訓練,同時還要使學生容易掌握并有機會輔之于實踐。教師的導向是第一位的,要求必須選擇容易獲得而且普及性比較強的統計分析軟件,并在課堂教學和引導學生實踐中廣泛采用。

(一)微軟公司開發的EXCEL軟件無疑是我們最好的選擇

專業的統計分析軟件SPSS、SAS、BMDP、SYSTAT其功能固然強大,統計分析的專業性、權威性不可否認,但是對于沒有開設統計學專業的院校這些軟件并不常用,如果學生要進行自主性學習也比較難以找到相應的工具,此外專業統計分析軟件的英文操作界面,也讓中國人用起來不是很順手。微軟公司開發的EXCEL軟件作為一款優秀的表格軟件,其提供的統計分析功能雖然比不上專業統計軟件,但它比專業統計軟件易學易用,便于掌握。在Windows操作系統極為流行的今天,EXCEL也是隨處可見。對于《統計學》這門課程而言,利用EXCEL提供的統計函數和分析工具,結合電子表格技術,已能滿足統計方面的要求。

(二)基于EXCEL的《統計學》教學設想

1、在教學內容上,依據EXCEL的函數功能、電子表格功能、數據分析功能,結合統計學原理的基本理論和方法,整合教學內容。比如傳統的統計學原理教學過程中,對統計數據的搜集主要強調統計報表制度,在EXCEL環境應該更注重抽樣推斷,EXCEL提供的隨機抽樣工具使得抽樣調查不再是十分復雜的技術,統計圖也可以被廣泛運用于對數據的描述;再比如現有統計學教材很多都講根據整理的數據計算平均數時,都用加權平均的方法,當用組距式變量數列計算平均數時,用組中值作為各組的代表值進行計算。我們知道,組中值作為各組的代表值是假定各組變量值在組內是均勻分布的,如果實際數據與這一假定相吻合,計算結果比較準確,否則誤差比較大。事實上實際數據往往就不是均勻分布的,因此用組中值計算的平均數都是近似的,而且相同資料編制的不同變量數列計算的平均數還不相等。其實為了編制變量數列,我們必須輸入原始數據,EXCEL的有關程序可以得到準確平均數,哪里還有必要按加權算術平均的方法計算近似的平均數呢?那么有沒有必要編制變量數列、特別是組距式變量數列呢?有沒有必要按加權的方法計算平均數呢?我們認為有必要,但是組距式變量數列的主要功能不再是提供計算資料了,而是用于表現資料的分布狀況和進行分析用;加權平均方法主要是介紹和要求學生掌握加權平均的思想,用于綜合評價分析中。

2、案例教學成為《統計學》課程的重要內容。案例教學法不僅可以將理論與實際緊密聯系起來,使學生在課堂上就能接觸到大量的實際問題,而且對提高學生綜合分析和解決實際問題的能力大有幫助。結合學生所學專業精選案例教學,比如對于金融專業的學生可以設計用幾何平均數計算投資的平均收益率、運用標志變異指標考察投資組合的風險大小等。對于經管專業的學生,精選抽樣推斷、假設檢驗、方差分析對于控制產品質量,經營決策等方面的案例,深入淺出地介紹這些方法的基本思想、并用EXCEL進行分析。既激發了學生的興趣、擴大了學生的視野,也使統計學的課堂不再是教師一塊黑板、一支粉筆、一本教材、一張嘴巴就能將一門專業課程從頭講到尾。

3、改革考試方式和內容,合理評定學生成績。考試是教學過程中的一個重要環節,是檢驗學生學習情況,評估教學質量的手段。對于《統計學原理》的考試,多年以來一直沿用閉卷筆試的方式。這種考試方式對于保證教學質量,維持正常的教學秩序起到了一定的作用,但也存在著缺陷,離考試內容和方式應更加適應素質教育,特別是應有利于學生的創造能力的培養之目的相差較遠。在過去的《統計學》教學中,基本運算能力被認為是首要的培養目標,教科書中的各種例題主要是向學生展示如何運用公式進行計算,各類輔導書中充斥著五花八門的計算技巧。從而導致了學生在學習《統計學》課程的過程中,為應付考試搞題海戰術,把精力過多的花在了概念、公式的死記硬背上。這與財經類專業培養新世紀高素質的經濟管理人才是格格不入的。為此,需要對《統計學》考試進行了改革,主要包括兩個方面:一是考試內容與要求不僅體現出《統計學》的基本知識和基本運算以及推理能力,還注重了學生各種能力的考查,尤其是創新能力。二是考試模式不具一格,除了普遍采用的閉卷考試外,還在教學中用討論、答辯和小論文的方式進行考核,采取靈活多樣的考試組織形式。學生成績的測評根據學生參與教學活動的程度、學習過程中提交的讀書報告、上機操作和卷面考試成績等綜合評定。這樣,可以引導學生在學好基礎知識的基礎上,注重技能訓練與能力培養。

參考文獻:

[1]謝安邦.高等教育學[M].北京:高等教育出版社,1999.

[2]賈俊平.統計學[M].北京:中國人民大學出版社,2000.

第8篇

在醫學論文寫作中,醫學統計學方法應用是必不可少的,正確使用能保證科研工作順利進行,并使科研成果更具有科學性、代表性和可靠性。反之,如果使用不當或者誤用,會直接影響研究結果的質量,反而會使讀者產生誤解,甚至有時會導致錯誤的結論。近年來,醫學統計學方法在醫學科研中的應用越來越受到國內廣大醫學科研工作者的重視,統計分析結果表達已成為醫學論文中一個不可缺少的重要組成部分。醫學統計學是評價醫學科技論文質量優劣的重要依據,然而從近年發表的論文來看,有不少作者對統計方法的使用還不熟悉,實際應用中統計方法濫用、錯用和誤用的情況時有發生[1]。據國外20世紀60年代到80年代對不同醫學期刊的調查,有統計學錯誤的論文比例最高者達66%,最低者也有20%[2-4]。國內有學者對5種中華醫學會系列雜志論著中統計學方法的應用狀況進行了調查,結果顯示,1985年統計錯誤的論文比例為24%,1995年為36%[5]。這些調查研究均說明統計方法誤用的嚴重性以及正確應用的緊迫性。國外從20世紀70年代起就有針對醫學論文的科研設計與統計方法應用情況的調查研究,國內學者也進行了相關研究[6]。這種研究有助于及時了解醫學科研論文中統計方法的應用質量,發現存在的問題,提高醫學科研工作者應用統計方法的水平。筆者總結了近年來已發表的醫學科技論文中常見的統計學問題,希望能引起各位專家學者和臨床醫生的共識與重視,促進我國醫學期刊質量的提高。

1 統計設計存在的常見問題

統計設計是整個研究中最重要的一環,是研究工作應遵循的依據。常見的統計設計問題有:忽視組間均衡性,樣本缺乏代表性,樣本例數不足,未設置對照組,未隨機分組,未提出統計分析方法等。針對以上問題,在科研設計中一定要遵循實驗設計的四大原則即“隨機、對照、均衡、重復”的原則[6]。

1.1不遵循或不重視隨機化原則

隨機化是科研設計的重要原則,直接影響研究結果的可信度。隨機化既要隨機抽樣,還要隨機分組,并有足夠的樣本量作前提。然而,在醫學論文中許多作者對此不夠重視,主要表現在論文中統計處理隨機化不突出,隨機化缺失情況比較常見,有的論文甚至將隨機誤解為隨意、隨便,不采用隨機化處理方法,導致結果缺乏可靠性。還有些文章中沒有提出“隨機”抽樣的設計與方法,沒有排除標準,給人隨意選擇病例之感,且病例數少,因此沒有代表性,所得出的結論不可靠。部分文章雖然注明了“隨機”,但未提及采取什么方法進行隨機化研究或兩組間的例數相差甚遠,不符合隨機化的一般規律,沒有臨床參考價值[7]。

1.2缺少對照研究或對照組設計不合理

正確設立對照是臨床或實驗研究的一個核心問題,設立對照的意義在于說明臨床試驗或實驗研究中干預措施的效應,減少或防止偏倚和機遇產生的誤差對試驗結果的影響。目前,國內許多期刊發表的論文對照組設計不合理現象比較普遍,尤其有些作者對某種新藥或新技術在臨床的應用觀察研究中,不設對照組,缺乏對照觀察,得出的結論缺乏科學性,令人懷疑。有的文章雖然設立了對照組,但在分析結果時,卻沒有將試驗組與對照組的結果進行比較,而僅將各組間的自身前后進行比較,從而使該研究失去對照意義。對照組選擇不當,還表現在兩組間重要的臨床特征和基線情況相差太大,無可比性,如性別、年齡、病情、經濟情況和文化程度等不一致,如有些論文將健康人或志愿者作為對照組,使結果受到非處理因素的影響,產生偏倚或系統誤差,使結論不可信[7]。

1.3均衡性原則掌握不夠

均衡性原則要求實驗中的各組之間除處理因素不同外,其他可控制的非處理因素要盡可能保持一致。特別對疾病預后有重要影響的臨床特性一定要在組間分布均衡。各組間越均衡,可比性越強。有些作者在對病例進行分組時,忽視了均衡性原則,兩組之間沒有可比性,結論自然是錯誤的。具體表現在:有的文章對治療組與對照組的相應統一指標沒有設在均衡的水平上。對治療組情況交代的比較詳細,而對對照組的年齡、性別、病情等不予交代,或所選對照組的年齡與治療組不在一個年齡段,影響了作者對指標的觀察[7]。

1.4重復的原則掌握不好

所謂重復,一是指重復試驗或平行試驗,二是指各樣本組的例數要有一定的數量,即樣本的例數要足夠大。雖然隨機化是增強非處理因素均衡性的重要方法,但當各組內例數過少時,盡管采用了隨機化分組的方法,也難以保證非處理因素的均衡一致。在隨機化分組的基礎上,只有樣本例數足夠大,才能使非處理因素均衡一致,同時也才能使抽樣誤差減小,增強樣本對總體的代表性。一般來說,在隨機分組的前提下,樣本例數越大,各組之間非處理因素的均衡性越好;但當樣本量太大時,往往又會給整個實驗和質量控制工作帶來更多的困難,同時也會造成浪費。為此,在實驗設計時,還應保證在實驗結果具有一定可靠性的前提下,確定最少的樣本例數。一般說來,計數指標每組樣本不得少于20~30例,計量指標每組樣本不得少于5~10例。在多因素分析時,一般認為樣本例數至少為觀察指標的5~10倍[8]。

1.5樣本的含量

樣本的含量的大小直接影響到結論的可靠性。樣本量過少,則抽樣誤差大,結果可靠性差,且經不起重復驗證;反之,盲目加大樣本量也會造成人、財、物的浪費,同時也造成非抽樣誤差增大。故應在保證研究結果精確可靠的前提下,確定最小的樣本量。如某篇論文報道某藥治療的臨床療效,實際總例數為10例,其中6例有效,于是作者得出有效率為60%。顯然,有限的病例數不能充分說明該藥是否有效,作者貿然得出結論,容易給他人造成假象甚至誤導[9]。

2 統計方法選擇與使用不當

在選擇統計方法之前,首先應確定研究資料是計數資料還是計量資料。只劃分其類別而得到的資料為計數資料,也叫定性資料,如根據治療結果計算出的治愈率、陰性率、陽性率等。測定某個具體數值而得到的資料為計量資料,如血壓值、血細胞計數、血氧分壓測定等許多物理診斷和化驗檢查的結果。目前,醫學論文中計數資料最常用的統計方法為χ2檢驗,計量資料最常用的統計方法為t檢驗。值得注意的是,各種假設檢驗方法均有其適用條件,應根據資料特點來選用最適當的方法。均數與標準差分別是描述正態分布資料集中和離散趨勢的指標。能否選用“均數±標準差”來描述某一資料的分布特征,關鍵看該資料是否符合正態分布。當資料不符合正態分布或方差不齊時,應將資料轉換使之符合正態分布,方差齊性后再用t檢驗或方差分析,否則用秩和檢驗。有些作者在使用t檢驗時,未考慮到上述適用條件而盲目使用,造成統計學處理不當或統計學計算錯誤[10]。#p#分頁標題#e#

2.1統計指標應用不當

2.1.1描述計量資料的統計指標描述計量資料的統計指標主要有平均數指標(算術均數、中位數M等)和變異指標(標準差s和四分位數間距Q等),在應用時一定要注意它們各自的適用范圍。對于非對稱分布資料,算術均數不能反映數據的平均水平,應采用中位數描述。一般地,正態資料或對稱資料用描述,偏態資料用M和Q來描述。在不能確定數據的分布類型時,應選用M和Q進行統計描述。四分位數間距Q是75%分位數P75和25%分位數P25之差,即Q=P75-P25,所謂百分位數Px是將全部觀察值分為兩部分,理論上x%的觀察值比它小,(100-x)%的觀察值比它大,中位數M是50%分位數P50。、s、M、Px與Q可通過統計軟件直接輸出[9]。

2.1.2描述計數資料的統計指標描述計數資料的統計指標有絕對數和相對數。絕對數是原始資料經匯總得到的小計或總計數。相對數是兩個有關的絕對數之比,主要包括率和構成比(百分比)。醫學論文中相對數應用的主要問題之一是分母較小。分母較小時,相對數的可靠性不能保證,在這種情況下,宜直接用絕對數進行描述而不宜計算相對數。醫學論文中相對數應用的主要問題之二是將構成比誤用來說明事物發生的強度。構成比只能反映事物的內部構成,不能說明事物的發生強度。醫學的研究對象主要是人以及與人體有關的各種因素。由于生物現象的變異較大,各種影響因素又錯綜復雜,研究常是抽樣觀察,使事物本質差異與抽樣誤差混雜,故需用統計方法透過偶然現象來探測其規律性。如果不能正確運用統計學方法,造成統計學上的偏差或失誤,就很容易把本來成功的結果當成失敗而放棄,或把失敗的教訓誤認為成功的結論而加以宣傳。在進行科研設計時要嚴格遵循科學的統計學分析方法,不能留下隱患,否則,再高明的統計學專家和統計學軟件也無法彌補科研設計缺陷造成的損失。總之,統計學分析在醫學研究和論文寫作中意義重大。作者在撰寫論文時,應注意識別、總結有代表性的、有借鑒意義的統計學領域的缺陷、失誤或錯誤的多發點,特別留心易出現統計錯誤的險區,從而使論文中的統計學問題減到最低限度。認真檢查、仔細核驗,盡量避免上述錯誤,必要時還可以請統計學專家幫助把關[12]。

2.2統計方法描述或選擇不當

統計方法選擇非常重要,它直接影響結論的可靠性[12]。臨床資料的結果變量可分為計數資料、計量資料和等級資料。計數資料指將觀察對象按兩種屬性分類,如生存、死亡,治愈、未治愈,有效、無效等,通常轉化為率。如果是兩組間的比較,則采用四格表χ2檢驗或其校正公式,如果是多組間率的比較,則采用行×列表資料χ2檢驗。計量資料指對某一個研究對象用定量的方法測定某項指標得到的資料,一般均有計量單位。通常資料呈正態分布時,兩組間均數比較用t檢驗,多組間均數比較用方差分析和q檢驗。當資料不呈正態分布或方差不齊時,也可用秩和檢驗等非參數檢驗法。

2.2.1統計方法描述不清

醫學論文中常可發現作者未交代所用的統計方法,如是配對設計的t檢驗還是成組設計的t檢驗,是Ridit分析還是χ2檢驗,是作相關分析還是作回歸推斷。統計方法交代不清或根本不予交代,使讀者對論文結論的正確與否無法判斷。有的作者只提一句“經統計學處理”后,就寫出結論。有的甚至直接用P值說明問題,籠統地以P<0.05或0.01、P>0.05便稱結果差異有無顯著性,P值的大小不說明差值的大小,它還與抽樣誤差大小有關[13]。因此,還應寫明具體的統計方法,如有特殊情況,還應說明是否采用了校正,應寫出描述性統計量的可信區間,注明精確的統計量值和P值,然后根據P值大小作出統計學推斷,并作出相應的醫學專業結論。

2.2.2假設檢驗方法交代不清不交

代假設檢驗方法或假設檢驗方法交代的不具體、不清楚是醫學科研論文中常見的錯誤。如果不交代假設檢驗方法或假設檢驗方法交代的不具體,讀者就無法考察論文的統計學方法選擇的是否正確,無法核對計算結果是否準確。每一種假設檢驗方法都有其特定的適應條件和嚴格的適用范圍。對于同一組資料,采用不同的假設檢驗方法可能得出截然相反的結論。如將配對設計的資料按成組設計資料的方法處理,將會損失樣本提供的信息、降低檢驗效率,可能使原本有統計學意義的結果無統計學意義[14]。在論文寫作時,不但要交代選用的是什么統計學方法,而且統計學方法要盡可能具體。如選擇t檢驗,要說明是配對t檢驗,還是成組t檢驗;選擇方差分析時,要說明是完全隨機設計的方差分析,還是配伍組設計的方差分析。對于四格表資料,應說明是一般四格表χ2檢驗、配對四格表χ2檢驗及四格表資料的精確概率法等。

2.2.3統計方法選擇常見錯誤

①誤用χ2檢驗。χ2檢驗有一定的適用條件,n>40且理論數(T)>5時,可用一般χ2檢驗;n>40,但至少有1個T>1且T<5時,可用校正χ2檢驗;n<40或T<1時用χ2檢驗的確切概率法[15]。②t檢驗誤用于多組資料的比較。在醫學期刊中常會出現將t檢驗誤用于多組資料的比較。多組資料的比較應該采用方差分析(F檢驗),當差異具有統計學意義時,再進一步作兩兩比較。當各組均與一個對照組比較時采用Dunnettt檢驗;當各組相互循環比較時,則常采用Student-Newman-keuls(SNK)檢驗,又稱q檢驗[16]。③配對t檢驗與成組t檢驗誤用。大部分論文只注明采用t檢驗,而未注明是配對t檢驗還是成組t檢驗。配對t檢驗常用于處理前后的自身對照,即差值均數與總體均數“0”的比較;成組t檢驗適用于成正態分布的兩個小樣本均數間的比較。④資料不呈正態分布時未用非參數檢驗。t檢驗F檢驗等適用于呈正態分布、方差齊且有確切的測量數值的資料,而非參數檢驗(如符號檢驗、秩和檢驗Wilcoxon法、秩檢驗-KruskalWallis法、Friedman法、Ridit分析、Seperman相關等)對資料無特殊要求,對按大小順序、評分、等級、反應程度甚至色調深淺等資料都可進行分析比較[17-18]。因此,對于多組計量資料的比較,呈正態分布且方差齊時用F檢驗,方差不齊時可用變量變換,或采用秩和檢驗;對于兩個小樣本均數的比較或處理前后的比較,方差齊時用成組t檢驗或配對t檢驗,方差不齊時用t′檢驗[19]。

3結果解釋時存在的問題

統計分析的結果是無效假設或是不能無效假設。無效假設在一般的統計檢驗為兩組總體參數相等。無效假設只能說兩組總體參數不相等而并不能說兩組相差很大。兩組相差如何要對可信區間進行研究觀察后得出。由于統計檢驗不能得出差別的大小,因而結論不能說“有明顯差異”或“有顯著差異”,也不能說“差異非常顯著”,更不能說“差異明顯”。在國外的統計書籍上的英語表達為“significant”,它的正確意義應當是“有意義的、有重要性的”。俄語為“Значмый”和日語中的“有意”也是這個意思。國內只有極個別的英漢詞典把“significant”誤譯為“顯著的”。正確的說法應當是“差異有統計學意義”或“差異有高度統計學意義”等[20]。在解釋差別有統計學意義的結果時,有些人常常根據P值的大小作出對實驗效應差別程度不同的專業結論[21]。例如某實驗研究,比較甲、乙兩種治療方法對某病的治療效果(假定甲法的療效優于乙法),若得到“P<0.001”,則認為甲法極顯著優于乙法;若得到“P<0.01”,則認為甲法非常顯著優于乙法;若得到“P<0.05”,則認為甲法顯著優于乙法。犯這種錯誤的原因是錯誤的理解了統計學中P值的概念[7]。統計學上根據假設檢驗原理推算出來的P值表示拒絕特定的無效假設可能犯假陽性錯誤的概率。P值的大小并非指差異的太小,只能反映兩者相同或不相同。P值越小,說明越有理由認為兩種處理方法效果不同,而不能反映對比的兩組或多組之間差異的大小。差異的大小只能根據專業知識來確定。此外,甚至在部分投稿文章中未交代所采用的統計分析方法,也未見應用統計學的跡象,僅從各組數據的均數大小做出了統計推斷。醫學期刊論文中暴露出來的統計學錯誤,從表面上看是編輯部和審稿者把關不嚴所致。事實上,即使審稿時發現了上述錯誤,也無法改正。因為實驗設計的錯誤只有在科研工作開始之前才有可能得到糾正。即使編輯工作者能夠阻止有嚴重統計學問題的,也僅僅是治標而已。如何使廣大醫學論文作者在醫學研究中正確應用統計學,提高科研質量才是治本[7]。#p#分頁標題#e#

4對策與建議

眾所周知,統計學是從事科學研究不可缺少的工具。從試驗設計、資料收集與表達、數據處理和結果分析,每一個環節都需要正確地運用統計知識,才能真正發揮統計學在科學研究中應起的作用。然而,在已出版和發表的一些學術專著和論文中、通過評審的科研成果和答辯的學位論文中,經常可以看到忽視、輕視和誤用統計學的現象[22]。

知識應完善編輯人員的知識結構,保證統計學應用的準確性。為此,可定期聘請統計學專家對審稿人員進行統計學知識培訓。科技期刊的群體效應理論[23]認為,期刊編輯的專業結構應多元化,以利于編輯互相學習,實現知識互補。醫學期刊編輯部可考慮聘用統計學專業的研究生作為編輯。編輯應將醫學統計學作為自己的必修課,通過多種方式,如自學自修,參加講座或培訓班學習統計學知識,有條件的編輯部,如醫學院校學報編輯部,可以有計劃地組織編輯參加本科生或研究生醫學統計學課程的學習,也可鼓勵編輯人員在職攻讀統計學專業研究生學位。這樣,可以提高全體編輯人員的統計學水平,最終使編輯和審稿人都能夠發現論文中存在的統計學錯誤,并指導作者修改,正確進行醫學論文中有關統計學分析的描述[24]。另外,有關職能部門或學會可組織與醫學統計學相關的培訓班,聘請統計學專家講課,對編輯人員進行定期統計學知識培訓,加強科研設計、統計學知識的學習[19]。

4.2加強醫學統計學專家審稿

醫學研究論文專業性強,經常涉及統計學處理問題,有時會遇到統計方法復雜的稿件,這不僅需要本學科專家審稿,而且需要醫學統計專家把關,只有這樣,才能保證論文所報道的研究成果的真實性和可靠性。醫學期刊編委會中應有統計學專家,專門負責稿件統計學方面的審查工作。

4.3強化作者的統計學意識

第9篇

[關鍵詞] 大數據時代;數據質量;信息孤島

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2016. 23. 093

[中圖分類號] TP311 [文獻標識碼] A [文章編號] 1673 - 0194(2016)23- 0178- 02

1 大數據與大數據時代

近年來,隨著英國維克托?邁爾-舍恩伯格的《大數據時代》和美國Bill Franks的《駕馭大數據》等著作的出版,大數據引起了社會的廣泛關注,人們已經意識到大數據時代正在呼嘯而至。大數據幾乎對每個領域都會產生影響,所以限于不同領域各自的特點,對大數據的表述也不同,但是一個廣泛的觀點是:“大數據是一個數據集合,這個數據集合是無法在規定時間里用常規軟件工具對它進行搜集、整理和分析的。”

2 大數據時代對統計數據的挑戰

大數據時代需要既講機遇也講挑戰。各個應用領域的不斷變化使得統計學成為一門難以成熟的學科。所以在數據分析的世界里,統計學發展的終身動力是不斷提高駕馭數據的能力。大數據是推斷數據,不是原始數據,所以會存在抽樣偏倚、隨機的和非隨機的誤差。數據包括原始數據和推斷的數據。數據的認知范圍有限,所以數據可解釋的范圍就有限。模型是對數據信息的匯總,由于數據信息有限,所以模型可解釋的程度也有限。超出模型可解釋的程度,就是對模型進行一系列的假設。大數據方法研究需要多學科的聯合,統計學家需要關注實時決策和計算機資源,計算機學家需要了解算法和統計推斷的復雜性。

3 大數據時代對統計數據質量的影響

3.1 大數據時代對數據時效性的影響

庫克耶和舍恩伯格認為:大數據不用抽樣調查的方法,而用所有數據的方法。數據科學家甚至提出“樣本=總體”,這或許意味著統計工作重心要轉移。舍恩伯格和庫克耶認為抽樣調查有很多自身的不足:一是樣本的隨機性很難實現;二是不適合考察有子類別的情況;三是采樣忽略了細節的考察,而大數據分析則可以彌補抽樣調查的這些不足之處。如果說之前統計工作的重點在于數據搜集和整理,那么大數據時代統計工作的重心就是如何搜集整理分析有用的信息。這樣一來,已經得出的數據結論可能不具有這個時代的特點,即失去了時效性。

3.2 大數據時代對數據真實性的影響

大數據時代除了對數據的時效性有影響之外,對數據的真實性也有影響。由此,當通過網絡搜集數據時,首先需要考慮的是,數據是否是由自動化算法系統產生?如果是,究竟有多少?以淘寶網為例,大量的虛假評論已經影響了信息的真實。

4 大數據時代統計工作的應對之策

大多數的研究指出,當前統計方面存在的問題在于業務部門沒有利用好大數據導致數據資源缺乏;企業內部信息孤島導致數據的有效信息無法充分利用;工作人員數據分析能力差導致大數據時代下統計工作很難進行。

4.1 國家應對之策

在大數據時代下,要保障統計數據質量,國家應當做到以下幾點:

(1)盡快改革當前統計管理體制的制約,保證統計獨立調查、獨立報告、獨立監督的職權不受侵犯。在大數據時代,統計體制改革要與時俱進,盡快建立符合我國國情的統計管理體制。

(2)充分發揮黨委政府的主導作用,賦予各其統計數據質量的主體責任。要發揮各級地方黨委政府對本區域統計數據質量的主體責任,將統計數據質量的好壞作為考核一個地區領導業績的主要方面之一。

(3)盡快建立引導一個提速增效的統計考核評價指標體系,完善黨政領導的績效考評機制。

4.2 企業應對之策

企業應做到以下幾點:信息以數據形式呈現,強化建設數據標準;融合結構化和非結構化數據;推廣應用大數據,促進使用信息資源;重視數據的安全管理。

4.3 個人應對之策

統計學家必須積極學習新事物,適應大數據環境,拓展統計學的應用領域,創造出新的統計方法。大數據時代帶給我們的挑戰與機遇并存。

主要參考文獻

[1]朱建平,章貴軍,劉曉葳.大數據時代下數據分析理念的辨析[J].統計研究,2014(2).

[2]鄭京平,王眾全.官方統計應如何面對BigData挑戰[J].統計研究,2012(12).

[3][英]維克托?邁爾-舍恩伯格.大數據時代――生活工作與思維的大變革[M].周濤,譯.杭州:浙江人民出版社,2013.

[4]Brian Hopkins,Boris Evelson.Expand Your Digital Horizon with Bigdata[N/OL],2011-09-30.

[5]邱東.大數據時代對統計學的挑戰[J].統計研究,2014(1).

主站蜘蛛池模板: 交换同学会hd中字| 胸奶好大好紧好湿好爽| 精品国产免费一区二区三区 | 亚洲欧洲美洲无码精品VA| 中文字幕av一区| 香蕉网在线播放| 欧洲精品码一区二区三区免费看| 在线观看一区二区精品视频| 六度国产福利午夜视频黄瓜视频| 久久夜色精品国产噜噜亚洲a| 亚洲制服丝袜第一页| 毛片在线高清免费观看| 天堂在线免费观看mv| 免费看美女隐私全部| 三级毛片在线播放| 美女扒开粉嫩尿口漫画| 无码av中文一区二区三区桃花岛| 国产免费一区二区三区不卡| 么公的又大又深又硬想要小雪| 无遮挡1000部拍拍拍免费凤凰 | 久久精品国产精品亚洲蜜月| 浮力影院亚洲国产第一页| 欧美日韩国产在线人成| 国产超碰人人模人人爽人人添 | 色窝窝亚洲AV网在线观看| 日韩三级一区二区三区| 国产成人免费片在线观看| 亚洲V欧美V国产V在线观看| 手机1024看片| 欧美一级免费看| 国产欧美在线视频免费| 亚洲Aⅴ在线无码播放毛片一线天 亚洲A∨无码一区二区三区 | 亚洲国产日韩在线| a破外女出血毛片| 激情吃奶吻胸免费视频xxxx| 天堂在线www资源在线下载| 人妻少妇乱子伦无码专区| acg全彩无遮挡口工漫画网址| 激情综合色五月丁香六月欧美| 国精品无码一区二区三区在线 | 男女下面一进一出视频在线观看|