高級統計師考試《高級統計實務與案例分析》備考:應用直線相關與回歸
【資料圖】
數據匯總整理與統計分析模塊(五)數據匯總整理與統計分析
第六章 相關與回歸分析
6.5 應用直線相關與回歸時應注意的問題在定性分析的基礎上進行定量分析,是保證正確運用回歸分析必要條件。回歸分析是一種定量分析的方法。所謂定性分析是對所研究的客觀現象的性質和變量之間內在聯系的分析。建立回歸模型,首先要熟悉研究理解本身的科學理論知識或有關專業方面的知識。在此基礎上才能正確選擇哪些變量作自變量,什么變量作因變量。1、作回歸分析要有實際意義,不能把毫無關聯的兩種現象,隨意進行回歸分析,忽視事物現象間的內在聯系和規律;如對兒童身高與小樹的生長數據進行回歸分析既無道理也無用途。另外,即使兩個變量間存在回歸關系時,也不一定是因果關系,必須結合專業知識作出合理解釋和結論。2、直線回歸分析的資料,一般要求應變量Y是來自正態總體的隨機變量,自變量X可以是正態隨機變量,也可以是精確測量和嚴密控制的值。若稍偏離要求時,一般對回歸方程中參數的估計影響不大,但可能影響到標準差的估計,也會影響假設檢驗時P值的真實性。3、進行回歸分析時,應先繪制散點圖。若提示有直線趨勢存在時,可作直線回歸分析;若提示無明顯線性趨勢,則應根據散點分布類型,選擇合適的曲線模型),經數據變換后,化為線性回歸來解決。一般說,不滿足線性條件的情形下去計算回歸方程會毫無意義,最好采用非線性回歸方程的方法進行分析。4、繪制散點圖后,若出現一些特大特小的離群值(異常點),則應及時復核檢查,對由于測定、記錄或計算機錄入的錯誤數據,應予以修正和剔除。否則,異常點的存在會對回歸方程中的系數a、b的估計產生較大影響。5、回歸直線不要外延。直線回歸的適用范圍一般以自變量取值范圍為限,在此范圍內求出的估計值稱為內插(interpolation);超過自變量取值范圍所計算的稱為外延(extrapolation)。若無充足理由證明,超出自變量取值范圍后直線回歸關系仍成立時,應該避免隨意外延。
真題解析:【例題】(2006年)在一項關于某種谷物產量的研究中,從10個試驗田得到的數據如下表:
產量Y | 50 | 52 | 56 | 59 | 62 | 64 | 68 | 69 | 70 | 71 |
所施肥料X1 | 38 | 39 | 39 | 41 | 44 | 42 | 43 | 46 | 48 | 47 |
土質指數X2 | 50 | 50 | 54 | 56 | 56 | 60 | 64 | 63 | 62 | 60 |
對表中的數據進行多元線性回歸分析,模型結果為:
要求回答:1. 模型參數的經濟意義是什么?
【分析與提示】1. 模型參數的經濟意義是y代表谷物產量,x1代表所施肥料,x2代表土質指數。2. F說明回歸方程的顯著性檢驗F檢驗的統計量,R2 是判定系數,t說明回歸參數的顯著性檢驗t檢驗的統計量。
[考試報名]全國高級統計師考試時間|報名時間|報名入口[成績查詢]全國高級統計師考試成績查詢時間|查詢入口[真題答案]全國高級統計師考試歷年真題及答案解析[考試政策]高級統計師報考條件|免考條件|考試科目[培訓課程]最新高級統計師資格考試高清視頻輔導課程試聽標簽: