汽车电脑维修电脑维修学习网

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page1Howcanmultipleregressionhandlenonlinearrelationships?為何迴歸稱之為”線性”迴歸?當我們不知道真正關聯的型式時,我們從最簡單的關係著手。即使真正的關連形式不是線性,線性關係往往也是真正關係形式很好的近似值。我們可以很容易修改線性關係來代表非線性關係的形式。汽车防盗器©Kuo-HsienSu2002Page2ProportionandpercentagesProportion小數點百分比:二位整數例:男性所佔的比例為.82,男性佔82%社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page3ProportionatechangeorrelativechangeProportionatechange(比例變動):dividethechangeofxbyitsinitialvalue.Percentagechange(百分比變動):Percentagepointchange(百分點的變動):兩個百分比分數的差距0001/)(xxxxx)(100%0xxx社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page4Proportionatechangeorrelativechange調薪之後,蘇老師的薪水從75000變成77250,今年的加薪幅度為(77250-75000)/75000=0.03或100(0.03)%蘇老師的家庭負擔從60000漲成69525,從原來的80%變成90%,百分點的變動增加了10個百分點。家庭負擔的比例變動為125.0801080/)8090(增加了百分之12.5社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page5Thenaturallogarithm在之前的電腦練習中,我們曾經介紹過如何將非常態分配的變數(如收入)透過log的轉換之後變成常態分配。一般而言,在做log轉換時,我們同常使用以e(e=2.71828)為底的自然對數naturallog。社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page6Thenaturallogarithm將等號兩邊取exponential。22110xBxBBy22110)ln(xBxBBy22110xBxBBey社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page7Thenaturallogarithm將依變數取log有幾個優點:–常態化–有些變數的值不可能為負(如收入),取log之後可以確保無論B及X的數值為何,y的預測值永遠為正。–X對Y的影響解釋有特殊的意涵22110)ln(xBxBBy社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page8Thenaturallogarithm在普通線性關係中,迴歸係數的解釋為每增加一單位x1,對於y值所造成的絕對量的變動。將y取log後,迴歸係數可以解釋成每單位X的改變,對Y所造成的百分比的變動。22110)ln(xBxBBy社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page9Thenaturallogarithm)(279.33)(927.8262.15educsenincome其他條件不變,年資每增加一年,收入增加8.9千元。其他條件不變,教育年數每增加一年,收入增加3.3萬元社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page10Thenaturallogarithm)(0638.0)(0173.0157.5)ln(educsenincome假設年資為0,教育程度從9年增加成10年,收入增加多少?此一年的收入增加了多少百分比(比起教育程度為9年的收入)?genlnincome=ln(income)社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page11Thenaturallogarithmeeducsenincome)(0638.0)(0173.0157.5)ln(教育程度10年的收入6522.328)10(0638.0)0(0173.0157.5eincome3391.308)9(0638.0)0(0173.0157.5eincome教育程度9年的收入20.313百分比變動=20.313/308.3391=6.5879%065879.10638.0e社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page12Thenaturallogarithmeeducsenincome)(0638.0)(0173.0157.5)ln(假設年資為0,教育程度從16年增加成17年,收入增加多少?此一年的收入增加了多少百分比(比起教育程度為16年的收入)?教育程度17年的收入6797.513)17(0638.0)0(0173.0157.5eincome6522.328)16(0638.0)0(0173.0157.5eincome教育程度16年的收入31.7492百分比變動=31.7492/328.6522=6.5879%社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page13Thenaturallogarithmeeducsenincome)(0638.0)(0173.0157.5)ln(教育程度從9年增加成10年,收入增加20.313教育程度從16年增加成17年,收入增加31.749但兩者所造成的百分比變動皆為:5879.6)1(100)1(1000638.0eeb當依變數取log後,迴歸係數可以解釋成對Y所造成百分比的變動社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page14Modelsinvolvingpolynomials在迴歸方程式中,有時自變數以二次項(parabola)或三次項(cubicpolynomial)的型態出現。X年資收入XY102210XXY332210XXXY社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page15QuadraticFunction二次函數當B10B20時,此曲線有極大值,且極大值為:2210xxy)2/(21*x我們稱上述函數為具有遞減邊際效果(diminishingmarginaleffect),其斜率為:xxyslop212其斜率不是一個固定值,隨x值不同而有變化。社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page16QuadraticFunction二次函數2286xxy2)2*2/(8)2/(21*x社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page17QuadraticFunction二次函數2286xxyxxyslop48X=2,slop=0X=1,slop=4X=3,slop=-4社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page18二次式模型AGE706050403020INCOME302826242220181614121086420(-12.19)(14.30))65.5(80.1605.658,103.819,122iixxy二次式模型2449.09.4005.380iiAgeAgeincome202938475665AGE0200400600INCOMEgenagesqr=age*age社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page20二次式模型AGE6050403020INCOME2000180016001400120010008006004002002449.09.4005.380iiAgeAgeincome社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page21HowcanIcheckfornonlinearity?從scatterplots看資料分佈的情形。加入二次項檢視其迴歸係數是否顯著。以dummyvariable來檢查非線性關係。練習:檢查教育程度與收入是否具有非線性關係?社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page22HowcanIcheckfornonlinearity?社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page23HowcanIcheckfornonlinearity?qfit:quadraticpredictionplot社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page24HowcanIcheckfornonlinearity?2680.1759.545.306iieduceducincome05101520EDUC02004006008001000INCOME二次項顯著表示非線性的適合度可能較好社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page26以dummy來檢驗非線性關係omitcategory為0-6年的教育程度。recodeeduc(7/9=2)(else=0),gen(ed2)recodeeduc(10/12=1)(else=0),gen(ed3)recodeeduc(13/16=1)(else=0),gen(ed4)recodeeduc(17/max=1)(else=0),gen(ed5)社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page27以dummy來檢驗非線性關係社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page28練習分析年資與性別對於收入的影響。控制性別後,年資是否對於收入有非線性的影響?加入年資的二次式來檢定非線性的關係。社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page29二次式模型+Dummyvariables2)(162.0)(20.1067.481iisensenincomemale2)(162.0)(20.10)02.15467.481(iisensenincomefemale社會統計與資料分析2019/8/14Copyright©Kuo-HsienSu2002Page30二次式模型+Dummyvariables2)(162.0)(20.1067.481iisensenincomemale2)(162.0)(20.10)02.15467.481(iisensenincomefemale0714212835SEN0100200300400500600700INCOME0714212835SEN0100200300400500600700INCOME

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功