1Stata简介主讲乔世君内蒙古大学经济管理学院2内容界面数据输入数据处理描述统计变量生成作图回归估计后检验预测边际效应和弹性报告生成Do文件3界面Command窗口Results窗口Variable窗口Review窗口4窗口Command:命令输入,回车执行,用PageUp查找前面执行过的命令Review:显示前面执行过的命令,可用鼠标重新选择,执行或修改Variable:显示当前的变量,可用鼠标选择变量,使其进入命令行5编辑器DataEditor:数据输入、编辑和浏览DofileEditor:程序编辑6运行模式交互式:Command,菜单批处理模式:Do文件7数据输入Opern:打开已有的.dta数据DataEditor:键盘输入,或者将电子表格式的数据(比如Excel)通过复制粘贴输入Import:调入ASCII,SAS等格式的数据8浏览数据list(ypith)describe:数据集的基本信息DataeditorDatabrowser9数据处理描述统计变量生成作图回归10描述统计summarizeypi,detailcorrelateptptih注1:在不引起混乱的情况下,可以将命令简写成前几个字母注2:用sum发现数据数量级的差异,然后除以或者乘以比例常数,将数据调整到相同的数量级。比如,replacew=w/100011变量生成genly=ln(y)gent2=t^2ift1700replacet2=tift=1700工具变量的生成genD85=(year==1985)genD85=0replaceD85=1ifyear==1985genD=(year=1985)genD6=(year==1966|year==1976|year==1986)12变量生成时间序列分析常用:tssetyear时间序列分析常用算子L.滞后算子,L.yL4.yF.领先算子,F.yF2.yD.差分算子,D.yD2.yS.季节差分,S12.y(=y-L12.y)_n,观测序号(保留)gentime=_n:用1开头的自然数列表示时间genly1=y[_n-1]:滞后一期变量genly1=L.y:滞后一期变量genfy1=y[_n+1]:领先一期变量genfy1=F.y:领先一期变量gendy=D.ygendy=y-L.y(或者=y-y[_n-1])13作图twoway(scatteryp)twoway(lineyp)histogramy,bin(20)14回归regressypithregressypithifyear=1970regressypith,noconstantregressypith,beta15其他的回归命令areganeasierwaytofitregressionswithmanydummyvariablesarchregressionmodelswithARCHerrorsarimaARIMAmodelsboxcoxBox-Coxregressionmodelscnregcensored-normalregressioncnsregconstrainedlinearregressioneivregerrors-in-variablesregressionfrontierstochasticfrontiermodelsheckmanHeckmanselectionmodelintregintervalregressionivregresssingle-equationinstrumental-variablesregressionivtobittobitregressionwithendogenousvariablesneweyregressionwithNewey-Weststandarderrorsqregquantile(includingmedian)regressionreg3three-stageleast-squares(3SLS)regressionrregatypeofrobustregressionsuregseeminglyunrelatedregressiontobittobitregressiontreatregtreatment-effectsmodeltruncregtruncatedregressionxtabondArellano-Bondlineardynamicpanel-dataestimationxtdpdlineardynamicpanel-dataestimationxtfrontierpanel-datastochasticfrontiermodelxtglspanel-dataGLSmodelsxthtaylorHausman-Taylorestimatorforerror-componentsmodelsxtintregpanel-dataintervalregressionmodelsxtivregpanel-datainstrumentalvariables(2SLS)regressionxtpcselinearregressionwithpanel-correctedstandarderrorsxtregfixed-andrandom-effectslinearmodelsxtregarfixed-andrandom-effectslinearmodelswithanAR(1)disturbancexttobitpanel-datatobitmodels16估计后(postestimation)检验预测边际效应和弹性报告生成17检验交互式:menustatistics/postestimation/…command:test(lpli)test(lp=2*lt)testnl(_b[lp]/_b[li]=_b[lt]/2)(log(_b[lh])=_b[lp])lincom3*lp-2*linlcom_b[lp]^3/_b[lt]18reportandstatistics交互式:menustatistics/postestimation/reportandstatistics主要功能多种异方差检验Breusch-Godfrey自相关LM检验DW检验方差膨胀因子:考察多重共线性Ramseyreset信息准则19预测predictlyf,xbpredictlye,residualspredictnlyf=exp(lyf),se(lyf_se)20边际效应和弹性交互式:menustatistics/postestimation/marginaleffectsorelasticities可以在样本平均数、中数和用户指定的数值处计算边际值或弹性,并计算其标准差、z统计量,p值和置信区间。21报告生成交互式:menustatistics/postestimation/manageestimationresults/tableofestimationresults生成回归报告,可以用星号表示显著性,也可以报告t统计量、标准差或p值。生成的表格按解释变量顺序从上到下排列,是论文中报告结果的常用形式。22Do文件*东南运输局clearuseI:\notebook\F\Fbackup\讲义\dongnanyunshuju.dtalabeldata麦圭根,第九版,p156labelvariableyearYear,1966-1992labelvariabley每周乘客数,千人labelvariablep票价,美分/人labelvariablei当地人均收入labelvariablet市区人口,千人labelvariableh市区每小时停车费用,美分describesummarizegenerately=ln(y)//每周乘客数的对数generatelp=ln(p)//价格的对数generateli=ln(i)//收入的对数generatelt=ln(t)//人口的对数generatelh=ln(h)//停车费用的对数regresslylpliltlh23(续)//hypothesistestingtestlplitestlp+li=0//predictionpredicte,residualpredictlyhat,xbtwowayscatterelyhat24运行的两种方式do:执行的同时,显示运行结果。在需要大量循环时,这个方式并不方便。run:静默地运行,适用于大量计算。