浙大生物统计实验报告1

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

课程名称:生物统计与实验设计姓名:赵应学院:农业与生物技术学院系:应用生物科学专业:应用生物科学学号:3140100080指导教师:朱军、徐海明2016年4月11日实验报告课程名称:生物统计与实验设计指导老师:徐海明成绩:________________实验名称:简单统计分析和简单线性回归实验类型:综合实验同组学生姓名:无一、实验目的和要求初步了解Excel软件的数据分析功能,掌握连续变量和离散变量的样本资料简单统计分析的方法,掌握简单回归模型的分析方法。二、实验内容和原理1、连续变量的统计分析方法;2、离散变量的分析方法;3、简单回归模型的统计分析方法。三、主要仪器设备一台装有excel和SAS软件的PC四、操作方法和实验步骤1、实验数据的生成:本实验所用的数据需要基于设置的参数,运行计算机模拟软件(QTLSimulation.exe)产生。先打开参数设置文件SimPar.txt,用自己的学号替换第一设置行“Theseedforinitilizingtherand()=2551949”中的随机数发生器的种子“2551949”。然后重新保存设置文件。运行模拟软件时需要输入参数设置文件名。模拟软件产生三个文件,DHSim.Par是基因数目、位置、效应的参数文件,DHSim.Map是分子标记遗传图谱的文件,DHSim.Txt是基因定位遗传群体(样本数n=200)的分子标记和二个环境模拟性状的表现型值的文件。以DHSimuData.xls文件的格式,整理可分析的数据文件。计算机模拟的参数设置如下:表1参数设置QTLChromosomeMarkerIntervalDistance(cM)AAE1AE21133.04.704.47-4.472178.00.000.000.003245.0-4.100.000.004362.00.000.000.005331.03.50-3.163.16表2参数设置InteraQQAAA专业:应用生物科学姓名:赵应学号:3140100080日期:2016年4月11日地点:紫金港西1-106(多)装订线ctionTL-iTL-jAAE1AE21123.200.000.002130.00-4.204.20324-3.003.16-3.162、实验数据的分析:采用Excel软件整理数据,采用Excel对样本资料进行简单的统计分析和简单回归分析,如下:a)连续变量的统计分析:采用Excel分别计算仿真群体的表现型数据的样本均值、样本方差、标准误。b)离散变量的统计分析:对各分子标记位点,采用Excel计算仿真群体的分子标记基因型频率、样本频率的方差、标准误。c)简单回归模型的统计分析方法;采用Excel以环境一的数据为依变量,以环境二的数据为自变量,计算简单线性回归系数的估计值及其标准误、计算各项变异的自由度、平方和、均方。采用Excel分别以二个环境的表现型数据为依变量,分子标记为自变量,计算仿真群体表现型数据与分子标记的简单相关系数。五、实验数据记录和处理表3连续变量的统计分析表现型方差表现型标准差表现型标准误环境1173.143597713.158404070.930439675环境294.651161719.728882860.687935904均值95%下限均值95%上限方差95%下限方差95%上限环境1102.2243844105.8939576143.58902212.91719环境296.8322499.5454078.49477116.39390表4离散变量的统计分析均值方差标准误A的频率0.4939390.000340.003211B的频率0.5060610.000340.003211以环境一的表现型值为依变量,以环境二的表现型值为自变量,运行sas程序,得到:表5仿真群体表现型数据与分子标记的简单相关系数Mk1Mk2Mk3Mk4Mk5Mk6Mk7Mk8Mk9环境1-0.40929-0.51972-0.67318-0.616-0.53924-0.40714-0.35012-0.29228-0.27644环境2-0.06068-0.0452-0.015160.0764560.1130360.0799870.0450660.045995-0.02191Mk10Mk11Mk12Mk13Mk14Mk15Mk16Mk17Mk18环境1-0.19791-0.200390.1902740.194260.2731340.3249830.2727910.2170110.188191环境2-0.05579-0.075730.2174890.2539640.2903370.3997820.3680530.2570150.238907Mk19Mk20Mk21Mk22Mk23Mk24Mk25Mk26Mk17环境10.124310.0713190.0629180.0403910.005624-0.01162-0.06373-0.17677-0.14065环境20.2715750.2604550.1944540.15109-0.33-0.32322-0.39922-0.49479-0.56993六、实验结果与分析1、检验群体均值和方差与零是否存在显著差异用二尾检验:H0:u=0H1:u≠0均值用t检验,得出环境1、2均值都存在显著差异H0:σ2=0H1:σ2≠0方差用卡方检验,得出环境1、2方差存在显著差异2、计算仿真群体各分子标记位点的基因型95%置信区间,检验分子标记基因型频率是否符合1:1的分离比例标记型A的95%置信区间:0.493939±0.009403,因0.5属于其中,故符合1:1比例3、对二个环境表现型值的线性回归关系进行评价:两个环境的表现型值的R2=0.0136,由此可知两者之间基本上不存在线性回归关系。4、以二个环境的表现型值为依变量,以分子标记为自变量,进行多元回归分析:在SAS中对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:Mk28Mk29Mk30Mk31Mk32Mk33环境1-0.1258-0.11172-0.10073-0.09094-0.09902-0.08927环境2-0.66838-0.65725-0.47147-0.42518-0.38046-0.3616对环境1的表现型值与分子标记进行逐步回归(slstay和slentry均取0.01)如下:由此推断:环境1的数量性状基因在Mk3、Mk15、Mk5附近;环境2的数量性状基因在Mk28、Mk15、Mk29附近。七、讨论、心得1、通过本次实验,我初步了解了Excel软件的数据分析功能,掌握了连续变量和离散变量的样本资料简单统计分析的方法,以及简单回归模型的分析方法;2、对于大量数据的分析统计,SAS使用起来更方便,但是命令太多,需要一定时间熟悉各种命令;3、实验数据是通过程序产生的,对于实际的生物学研究没有太大联系,但是其中所用到的数据处理分析方法却是生物学研究必不可少的。

1 / 8
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功