1. 首页
  2. 文档大全

第八章双变量回归与相关

上传者:7****0 2022-05-30 00:03:35上传 PPT文件 290KB
第八章双变量回归与相关_第1页 第八章双变量回归与相关_第2页 第八章双变量回归与相关_第3页

《第八章双变量回归与相关》由会员分享,可在线阅读,更多相关《第八章双变量回归与相关(41页珍藏版)》请在文档大全上搜索。

1、1021第八章双变量相关与回归1022双变量计量资料:双变量计量资料:每个个体有两个变量值每个个体有两个变量值 总体:总体:无限或有限对变量值无限或有限对变量值 样本:样本:从总体随机抽取的从总体随机抽取的n n对变量值对变量值 (X1,Y1), (X2,Y2), , (Xn,Yn) 目的:目的:研究研究X X和和Y Y的数量关系的数量关系 方法:方法:相关与回归相关与回归 简单、基本简单、基本直线相关、直线回归直线相关、直线回归1023第一节 直线相关1024 直线相关(linear correlation)又称简单相关(simple correlation),用于双变量正态分布(bivar

2、iate normal distribution)资料。其性质可由图9-6散点图直观的说明。 目的:研究 两个变量X,Y数量上的依存(或相关) 关系。 特点:统计关系一、直线相关的概念1025二、相关系数的意义与计算 1. 意义:相关系数意义:相关系数(correlation coefficient)又)又称称Pearson积差相关系数,用来说明具有直线关系的积差相关系数,用来说明具有直线关系的两变量间相关的密切程度与相关方向。两变量间相关的密切程度与相关方向。以符号r表示样本相关系数, 符号表示其总体相关系数。 相关系数没有单位,其值为相关系数没有单位,其值为-1 -1 r r 1 1。r

3、r值为正值为正表示正相关,表示正相关,r r值为负表示负相关,值为负表示负相关,r r的绝对值等的绝对值等于于1 1为完全相关,为完全相关,r r=0=0为零相关。为零相关。 102610272. 计算:样本相关系数的计算公式为22()()()()XYXX YYXX YYlrllXXYY(9-18) 1028由例9-1算得,42XXl,1.046YYl,5.845XYl 按公式(9-18) 5.8450.881842 1.046r 例9-5 对例9-1数据(见表9-1),计算8名儿童的尿肌酐含量与其年龄的相关系数。1029三、相关系数的统计推断(一)相关系数的假设检验20, 212rrrtnS

4、rn(9-19)10210 例9-6 对例9-5所得 r 值,检验尿肌酐含量与年龄是否有直线相关关系?10211检验步骤0H: 0,1H: 0,=0.05 本例n=8,r=0.8818,按公式(9-19)20.88184.57910.881882t 按6,查 t 界值表,得0.0020.005P 0,表示直线与,表示直线与纵轴的交点在原点的纵轴的交点在原点的上方;上方;a 0,则交点在原,则交点在原点的下方;点的下方;a = 0,则回归直线,则回归直线通过原点。通过原点。0a = 0a 0XY10231b0,直线从左下方走向,直线从左下方走向右上方,右上方,Y 随随 X 增大而增大而增大;增大

5、; b0b0b=010232二、直线回归方程的求法 残差(residual)或剩余值,即实测值Y与假定回归线上的 估 计 值 的 纵 向 距离 。求解a、b实际上就是“合理地”找到一条能最好地代表数据点分布趋势的直线。YYY原则:最小二乘法(least sum of squares),即可保证各实测点至直线的纵向距离的平方和最小(X,Y)10233式式 中中X Yl为为X 与与Y 的的 离离 均均 差差 乘乘 积积 和和 : ()()()() (9 5)XYlX X Y YXYXYn 2()()()XYXXXXYYlblXX (9-3) (9-4) aYbX10234除了图中所示两变量呈直线关

6、系外,一般还假定每个X对应Y的总体为正态分布,各个正态分布的总体方差相等且各次观测相互独立。这样,公式(9-1)中的Y实际上是X所对应Y的总体均数|Y X的一个样本估计值, 称为回归方程的预测值(predicted value),而a、b分别为和的样本估计。 10235 例9-1 某地方病研究所调查了8名正常儿童的尿肌酐含量(mmol/24h)如表9-1。估计尿肌酐含量(Y)对其年龄(X)的回归方程。10236 表表9-1 8名正常儿童的年龄名正常儿童的年龄 (岁)与尿肌酐含量(岁)与尿肌酐含量 (mmol/24h) XY编 号 1 2 3 4 5 6 7 8 年龄 X 13 11 9 6 8

7、 10 12 7 尿肌酐含量Y 3.54 3.01 3.09 2.48 2.56 3.36 3.18 2.65 102371由原始数据及散点图(图 9-1)的观察,两变量间呈直线趋势,故作下列计算。 2计算X、Y的均数X、Y,离均差平方和XXl、YYl与离均差积和XYl。 解题步骤102383计算有关指标 769.58XXn 23.872.98388YYn 222()(76)764428XXXlXn 222()(23.87)72.26831.04628YYYlYn ()()(76)(23.87)232.615.84508XYXYlXYn 1023910240 此直线必然通过点此直线必然通过点( , )( , )且与纵坐标轴且与纵坐标轴相交于截距相交于截距 a a 。如果散点图没有从坐标系原。如果散点图没有从坐标系原点开始,可在自变量实测范围内远端取易于读点开始,可在自变量实测范围内远端取易于读数的数的 X X 值代入回归方程得到一个点的坐标,值代入回归方程得到一个点的坐标,连接此点与点连接此点与点( , )( , )也可绘出回归直线。也可绘出回归直线。 XYXY10241


文档来源:https://www.renrendoc.com/paper/212490008.html

文档标签:

下载地址