数理统计-参数估计_七月算法出品

《数理统计-参数估计_七月算法出品》由会员分享,可在线阅读,更多相关《数理统计-参数估计_七月算法出品(49页珍藏版)》请在文档大全上搜索。
1、参数估计与矩阵运算基础七月算法 邹博 2015年3月8日2/历史遗留问题o 根据o 从而公式 的极限存在,定义为e。11111111nxnnxnxxx11limexxx)11 (lim3/极限存在的证明o 根据前文中 的二项展开式,已经证明数组an单增有上界,因此,必有极限。o 同时:o 根据两边夹定理,函数 的极限存在,为e.eennnnnnnnnnnn01111lim111lim111111lim111lim11eennnnnnnnnnnn0111lim11lim1111lim11lim1nnna1111111111nxnnxn xxxf114/期望o 离散型o 连续型o 即:概率加权下的
2、“平均值” iiipxXE dxxxfXE5/期望的性质o 无条件成立o 若X和Y相互独立n 反之不成立。事实上,若E(XY)=E(X)E(Y),只能说明X和Y不相关。n 关于不相关和独立的区别,稍后马上给出。 XkEkXE YEXEYXE YEXEXYE6/方差o 定义o 无条件成立o X和Y独立n此外,方差的平方根,称为标准差 2XEXEXVar 0cVar XVarcXVar XVarkkXVar2 YVarXVarYXVar7/协方差o 定义o 性质: YEYXEXEYXCov,XYCovYXCov,YXacCovdcYbaXCov,YXCovYXCovYXXCov,2121 YEXE
3、XYEYXCov,8/协方差和独立、不相关o X和Y独立时,o 而o 从而,当X和Y独立时,o 但X和Y独立这个前提太强,我们定义:若Cov(X,Y)=0,称X和Y不相关。 YEXEXYEYXCov,0,YXCov YEXEXYE9/协方差的意义o 协方差是两个随机变量具有相同方向变化趋势的度量;若Cov(X,Y)0,它们的变化趋势相同,若Cov(X,Y)0,它们的变化趋势相反;若Cov(X,Y)=0,称X和Y不相关。o 思考:两个随机变量的协方差,是否有上界?10/协方差的上界o 若o 则o 当且仅当X和Y之间有线性关系时,等号成立。21,YXCov 22YVar 21XVar11/再谈独立
4、与不相关o 因为上述定理的保证,使得“不相关”事实上即“线性独立”。o 即:若X与Y不相关,说明X与Y之间没有线性关系(但有可能存在其他函数关系),不能保证X和Y相互独立。o 但对于二维正态随机变量,X与Y不相关等价于X与Y相互独立。12/相关系数o 定义o 由协方差上界定理可知,o 当且仅当X与Y有线性关系时,等号成立o 容易看到,相关系数是标准尺度下的协方差。上面关于协方差与XY相互关系的结论,完全适用于相关系数和XY的相互关系。 YVarXVarYXCovXY,113/协方差矩阵o 对于n维随机向量(X1,X2Xn),任意两个元素Xi和Xj都可以得到一个协方差,从而形成n*n的矩阵;显然
5、,协方差矩阵是对称阵。jijjiiijXXCovXEXXEXEc,nnnnnncccccccccC21222211121114/思考题o 对称阵的不同特征值对应的特征向量,是否一定正交?15/矩o 对于随机变量X,X的k阶原点矩为o X的k阶中心矩为kXE kXEXE16/统计参数的总结o 均值(期望,一阶)o 方差(标准差,二阶)o 变异系数(Coefficient of Variation)n 标准差与平均数的比值称为变异系数,记为CVo 偏度Skew(三阶)o 峰度Kurtosis(四阶)17/偏度o 偏度衡量随机变量概率分布的不对称性,是概率密度曲线相对于平均值不对称程度的度量。o 偏
6、度的值可以为正,可以为负或者无定义。o 偏度为负(负偏态)意味着在概率密度函数左侧的尾部比右侧的长,绝大多数的值(包括中位数在内)位于平均值的右侧。o 偏度为正(正偏态)意味着在概率密度函数右侧的尾部比左侧的长,绝大多数的值(包括中位数在内)位于平均值的左侧。o 偏度为零表示数值相对均匀地分布在平均值的两侧,但不一定意味着一定是对称分布。18/偏度公式o 其中3是三阶中心矩,是标准差。E是期望算子。等式的最后以三阶累积量与二阶累积量的1.5次方的比率来表示偏度。这和用四阶累积量除去二阶累积量的平方来表示峰度的方法向类似。o 偏度有时用SkewX来表示。19/峰度o 峰度是概率密度曲线在平均值处
7、峰值高低的特征,通常被定义四阶中心矩除以方差的平方再减去3:o 也被称为超值峰度(excess kurtosis)。n “减3”是为了让正态分布的峰度为0。o 如果超值峰度为正,称为尖峰态(leptokurtic),超值峰度为负,称为低峰态(platykurtic)。20/实践中的例子21/思考o 1、给定两个随机变量X和Y,如何度量这两个随机变量的“距离”?o 2、设随机变量X的期望为,方差为2,对于任意整数,试估计概率P|X-| 的下限。n 即:随机变量的变化值落在期望值附近的概率22/解(以连续型随机变量为例) 2222222211dxxfXdxxfXdxxfXdxxfXPXXX2211
8、XPXP23/切比雪夫不等式o 设随机变量X的期望为,方差为2,对于任意整数,有:o 切比雪夫不等式说明,X的方差越小, 事件|X-| 发生的概率越大。即:X取的值基本上集中在期望附近。n 该不等式进一步说明了方差的含义n 该不等式可证明大数定理。22XP24/大数定理o 设随机变量X1,X2Xn互相独立,并且具有相同的期望和方差2。作前n个随机变量的平均 ,则对于任意整数,有1limnnYPniinXnY1125/大数定理的意义o 当n很大时,随机变量X1,X2Xn的平均值Yn在概率意义下无限接近期望 。n 出现偏离是可能的,但这种可能性很小,当n无限大时,这种可能性的概率为0。26/思考题