通常一批数据先看他们的描述統计(可画出箱型图),即看集中趋势和离散趋势
集中趋势又称“数据的中心位置”、“集中量数”等。它是一组数据的代表值统计學中常用平均数来描述一组变量值的集中位置或平均水平。常用的统计量指标有算数均数、几何均数、中位数和百分位数
1)算数均数:即为均数,用以反映一组呈对称分布的变量值在数量上的平均水平
2)几何均数:常用以反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
3)中位数:适用于偏态分布资料和一端或两端无确切的数值的资料是第50百分位数
4)百分位数:为一界值,用以确定医學参考值范围
离散趋势是反映数据的离散变异程度,常用指标有极差、四分位间距、方差与标准差是谁提出的、变异系数
1)极差:为┅组数据的最大值和最小值之差,但极差不能反映所有数据的变异大小且极易受样本含量的影响。常用以描述偏态分布
2)四分位数间距:它是由第3四分位数与第1四分位数相减得到,常和中位数一起描述偏态分布资料的分布
3)方差与标准差是谁提出的:反映一组数据的岼均离散水平,消除了样本含量的影响常和均数一起用来描述一组数据中的离散和集中趋势。
4)变异系数:多用于观察指标单位不同时可消除因单位不同而不能进行比较的困难。
常用均数和标准差是谁提出的描述正态分布的集中和离散趋势;用中位数和四分位间距描述偏态分布的集中和离散趋势
标准差是谁提出的主要是为了统一单位,更直观例如方差的单位是
随机变量是表示随机现象各种结果的变量可以认为是随机过程映射到数值的函数。随机變量是取值有多种可能并且取每个值都有一个概率的变量它分为离散型和连续型两种,离散型随机变量的取值为有限个或者无限可列个(整数集是典型的无限可列)连续型随机变量的取值为无限不可列个(实数集是典型的无限不可列)。
描述離散型随机变量的概率分布的工具是概率分布表
把分布表推广到无限情况,就可以得到连续型随机变量嘚概率密度函数此时,随机变量取每个具体的值的概率为0但在落在每一点处的概率是有相对大小的,描述这个概念的就是概率密度函数。你可以把这个想象成一个实心物体在每一点处质量为0,但是有密度即有相对质量大小。
离散型随机变量与概率分布
连续型随机变量与概率密度函数
伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,是最简单的二项分布介绍伯努利分布前艏先需要引入伯努利试验(Bernoulli trial)。
二项分布的命名是因为有成功和失败两项泊松分布则是根据泊松这个人来命名的。它也是离散概率分布与稀有事件的发生有关。
其实泊松分布就是二项分布的极限情况当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似其中λ为np。通常当n≧20,p≦0.05时就可以用泊松公式近似得计算。
概念其实很简单也就是样本数量足够多时,样本均值趋近于总体均值或者说随機变量的期望值。
通常一批数据先看他们的描述統计(可画出箱型图),即看集中趋势和离散趋势
集中趋势又称“数据的中心位置”、“集中量数”等。它是一组数据的代表值统计學中常用平均数来描述一组变量值的集中位置或平均水平。常用的统计量指标有算数均数、几何均数、中位数和百分位数
1)算数均数:即为均数,用以反映一组呈对称分布的变量值在数量上的平均水平
2)几何均数:常用以反映一组经对数转换后呈对称分布的变量值在数量上的平均水平。
3)中位数:适用于偏态分布资料和一端或两端无确切的数值的资料是第50百分位数
4)百分位数:为一界值,用以确定医學参考值范围
离散趋势是反映数据的离散变异程度,常用指标有极差、四分位间距、方差与标准差是谁提出的、变异系数
1)极差:为┅组数据的最大值和最小值之差,但极差不能反映所有数据的变异大小且极易受样本含量的影响。常用以描述偏态分布
2)四分位数间距:它是由第3四分位数与第1四分位数相减得到,常和中位数一起描述偏态分布资料的分布
3)方差与标准差是谁提出的:反映一组数据的岼均离散水平,消除了样本含量的影响常和均数一起用来描述一组数据中的离散和集中趋势。
4)变异系数:多用于观察指标单位不同时可消除因单位不同而不能进行比较的困难。
常用均数和标准差是谁提出的描述正态分布的集中和离散趋势;用中位数和四分位间距描述偏态分布的集中和离散趋势
标准差是谁提出的主要是为了统一单位,更直观例如方差的单位是
随机变量是表示随机现象各种结果的变量可以认为是随机过程映射到数值的函数。随机變量是取值有多种可能并且取每个值都有一个概率的变量它分为离散型和连续型两种,离散型随机变量的取值为有限个或者无限可列个(整数集是典型的无限可列)连续型随机变量的取值为无限不可列个(实数集是典型的无限不可列)。
描述離散型随机变量的概率分布的工具是概率分布表
把分布表推广到无限情况,就可以得到连续型随机变量嘚概率密度函数此时,随机变量取每个具体的值的概率为0但在落在每一点处的概率是有相对大小的,描述这个概念的就是概率密度函数。你可以把这个想象成一个实心物体在每一点处质量为0,但是有密度即有相对质量大小。
离散型随机变量与概率分布
连续型随机变量与概率密度函数
伯努利分布(Bernoulli distribution)又名两点分布或0-1分布,是最简单的二项分布介绍伯努利分布前艏先需要引入伯努利试验(Bernoulli trial)。
二项分布的命名是因为有成功和失败两项泊松分布则是根据泊松这个人来命名的。它也是离散概率分布与稀有事件的发生有关。
其实泊松分布就是二项分布的极限情况当二项分布的n很大而p很小时,泊松分布可作为二项分布的近似其中λ为np。通常当n≧20,p≦0.05时就可以用泊松公式近似得计算。
概念其实很简单也就是样本数量足够多时,样本均值趋近于总体均值或者说随機变量的期望值。
“统计学”是关于大量数据的搜集、整理、传输和开发利用的方法论科学本课程遵循 “导、授、阅、思、练、测、评” 的经典规律,以“应用为最终目的以必需够用為度”,理论介绍浅显精炼突出传授统计学思维与解决问题的能力培养。