您好、欢迎来到现金彩票网!
当前位置:2019全年免费资料大全 > 统计推理 >

第4章 统计推断 120

发布时间:2019-08-09 04:23 来源:未知 编辑:admin

  第4章 统计推断 120_理学_高等教育_教育专区。第4章 统计推断 (statistical inference) 医 学 统 计 学 1 第四章 统计推断 由一个样 本或一糸 列样本所 得的结果 来推断总 体的特征 统 计 推 断

  第4章 统计推断 (statistical inference) 医 学 统 计 学 1 第四章 统计推断 由一个样 本或一糸 列样本所 得的结果 来推断总 体的特征 统 计 推 断 参数估计 假设检验 第四章 第一节 第二节 第三节 第四节 第五节 假设检验的原理与方法 样本平均数的假设检验 样本频率的假设检验 参数的区间估计与点估计 方差的同质性检验 第一节 假设检验 一、基本概念 ?假设检验(hypothesis test)亦称显著性检验 (significance test)是利用小概率反证法思想,先 对总体特征做出两种对立的假设(H0与H1),然后 在H0成立的条件下计算检验统计量,以获得概率值, 并与预先规定的概率值α相比较来间接判断H1是否成 立的统计推断过程。 假设检验的原理 ?反证法:当一件事情的发生只有两种可能A和B, 为了肯定其中的一种情况A,但又不能直接证实A, 这时否定另一种可能B,则间接的肯定了A。 ?小概率原理:概率很小的事件在一次抽样试验中 实际是几乎不可能发生的。 ? =0.05/0.01 ? 如果假设一些条件,并在假设的条件下能够准确地算出事件A出 现的概率α 为很小,则在假设条件下的n次独立重复试验中,事件 A将按预定的概率发生,而在一次试验中则几乎不可能发生。 医 学 统 计 学 6 假设检验的原因 从两个总体中进行随机抽样,得到两个样本均 数 X 1、X 2。 X 1 、X 2 不同。不同的原因是什么? 不同有两种(而且只有两种)可能: (1)分别所代表的总体均数相同,由于抽样误差 造成了样本均数的差别。差别无显著性 。 (2)分别所代表的总体均数不同。差别有显著性。 医 学 统 计 学 7 二 、假设检验的步骤 实例分析 例 根据大量调查,已知健康成年男子脉搏的均 数为72次/分钟,某医生在一山区随机测量了25 名健康成年男子脉搏数,求得其均数为74.2次/ 分钟,标准差为6.5次/分钟,能否认为该山区成 年男子的脉搏数与一般健康成年男子的脉搏数不 同? 医 学 统 计 学 8 本例两个均数不等有两种可能性 ①山区成年男子的脉搏总体均数与一般健康成年男子的脉搏总 体均数是相同的,差别仅仅由于抽样误差所致; ②受山区某些因素的影响,两个总体的均数是不相同的。 如何作出判断呢?按照逻辑推理: 如果第一种可能性较大时,可以接受它,统计上称差异无统 计学意义; 如果第一种可能性较小时,可以拒绝它而接受后者,统计上 称差异有统计学意义。 医 学 统 计 学 9 二 、假设检验的步骤 1.建立检验假设 (1)一种是无效假设(null hypothesis),符号为 H 0; 差别仅由抽样误差引起 (2)一种是备择假设(alternative hypothesis), 符号为H1。 确有差别 H 0 : ? ? ?0 医 学 统 计 学 H1 : ? ? ? 0 10 样本均数所代表的未知总体均数 与已知总体均数的比较 目 双侧检验 的 H0 ? ? ?0 ? ? ?0 ? ? ?0 H1 ? ? ?0 ? ? ?0 ? ? ?0 是否 ? ? ? 0 是否 ? ? ? 0 是否 ? ? ? 0 单侧检验 医 学 统 计 学 11 两样本均数所代表的未知总体均数的比较 目 双 侧 检 验 单 侧 检 验 的 H0 ?1 ? ? 2 H1 ?1 ? ? 2 ?1 ? ? 2 ?1 ? ? 2 是否 ?1 ? ? 2 是否 ?1 ? ? 2 是否 ?1 ? ? 2 ?1 ? ? 2 ?1 ? ? 2 医 学 统 计 学 12 三 、双尾检验与单尾检验 ?? 2 ?? 2 否定区 接受区 否定区 双尾 检验 接受区 ? ? 否定区 单尾 检验 二 、假设检验的步骤 2.确定检验水准 检验水准(size of a test)亦称显著 根据选定的显著性水平 (0.05 或0.01) ,决定接受 性水准 (significance level) ,符号为 α。 还是拒绝 H0. 它是判别差异有无统计意义的概率水准,其大小 应根据分析的要求确定。通常取α= 0.05。 医 学 统 计 学 14 二 、假设检验的步骤 3.选定检验方法和计算统计量 根据研究设计的类型和统计推断的目的要求选用不同 的检验方法。如完全随机设计中,两样本均数的比较 0 可用t检验,样本含量较大时(n100),可用Z检验。 不同的统计检验方法,可得到不同的统计量,如t值和 u值。 选择适当的统计方法计算H 成立的可能性即概率有多大 医 学 统 计 学 15 二 、假设检验的步骤 4.确定概率P值 ? P值是指在H0所规定的总体中作随机抽样,获得等于 及大于(或小于)现有统计量的概率。即在H0为真 或样本间的差异由抽样误差所致的概率。 的前提下出现观察样本以及更极端情况的概率。 │t│≥ tα,υ ,则P≤ α; 可以认为差别不由抽样误差引起,可以拒绝H0 │t│< tα,υ,则P >α。 医 学 统 计 学 16 二 、假设检验的步骤 5.作出推断结论 ①当 P≤α时,表示在 H0 成立的条件下,出现等于及大 于现有统计量的概率是小概率,根据小概率事件原理, 现有样本信息不支持 H0 ,因而拒绝 H0 ,结论为按所取 检验水准拒绝 H0 ,接受 H1 ,即差异有统计学意义,如 前例可认为两总体脉搏均数有差别。 ②当Pα时,表示在H0成立的条件下,出现等于及大于 现有统计量的概率不是小概率,现有样本信息还不能 拒绝 H0 ,结论为按所取检验水准不拒绝 H0 ,即差异无 统计意义,如前例尚不能认为两总体脉搏均数有差别。 17 医 学 统 计 学 下结论时的注意点 ? P ≤α ,拒绝H0,不能认为H0肯定不成立,因为 虽然在H0成立的条件下出现等于及大于现有统计量 的概率虽小,但仍有可能出现。 ? 同理,P>α ,不拒绝H0,也不能认为H0肯定成立。 由此可见,假设检验的结论是具有概率性的,无论 拒绝H0或不拒绝H0,都有可能发生错误,即第一类 错误或第二类错误 。 ? 假设检验只是统计结论。判断差别还要根据专业知 识。 医 学 统 计 学 18 假设检验中作出的推断结论可能发生两种错误: ①拒绝了实际上是成立的H0,这叫Ⅰ型错误 弃真错误 (typeⅠerror)或第一类错误,也称为α错误。 ②不拒绝实际上是不成立的H0,这叫Ⅱ型错误 纳伪错误 (typeⅡerror)或第二类错误,也称为β错误。 推断结论和两类错误 检验结果 拒绝H0 不拒绝H0 第Ⅰ类错误(α) 结论正确(1-α) 结论正确(1-β) 第Ⅱ类错误(β) 医 学 统 计 学 19 实际情况 H0线不真 Ⅰ错误α的意义 犯第Ⅰ类错误的概率用α来控制,其 大小与检验水准相同。根据研究者的需要 α常取为0.05或0.01等。当α取为0.05时, 其意义是:如果原假设H0成立,按照同样 的方法在原假设H0规定的总体种重复抽样, 那么在每100次检验结论中平均可以有5次 拒绝H0(犯第Ⅰ类错误)。 医 学 统 计 学 20 Ⅰ错误α的意义 ?错误 0.025 0.95 ?= ?0 0.025 犯第一类错误的概率等于显著水平?值 Ⅱ错误β的意义 犯第Ⅱ类错误的概率β来控制。因为 HO不成立是检验统计量的精确分布往往难 以确定,所以在多数情况下准确估计β的 数值比较困难。 β的意义:如果H0并不成 立,即所研究的总体与H0有实质差异,按 照同样的方法在总体中重复抽样,那么在 100次检验结论中平均可以有100β次接受 H0(犯第Ⅱ 类错误)。 医 学 统 计 学 22 医 学 统 计 学 23 两类错误的联系与区别 ? 联系:一般α增大,则β减小; α减小,则β增大; ? 区别: ? (1)一般α为已知,可取单侧或双侧,如0.05,或0.01。 ? (2)一般β为未知,只取单侧,如取0.1或0.2。 n , ?2 可使两类错误的概率都减小. 第24页 第3章 总体均数区间估计和假设检验 大样本平均数的假设检验 --u检验 单样本 小样本平均数的假设检验 --t检验 双样本 一、一个样本平均数 的假设检验 一、样本均数与总体均数比较 适用范围:检验某一样本平均数x所属的总体 平均数?是否和某一指定的总体平均数?0相同。若 相同,则说明该样本属于这个以?0为平均数的指 定总体;若不相同,则说明该样本所属的总体与 这个指定总体( ?0 )不同,即有统计学差异。 一、样本均数与总体均数比较 计算公式 总体标准差σ已知 时,不管n的大小。 Z? X ? ?0 ?0 / n X ? ?0 S/ n 总体标准差σ未知 时,但n≥30时。 Z ? 医 学 统 计 学 29 实例分析1 例 某托儿所三年来测得21~24月龄的47名 男婴平均体重11kg。查得近期全国九城市城 区大量调查的同龄男婴平均体重11.18kg,标 准差为1.23kg。问该托儿所男婴的体重发育 状况与全国九城市的同期水平有无不同? (全国九城市的调查结果可作为总体指标) 医 学 统 计 学 30 实例分析1 (1)建立检验假设,确定检验水准 H0:μ =μ0 ,即该托儿所男婴的体重发育状况与全 国九城市的同期水平相同。 H1:μ≠μ0 ,即该托儿所男婴的体重发育状况与全 国九城市的同期水平不同。 α=0.05 (2)计算Z值 本例因总体标准差σ已知,故可用Z检 验。 已知:n=47, 样本均数=11, 总体均数=11.18,总体标 准差=1.23, 代入公式有: Z? 医 学 统 计 学 X ? ?0 ?0 / n 31 实例分析1 Z? 11? 11.18 1.23 / 47 ? 1.003 (3)确定P值,作出推断结论 查t界值表(附表2,t界 值表中为≦一行),得Z0.05/2=1.96,Z=1.003 Z0.05/2=1.96, 故P0.05。按α=0.05水准,不拒绝H0,差 异无统计学意义。 结论:可认为该托儿所男婴的体重发育状况与全国九城 市的同期水平相同。 医 学 统 计 学 32 实例分析2 例:生产某种纺织品,要求棉花纤维长度平均为30mm以上, 现有一棉花品种,以n=400进行抽查,测得其纤维平均长度为 30.2mm,标准差为2.5mm,问该棉花品种的纤维长度是否符 合纺织品的生产要求? (1)这是一个样本平均数的假设检验,因总体σ2未知, n=400 30,可用s2代替σ2进行u检验; (2)棉花纤维只有30mm才符合纺织品的生产要求, 因此进行单尾检验。 分 析 (1)假设 H0:μ=μ0=30(cm),即该棉花品种纤维长度达不到纺 织品生产的要求。 H1:μμ0 ,即该棉花品种纤维长度达到了纺织品生产 的要求。 (2)水平 (3)检验 选取显著水平α=0.05 sx ? s 2.5 x ? ? 30.2 ? 30.0 ? ? 1.6 ? ? 0.125 u ? sx 0.125 n 400 u 1.645 (4)推断 P>0.05,不拒绝H0,尚不能认为H1是正确的,无 统计学意义,即尚不能认为该棉花品种纤维长度符 合纺织品生产的要求。 一、样本均数与总体均数比较 计算公式 X ? ?0 S n 总体标准差σ未知且 n较小时。 t ? 医 学 统 计 学 35 实例分析 例 根据大量调查,已知健康成年男子脉搏 的均数为72次/分钟,某医生在一山区随机测 量了25名健康成年男子脉搏数,求得其均数 为74.2次/分钟,标准差为6.5次/分钟,能否 认为该山区成年男子的脉搏数与一般健康成 年男子的脉搏数不同? 医 学 统 计 学 36 实例分析 (1)建立检验假设,确定检验水准 H0:μ=μ0 ,即该山区健康成年男子脉搏均数与 一般健康成年男子脉搏均数相同; H1:μ≠μ0 ,即该山区健康成年男子脉搏均数与 一般健康成年男子脉搏均数不同。 α=0.05 (2)计算t值 本例n=25,s=6.5 ,样本均数=74.2,总体 均数=72, 代入公式 t ? X ? ?0 S n 医 学 统 计 学 t ?? 74.2 ? 72 6.5 25 ? 1.692 37 实例分析 (3)确定P值, 作出推断结论 本例υ =25-1=24,查附表2,t界值表,得 t0.05/2,24=2.064,现t=1.692 t0.05/2,24=2.064, 故 P0.05。按α =0.05的水准,不拒绝H0,差异无统计 学意义。 结论:即根据本资料还不能认为此山区健康成年男 子脉搏数与一般健康成年男子不同。 医 学 统 计 学 38 二、两个样本平均数 的假设检验 二、两个样本均数的假设检验 适用范围:检验两个样本平均数x1和x2所属 的总体平均数?1和?2是否来自同一总体。 二、两个样本均数的假设检验 样本1 X1 总体1 μ1 总体2 μ2 1、提出假设 样本2 X2 无效假设H0: μ1=μ2 ,两个平均数的差值 随机误差所引起的; x1 ? x2 是 备择假设HA: μ1=μ2 ,两个平均数的差值 x1 ? x2 除 随机误差外还包含其真实的差异,即由处理引起的; 二、两个样本均数的假设检验 计算公式 ? ? ? x ? x 时,不管n的大小。 σ 1 2 和σ 2 2 2 2 已知 1 ? ? 2 2 2 2 1 n1 n2 u? x1 ? x2 ? x ?x 1 2 σ 1 和σ 2 s1 s s,但 ? ? x1 ? x2n1、n2≥30时。 2 2 2未知 n1 n2 x1 ? x2 u? s x1 ? x 2 42 医 学 统 计 学 二、两个样本均数的假设检验 例:某杂交黑麦从播种到开花的天数的标准差为6.9d A法:调查400株,平均天数为69.5d B法:调查200株,平均天数为70.3d 差异? 试比较两种调查方法所得黑麦从播种到开花天数有无显著差别。 分 析 (1)这是两个样本(成组数据)平均数比较的假设检 验,σ 12=σ 22=(6.9d)2,样本为大样本,用u检验。 (2)因事先不知A、B两方法得到的天数孰高孰低,用 双尾检验。 (1)假设 H0:μ1= μ2,即认为两种方法所得天数相同。 H1: μ1≠ μ2 ,即认为两种方法所得天数不同。 (2)水平 (3)检验 选取显著水平α=0.05 ?x 1 ? x2 ?? 1 1 ? ? 0.598 n1 n2 u? x1 ? x2 ?x 1 ? x2 69 .5 ? 70 .3 ? ? ?1.338 0.598 u 1.96,P 0.05 (4)推断 在0.05显著水平上, 不拒绝H0,尚不能接受H1, 无统计学意义,即尚不能认为两种方法所得黑麦从 播种到开花天数没有差别。 二、两个样本均数的假设检验 例:为了比较“42-67XRRIM603”和“42-67XPB86”两个橡 胶品种的割胶产量,两品种分别随机抽样55株和107株进行 割胶,平均产量分别为95.4ml/株和77.6ml/株,割胶产量 的方差分别为936.36(ml/株)2和800.89(ml/株) 2。试检 验两个橡胶品种在割胶产量上是否有显著差别。 分 析 (1)这是两个样本(成组数据)平均数比较的假设检 验,σ 12和σ 2 2未知, n130且n230 ,用u检验。 (2)因事先不知两品种产量孰高孰低,用双尾检验。 (1)假设 H0:μ1= μ2,即认为两品种割胶产量没有显著差别。 H1: μ1≠ μ2 ,即认为两品种割胶产量有显著差别。 (2)水平 (3)检验 选取显著水平α=0.01 s x1 ? x2 ? 2 2 s1 s2 ? ? 4.951 n1 n2 ( x1 ? x2 ) 95 .4 ? 77 .6 u? ? ? 3.595 sx ? x 4.951 1 2 u 2.58,P 0.01 (4)推断 在0.01显著水平上,拒绝H0,接受H1,有统计学 意义,即认为两个橡胶品种的割胶产量存在差别。 二、两个样本均数的假设检验 当σ 和σ 22未知,两样本都为小样本时 1 2 t检验 医 学 统 计 学 47 (一)成组设计两样本均数的比较 应用条件: 适用于比较按完全随机设计而得到的 两组资料,比较的目的是推断它们各自所 代表的总体均数和是否相等。 ?若n1和n2较小且两总体方差相等时: X1 ? X 2 t? ? S X1 ? X 2 X1 ? X 2 1 1 S ( ? ) n1 n2 2 c 医 学 统 计 学 ? X1 ? X 2 S12 (n1 ? 1) ? S 22 (n2 ? 1) 1 1 ( ? ) n1 ? n2 ? 2 n1 n2 48 实例分析 ?例 测得14名慢性支气管炎病人与11名健 康人的尿中17酮类固醇(mol/24h)排出量 如下,试比较两组人的尿中17酮类固醇的 排出量有无不同。 医 学 统 计 学 49 实例分析 ?原始调查数据如下: ?病 人 X1:n=14; 10.05,18.75, 18.99,15.94 13.96, 17.67, 20.51, 17.22, 14.69,15.10 9.42, 8.21, 7.24,24.60; ?健康人 X2:n=11; 17.95,30.46,10.88,22.38, 12.89, 23.01,13.89,19.40,15.83,26.72, 17.29; 医 学 统 计 学 50 实例分析 ?(1)建立检验假设 H0:μ1 =μ2 ,即病人与健康人的尿中 17酮类固醇的排出量相同 H1:μ1 ≠μ2 ,即病人与健康人的尿中 17酮类固醇的排出量不同 α=0.05 医 学 统 计 学 51 实例分析 (2)计算t值 本例:n1=14, ΣX1=212.35, ΣX12=3549.0919 n2=11, ΣX2=210.70, ΣX22=4397.64 X 1 ? ?X1 n1 ? 212.35 14 ? 15.17(?mol/ 24h) X 2 ? ?X 2 n2 ? 210.7 11 ? 19.15(?mol/ 24h) 2 2 3549 . 0919 ? ( 212 . 35 ) 14 ? 4397 . 6486 ? ( 210 . 70 ) 11 Sc2 ? ? 29.9993 14 ? 11? 2 医 学 统 计 学 52 实例分析 S X1?X 2 ? 14 ? 11? ? 29.9993 ? ? ? 2.2068 ? 14 ? 11 ? 15 .17 ? 19 .15 t? ? 1.8035 2.2068 (3)确定P值 作出推断结论 υ=14+11-2=23,查t 界值表,得t0.05/2,23=2.069,现t=1.8035t0.05/2,23= 2.069,故P0.05。按α=0.05水准,不拒绝H0,差异 无统计学意义。 (4)结论:尚不能认为慢性支气管炎病人与健康人的 尿中17酮类固醇的排出量不同。 医 学 统 计 学 53 F检验: F=S12/S22 医 学 统 计 学 54 实例分析 例:用高蛋白和低蛋白两种饲料饲养一月龄大白鼠,在三个 月时,测定两组大白鼠的增重(g) 高蛋白组:134,146,106,119,124,161,107,83,113,129,97,123 低蛋白组:70,118,101,85,107,132,94 试问两种饲料饲养的大白鼠增重量是否有差别? (1)这是两个样本平均数的检验,σ 分 且为小样本,用t检验。 2和σ 2未知, 1 2 析 (2)事先不知两种饲料饲养大白鼠增重量孰高孰低, 用双尾检验。 2 2 x1 ? 120.17( g ) s1 ? 451.97( g ) 2 2 x2 ? 101.00( g ) s2 ? 425.33( g ) n1 ? 12 n2 ? 7 (1)假设 H0:σ12=σ22=σ2 (2)水平 (3)检验 H1: σ12 ≠ σ22 选取显著水平α=0.05 s12 451.97 F? 2 ? ? 1.063 s2 425.33 F0.05(11,6) ? 4.03 (4)推断 F ? F0.05 两样本方差相等。 (1)假设 H0:μ1= μ2,即认为两种饲料饲养的大白鼠增 重无差异。 H1: μ1 ≠ μ2 (2)水平 选取显著水平α=0.05 (3)检验 s (n1 ? 1) ? s (n2 ? 1) s ? ? 442.568 (n1 ? 1) ? (n2 ? 1) 2 e 2 1 2 2 s x1 ? x2 ? 2 2 se se ? ? 10 .005 n1 n2 x1 ? x2 t? ? 1.916 sx ? x 1 2 x1 ? x2 t? ? 1.916 sx ? x 1 2 df=(n1-1)+(n2-1)=17 t 0.05/2(17) =2.110 P0.05 (4)推断 在0.05检验水准上,不拒绝H0,尚不能认为H1是正 确的。即尚不能认为两种饲料饲养大白鼠的增重有 差异。 ? σ12≠σ22,n1 ≠ n2,采用近似地t检验,即 Aspin-Welch检验法。 s x1 ? x2 ? s s ? n1 n2 R? 2 1 2 2 t df x1 ? x2 ? sx ? x 1 2 1 df ? R2 (1 ? R ) 2 ? n1 ? 1 n2 ? 1 2 sx 1 s 2 x1 ?s 2 x2 ? 2 s1 n1 2 2 s1 s2 ? n1 n2 (二)配对设计的均数比较 医学科研中配对资料主要有四种类型: 1、同一批受试对象治疗前后某些生理、生化指标 的比较; 2、同一种样品,采用两种不同的方法进行测定, 来比较两种方法有无不同; 3、配对动物试验,各对动物试验结果的比较等。 配对实验设计得到的资料称为配对资料。 4、同一只动物对称部位:测量2个数据形成配对 数据。 医 学 统 计 学 60 (二)配对设计的均数比较 样本1 x1 d ? x1 ? x2 样本2 … … n对 x2 配对资料的t检验 ? 先求出各对子的差值d的均值, 若两种处理的效应 无差别,理论上差值d的总体均数μd应为0。 ? 所以这类资料的比较可看作是样本均数与总体均数 为0的比较。 ?注意:要求差值的总体分布为正态分布。公式为: d ? ?d d ? 0 d t? ? ? Sd Sd n Sd n df = n-1 医 学 统 计 学 62 配对资料的t检验 ?例 设有12名志愿受试者服用某减肥药,服药前和服药后 一个疗程各测量一次体重(kg),数据如表3-4所示。问此减 肥药是否有效? 注意:是否有效,即指单侧检验。 (1)建立检验假设 H0:μd=0, 即该减肥药无效; H1:μd0,即该减肥药有效。 单侧α=0.05 医 学 统 计 学 63 配对资料的t检验 医 学 统 计 学 64 配对资料的t检验 (2)计算t值 本例n = 12, Σd = -16,Σd2 = 710, 差值的均数=Σd /n = -16/12 = -1.33(kg) ?d 2 ? ??d ? n 710? (?16) 2 12 Sd ? ? ? 7.91(kg) n ?1 12 ? 1 2 医 学 统 计 学 65 配对资料的t检验 t? d Sd n t? ?1.33 7.91 12 ? 0.58 (3)确定P值,作出推断结论 自由度=n-1=12-1=11, 查附表2,t界值表,得单侧 t0.05,11=2.201,现t=0.58 t0.05,11=2.201,故P0.05。 按α=0.05水准,不拒绝H0, 差异无统计学意义。 结论:故尚不能认为该减肥药有减肥效果。 医 学 统 计 学 66 配对资料的t检验 例 某单位研究饮食中缺乏维生素E与肝中维生素A含 量的关系,将同种属的大白鼠按性别相同,年龄、体 重相近配成8对,并将每对中的两头动物随机分到正常 饲料组和维生素E缺乏组,然后定期将大白鼠杀死,测 得其肝中维生素A的含量如表3-5。 试分析:不同饲料组的大白鼠肝中维生素A含量有 无差别? 医 学 统 计 学 67 配对资料的t检验 医 学 统 计 学 68 配对资料的t检验 (1)建立检验假设 H0:ud=0,即正常饲料组和维生素E缺乏组肝中维生素A的含量 相同 H1:ud≠0,即正常饲料组和维生素E缺乏组肝中维生素A的含 量不同 α=0.05 (2)计算t值 本例n=8, ∑d=6.81, ∑d2=8.0867, d的均数=6.81/8=0.851 8.0867? 6.812 / 8 Sd ? ? 0.572(?mol/ g ) 8 ?1 t? d Sd n 医 学 统 计 学 t? 0.851 0.572/ 8 ? 4.208 69 配对资料的t检验 (3)确定P值,作出推断结论 根据自由度: υ=n-1=8-1=7,查附表2, t界值表,得t0.005/2,7=4.029, 本例 t=4.2084.029,故P0.0050.05。拒绝H0, 接受H1, 差异有统计学意义。 (4)结论:可认为不同饲料的大白鼠肝中维 生素A含量有差别,正常饲料组含VA较高。 医 学 统 计 学 70 产品 合格 不合格 发芽 不发芽 存活 合格率 发芽率 二 项 分 布 目标性 状 种子 害虫 死亡 结实 不结实 红花 白花 死亡率 植物 结实率 频 率 分 布 二项成 数 后代 性状比 频率的假设检验 当 np 或 nq5时 表1 孵化小鸡的概率表 (p= 0.90 q=0.10) 概率函数 Cnxpxqn-x P(0) C50p0q5 C51p1q4 C52p2q3 P(1) P(2) P(x) 0.00001 0.00045 0.0081 直接概率法 P( x) ? C p q x n x n? x P(3) P(4) P(5) C53p3q2 C54p4q1 C55p5q0 0.0729 0.32805 0.59049 P(0)或P(1)或P(2) 0.05,差异显著; P(3)或P(4)或P(5) 0.05,差异不显著。 频率的假设检验 当 5np 或 nq30 由于二项总体的百分数(频率)是由某一属性的个体 计算来的整数,所以是离散型的。当样本不太大时,把它 当作连续型的近似正态总体来处理,结果会有些出入,容 易发生第一类错误。补救的办法时仍按正态分布的假设检 验计算,但必须进行连续性矫正,即随机变量所落的区间 ? ? np) 矫正为 np +0.5,如一个样本由 (np ? ? np ? 0.5 。在经 连续型校正之后所作的推断其准确性不亚于2×2列联表。 频率的假设检验 当 np 和 nq 30 中心极限定理 近似 正态分布 ( u 检 验 ) 一、一个样本频率 的假设检验 p ? ) 适用范围:检验一个样本频率(记为 p 和某一理论值或期望值p的差异显著性。 π 在二项分布中,事件A发生的频率 x/n称 为二项成数,即百分数或频率。则二项成数 的平均数和标准差分别为: ?p ? p ? ? ? ( pq) / n 样本频率的标准误 ?来估计。此时上 未知时,常以样本百分数 p 式改写为: ? ?q ?) / n q? ? 1 ? p Sp = ( p S p 称为样本成数标准误。 ? p 也称为二项总体成数的标准误,当 p 1、当 np 和 nq 30,不需连续性矫正,则u值为: p ?? p u ? ? ? p? p np ?? p ? ? np ? pq / n npq 2、当 5np 或 nq30时,需要进行连续性矫正,uc值为 (n≥30): uc ? (p ? ? p) ? 0.5 ?p ? n ? p ? ? p ? ?p ? 0.5 n 其中“+”表示在 ? p时取“+”。 ? p时取“-”; p p n30时,用t检验 df ? n ? 1 例:有一批蔬菜种子的平均发芽率为0.85,现随机抽取500 粒,用种衣剂进行浸种处理,结果有445粒发芽,检验种衣 剂对种子发芽有无效果? 分 析 (1)一个样本频率的假设检验; (2) np 和 nq 30 ,无需连续矫正,用u检验; (3)不知使用种衣剂的发芽率是高是低,用双尾检验。 (1)假设 H0:p=0.85,即用该种衣剂浸种后的发芽率仍为 0.85; H1:p≠0.85 选取显著水平α=0.05 ?? p x 445 ? ? 0.89 n 500 (2)水平 (3)检验 ?p pq / n ? 0.016 ? ? u? ??p p ?p ? 0.89 ? 0.85 ? ? 2.5 0.016 u 1.96,P0.05 (4)推断 在0.05显著水平上,拒绝H0,接受H1; 认为种衣剂浸种能够显著提高蔬菜种子的发芽率。 例:规定种蛋的孵化率0.80为合格,现对一批种蛋随机抽取 100枚进行孵化,结果有78枚孵出, 问这批种蛋是否合格? 分 析 (2) np 和 nq 5 ,但nq 30,需要进行连续矫正, 由于n 30,用u检验; (3)只有孵化率≤ 0.80,才认为是不合格,故采用 单尾检验。 (1)一个样本频率的假设检验; (1)假设 H0:p≤ 0.80,即该批种蛋不合格。 H1:p0.80, 即该批种蛋合格。 选取显著水平α=0.05 x ? ? ? 0.78 p n (2)水平 (3)检验 ?p pq / n ? 0.04 ? ? 0.5 ??p? p n ? 0.375 uc ? ?p ? uc 1.645,P0.05 (4)推断 在0.05显著水平上,不拒绝H0,尚不能认为H1是 正确的,即尚不能认为这批种蛋是合格的。 二、两个样本频率 的假设检验 二、两样本率比较的Z检验 1. 适用条件为:两样本的np和nq均大于30。 2. 计算公式为: Z ? p1 ? p 2 S p ?p 1 2 ? p1 ? p 2 pc(1 ? pc )(1 n1 ? 1 n 2 ) 合并样本率Pc: pc x1 ? x 2 ? n1 ? n2 第6章 总体率的区间估计和假设检验 第86页 For example 例 某中药研究所试用某种草药预防流 感,观察用药组和对照组(未用药组) 的流感发生率,其结果见表6-1。问两 组流感发生率有无差别? 第6章 总体率的区间估计和假设检验 第87页 第6章 总体率的区间估计和假设检验 第88页 计算结果 本例:n1=100,p1=14%,n2=120,p2=25%,pc=20%,1- pc=80%,Pc=20%。代入公式: Z ? 0.14 ? 0.25 0.20 ? 0.80 (1 100 ? 1 120) ? 2.031 ? ? 判断: Z=2.031Z0.05/2=1.96,故P 0.05。 ? 在α=0.05水准上,拒绝H0,接受H1,差异有统计 学意义。 ? 结论:两组流感发生率有差异。 第6章 总体率的区间估计和假设检验 第89页 第四节参数的区间估计与点估计 一、参数区间估计与点估计的原理 二、一个总体平均数的区间估计与点估计 三、两个总体平均数差数的区间估计与点估计 四、一个总体频率、两个总体频率差数的区间估计与点 估计 用样本统计量估计总体参数称为参数估计,是统计 推断的一个重要方面。 总体均数的估计有两种: (1)点值估计(point estimation ) (2)区间估计(interval estimation)。 医 学 统 计 学 92 ? 点值估计是用相应样本统计量直接作为其总体参数 的估计值。如用 X 估计?、S估计?等。其方法虽简 单,但未考虑抽样误差的大小。 ? 区间估计是按预先给定的概率(1??)所确定的包含 未知总体参数的一个范围。该范围称为参数的可信 区间或置信区间(confidence interval, CI); ? 预先给定的概率(1??)称为可信度或置信度 (confidence level),常取95%或99%。 93 医 学 统 计 学 可信区间的涵义 从总体中作随机抽样,根据每个样本可算得 一个可信区间,如95%可信区间,意味着固定样 本含量n作100次随机抽样,算得100个可信区间 ,有95个可信区间包括总体均数(估计正确), 只有5个可信区间不包括总体均数(估计错误) ,即犯错误的概率是5%。 医 学 统 计 学 94 (一)σ未知且n较小 按t分布的原理有 X ? t? / 2,? S X (二)σ未知且n足够大 按Z分布的原理 X ? Z? / 2 S X (三)σ已知 按Z分布的原理 X ? Z? / 2? X 医 学 统 计 学 95 例 抽取某高校某年级大学生25人。某课程的平均成绩为75分 ,标准差为6分。试计算该年级此课程的总体平均成绩的95%可 信区间是多少? 【分析】 由于只抽取25人为小样本。可用小样本区间估计CI。 ? 标准误为: S X ? 6 25 ? 1.2 ? t0.05/2,24值为:2.064 ? 则95%的可信区间为: ? 75±2.064×1.2,即(72.52, 77.48)。 ? 该 年 级 此 课 程 的 总 体 平 均 成 绩 的 95% 可 信 区 间 是 ( 72.52, 77.48)分 。 医 学 统 计 学 96 又例:若上述例子的人数改为:100人。计算95%的可 信区间。 ? 标准误为: SX ? 6 100 ? 0.6 ? 95%的可信区间为 : 75±1.96×0.6, ? 即(73.82,76.18)。 ? 可见:抽取的n越大,可信区间的范围越小, 估计的越精确。反之亦然。 医 学 统 计 学 97 注 意 点 ? 标准误愈小( σ 越小或 n 越大),估计总 体均数可信区间的范围也愈窄,说明样本 均数与总体均数愈接近,对总体均数的估 计也愈精确; ? 反之,标准误愈大( σ 越大或n越小) , 估计总体均数可信区间的范围也愈宽,说 明样本均数距总体均数愈远,对总体均数 的估计也愈差。 医 学 统 计 学 98 可信区间的两个要素 区间估计的准确度:判断正确的可能性大小,用 (1-?) 来衡量。99%的可信区间好于95%的可信区间 (n, S 一定时)。 区间估计的精确度:指区间范围的宽窄,范围越宽 精确度越差。99%的可信区间差于95%的可信区间( n, S 一定时)。 医 学 统 计 学 99 当两个总体方差σ 12和σ 22为已知,或总体方差 σ12和σ22未知但为大样本时,在置信度为P=1- α 下,两个总体平均数差数? 1- ? 2的区间估计为: L ? x1 ? x2 ? u? ? x ? x 1 ? ? 2 100 当两个样本为小样本,总体方差σ12和σ22未知, 当两总体方差相等,即σ12= σ22= σ2时,可由两样 本方差s12和s22估计总体方差σ12和σ22,在置信度为P =1- α下,两总体平均数差数?1-?2的区间估计为: ??x ? x ?? t s 1 2 ? x1 ? x2 , ( x1 ? x2 ) ? t? s x ? x 1 2 ? 101 当两个样本为小样本,总体方差σ12和σ22未知, 且两总体方差不相等,即σ12 ≠ σ22时,可由两样本方 差s12和s22对总体方差σ12和σ22的估计而算出的t值, 已不是自由度df=n1+n2-2的t分布,而是近似的服从 自由度df 的t分布,在置信度为P=1-α下,两总体平 均数差数?1-?2的区间估计为: ??x ? x ?? t 1 2 ? ( df s , ( x1 ? x2 ) ? t? ( df ) s x ? x ) x ?x 1 2 1 2 ? 102 当两样本为成对资料时,在置信度为P=1- α时, 两总体平均数差数?1-?2的置信区间可估计为: ?d ? t ? s , d t ? sd ? d ? 103 例题 用高蛋白和低蛋白两种饲料饲养一月龄大白 鼠,在三个月时,测定两组大白鼠的增重重量(g ),两组的数据分别为: 高蛋白组:134,146,106,119,124,161, 107,83,113,129,97,123 低蛋白组:70,118,101,85,107,132,94 试进行置信度为95%时两种蛋白饲料饲养的大白 鼠增重的差数区间估计和点估计。 104 x1 ? 120.17g, x2 ? 101.00g sx1 ? x2 ? 10.005 df ? 17, t0.05 ? 2.110 其置信度为95%时两种蛋白饲料饲养的 大白鼠增重的差数区间估计为: L ? x1 ? x2 ? t? s x ? ? 1 ? x2 ? (120.17 ? 101.00) ? 2.110? 10.005 ? ?1.94( g ) L ? x1 ? x2 ? t? s x ? ? 1 ? x2 ? (120.17 ? 101.00) ? 2.110? 10.005 ? 40.284( g ) 说明两种蛋白饲料饲养下大白鼠增重的差数有95%的把握落在-1.94g~40.284g 的区间里。 105 在置信度P=1- α下,对一个总体频 率P的区间估计为: ? ? u?? p L? p ? 106 当样本容量较小或者np、nq远小于30 时,对总体频率p进行的区间估计和点估计 ,需要做连续性校正,其校正公式为: 0.5 0.5 ? ? ? ? u?? p ? ? u?? p , L2 ? p ? L1 ? p ? ? ? ? ? n n ? ? 总体频率p的点估计L为: 0. 5 ? ? u? ? p L? p ? ? n 107 在置信度为P=1-α下,两总体频率 差数p1-p2的区间估计为 ?1 ? p ? 2 ) ? u?? p ?1 ? p ? 2 ) ? u?? p [( p ?1 ? p ?2 , ( p ?1 ? p ?2 ] 108 一、一个样本方差的同质性检验 我们知道从标准正态总体中抽取k个 独立u2之和为χ2,即 ? ? ?( 2 x?? ? ) ? 2 1 ? 2 ? (x ? ?) 2 当用样本平均数 x 估计μ时,则有: x) 2 ? 2 ? ? 1 2 ? (x ? 由样本方差 s 2 ? ) ?(x ? x n ?1 得 ? 2 2 s2 ? ? ? s( x ? x ) n ?1 ( n ? 1) s 2 ? 2 上式中,分子表示样本的离散程度,分母表示总 体方差,其 ? 服从自由度为n-1的? 分布. 2 例题 已知某农田受到重金属的污染,经抽样测定其铅浓度 为4.2,4.5,3.6,4.7,4.0,3.8,3.7,4.2μg· g-1,样本方 差为0.150( μg· g-1)2,试检验受到污染的农田铅浓度的方 差是否与正常农田铅浓度的方差0.065 ( μg· g-1)2相同。 此题为一个样本方差与总体方差的同质性检验 (1)假设 H : σ2=0.065,即受到污染的农田 0 铅浓度的方差与正常农田铅浓度的 方差相同。HA: σ2≠0.065 (2)水平 选取显著水平α=0.05 (3)检验 ? ? 2 (n ? 1) s 2 ?2 2 0.95 (8 ? 1) ? 0.150 ? ? 16.15 0.065 2 2 0.05 查附表,当df=8-1=7时, ? 2 0.05 ? 14.07, ? ? 2.17, 现实得? ? ? (4)推断 否定H0,接受HA,即样本方差与总体方差是 不同质的,认为受到污染的农田铅浓度的方 差与正常农田铅浓度的方差0.065 ( μg· g-1) 2有显著差异 二、两个样本方差的同质性检验 假设两个样本容量分别为n1和n2,方差分别 为s12和s22,总体方差分别为σ12和σ22,当 检验σ12和σ22是否同质时,可用F检验法。 当两样本总体均服从正态分布,且两样本 的抽样是随机的和独立的,其F值等与两 样本方差s12和s22之比。 二、两个样本方差的同质性检验 2 2 F=S1 /S2 且否从df1=n1-1,df2=n2-1的F分布。当 FFα时,接受H0: σ12=σ22,即认为两样本 的方差是同质的,当FFα时,否定H0: σ12≠σ22,即认为两样本的方差是不同质的。 例题 检验例4.7中两个小麦品种千粒重的方 差是否同质。 该题中,s12=22.933,s22=2.933, n1=n2=10 (1)假设 H 0: σ 12= σ 22, H A : σ 12≠ σ 22 选取显著水平α=0.05 (2)水平 (3)检验 F=S12/S22=22.933/2.933=7.819 (4)推断 否定H0,接受HA,即认为两小麦 品种千粒重的方差不是同质的 资 料 连续型资料 离散型资料 大样本 小样本 ? 检验 2 u检验 u检验 t检验 Thank You for Listening! 第3章 总体均数区间估计和假设检验 第119页

http://linkzoo.net/tongjituili/489.html
锟斤拷锟斤拷锟斤拷QQ微锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷锟斤拷微锟斤拷
关于我们|联系我们|版权声明|网站地图|
Copyright © 2002-2019 现金彩票 版权所有