您的当前位置:首页正文

多分类有序反应变量L0gistic回归及其应用

2021-08-04 来源:我们爱旅游
维普资讯 http://www.cqvip.com 第31卷第10期 同济大学学报 Vo1.31 No.10 20o3年10月 JOURNALOFTONGJIUNIVERSITY Oct.20o3 多分类有序反应变量Logistic回归及其应用 高歌,张明芝 (苏州大学公共卫生学院,江苏苏州215007) 摘要:对近年发展起来的多分类有序反应变量Logistic回归进行了补充和完善,设计出对样本数据的应用条件 做 检验的方法,证明了比数比在分析自变量作用中的实际意义.随机抽取2002年国家执业医师资格临床实 践技能考试30岁以下本科毕业考生5 000人,以考生的考试成绩(3分类有序变量)为反应变量,以考生的性别、 工作单位级别、考试评分方法、考官回避制度、考题重复次数、考试合格率控制措施等9个影响因素为自变量,进 行多分类有序反应变量逐步Lo ̄tic回归分析.研究结果已为卫生部改革和完善国家医师资格考试方法、措施提 供了重要的科学依据. 关键词:多分类反应变量;Logistic回归;比数比;医师资格 中图分类号:0212.1 文献标识码:A 文章编号:0253—374X(2003)10—1237—05 Polytomous Logistic Regression for Ordinal Response and It’S Appl iance GAO Ge,ZHANG Ming-zhi (Public Health School,Suzhou University,Stmhou 215007,China) Abstract:Polytomous Logistic regression for ordinal response was perfected,the mothod of;( test Was designed ofr applicable conditions about sample data,and the effect of independent variable to response variable by odds ratio Was proved.5 000 candidates(ages<30)who had the degree of bachelor of medicine taking ofr the cliniacl examination ofr national licensing of doctors in China in 2002 were samplde at random.Polytomous logistic stepwise regression for ordinal reponse Was achieved by response variable:the performance of clinical examination nad 9 independent variable:sex of candidates,the grades of units that candidates were in,the methods of assessing performance,avoiding measure by assessor,et a1.The result of the studise provided scientific evidences for laying down the methods and the measures of the national examination ofr licensing fo doctors in China by the Health Ministry. Key words:polytomous ordinal response variable;Logistic regression;odds ratio;licensing fo doctors 两分类反应变量的Logistic回归在生物医学领域应用十分广泛,但生物医学领域不少反应变量属多 分类有序变量,由于在多分类有序反应变量的Logistic回归分析中,样本数据应用条件的假设检验、比数 比的作用等问题虽从理论上得到解决,但假设检验的具体方法、统计量计算公式、比数比大小的实际意义 等未见报道,致使多分类有序反应变量Logistic回归在生物医学领域应用很少,且得不到正确的应用.本 文对多分类有序反应变量Logistic回归应用条件的假设检验、比数比的分析等进行了研究,研究结果在作 者主持的卫生部课题中取得了成功的应用效果. 收稿日期:2002—09—06 基金项目:卫生部科技专项经费资助项目(1509235002) 作者简介:高歌(1950一),男,安徽安庆人,教授.E-mail:gaoge01@163.oDm 维普资讯 http://www.cqvip.com 同济大学学报 第31卷 1 多分类有序反应变量Logistic回归 1.1 回归方程 设有序反应变量Y有愚个水平:1,2,…,愚;x=(z1,z2,…,z )为自变量向量.Y取 水平的概率 =P(y= I x), =1,2,…,愚,/r1+7r2+…+ =1.将愚个水平分为两类:{1,2,…, }与{ +1, +2,…, 愚}, =1,2,…,愚一1,按两分类反应变量Logistic回归模型[¨,对多分类有序反应变量Logistic回归,当各 zf为两分类、多分类有序或连续自变量时,需拟合如下愚一1个两分类Logistic回归方程[ 】: In[∑Pi/(1一∑P = +∑bi置, =1,2,…,愚一1 (1) 这里岛为 的估计值, 为截距参数的估计值,b 为偏回归系数 的估计值.当某个z 为r(,-t3)> 分类无序自变量时,需在回归方程中设立r一1个仅0,1两水平的虚拟自变量【2.这里式(1)中的 包括 2J了虚拟自变量的个数.求解参数采用极大似然估计.以上模型的假设条件(也即样本数据的应用条件)是: (i=1,2,…,m)的大小与 (J=1,2,…,愚一1)无关. 1.2应用条件的假设检验 1.2.1 pf的计算 由式(1)可推导得 P exp(aj+∑blz )/[1+exp(aj+∑bi置)],J=1,2,…,愚一1 i=l (2) (3) i=l ’ni=1 ’n 1P exp(aj一1+∑blz )/[1+e)q)( 一1+∑bizf)],歹=2,3,…,愚一1 式(2)减去式(3)得 exp( +∑biz ) i=1 exp(aj一1+∑bizf) i=1 岛 =l i=l J=2,3,…,愚一1 (4) 1+e)q)( +∑bi z ) 1+exp(aj一1+∑bi zf) P^=1一∑岛=1一exp(aH+∑blz )/[1+exp(a¨+∑bl置)] 1.2.2理论频数T的计算 (5) 假设z1,z2,…,z 分别有 1, 2,…, 个水平(当某个z 为连续变量时, 为划分的组段数),则 全部观察对象划分为】][ 组(不同自变量的不同水平为一组),每组有k个格子( 的水平数),共有 =愚 II 个格子.设第h格的样本频数为N^,则第h格的理论频数丁^为 rh=Nh{exp(a。+∑biz )/[1+exp(口。+∑bizf)]},Y=1 =l l=l (6) e)【p( 一1+∑bl置)] 1+exp( 一1+∑6 )J rh=Nh(1一∑岛),Y=愚 j=1 m l,l’ _y,' =2, -' '3, '…, 愚一1、( 7) (8) 其中z1=1,2,…, 1;z2=1,2,…, 2;…zm=1,2,…, m;^=1,2,…,kIIni. 1.2.3卡方检验 用A^记第h格的实际频数,根据卡方分布的原理 维普资讯 http://www.cqvip.com 第10期 高歌,等:多分类有序反应变量Logistic回归及其应用 ;(z: (9) h=1 jh 其自由度为 £,= 一(忌一1)一 —l上 (10) 在自由度的计算中, 为格子总数,忌一1为口 (J=1,2,…,忌一1)的个数, 为bf( =1,2,…, )的 个数,且在计算各组各格子的频数中,受到各组频数的限制,故自由度再减少Ⅱ . 1.3比数比分析 由式(1),多分类有序反应变量Logistic回归方程也可表示成以下比数(odds): o=∑ /(1一∑Pi)=exp(aj+∑bl ), =1,2,…,忌一1 (11) 在式(11)中,五取C和d水平的比数分别为 O(x )=exp(a ̄+bxz1+…+bfz 十…+6, ) (12) O(xla)=exp(a ̄+bxxt+…+b Xld+…+6, ) (13) 其中:i=1,2,…, ; =1,2,…,忌一1. 用式(12)除以式(13),其他自变量不变,得zi两水平间的比数比(odds ratio):R=0(z )/O(x )= exp[bf(z 一z )], 1,2,…, ; =1,2,…,忌一1.可见zf的任两水平的比数比与 无关,与aj无关.不 妨设 =P,f(P)=p/(1一P),则zi取d水平的比数为P /(1一P )=f(p ),z 取c水平的比数为 f(p ),进一步得 取d和C两水平的比数比为厂(户 )/f( ).因f(P)是P的单调增函数,故当比数比 厂( )/f( )>1时,必有 > ;当比数比厂( )/f(P )<1时,必有P <P .另外,当P ,P 均很 小时,R≈ /t, 称相对危险度(relative risk),表示户 是P 的多少倍. 2应用实例 2.1实例背景及变量确定 大多数国家已实施国家医师资格考试,美国、Et本、德国已分别实施87,56,28年L3J.我国从1999年开 始实施国家医师资格考试【引.据世界卫生组织(WHO)提供的79个国家的资料表明【3I,各国的医师资格考 试均由理论知识考试和临床实践技能考试两部分组成.我国的医师资格考试,考生必须先通过各省、自治 区、直辖市卫生厅(局)组织的临床实践技能考试后,方可参加卫生部组织的综合笔试 J. 临床实践技能考试有考生、考官、考试材料3个可变因素,必须使考官、考试材料标准化,才能对考生 作出正确、可靠的测量 6.在我国目前的医师资格临床实践技能考试中,考官、考试材料方面均存在着比 较严重的标准不一致问题.如:各考试小组各考官并非独立评分,易受主考官个人意见的左右;各考试基地 考官来自本单位的比例高达50%,未能回避本单位的考生;因考生多、考试基地少,考试时间长达10 d左 右,致使不同考生在不同时间抽中同一考题,有的考题竞重复考试8次;考官评分标准掌握偏松,有的省临 床实践技能考试合格率高达98%,而综合笔试合格率却只有50%;大多数考试基地模拟人质量差,无法达 到测试的要求;考试材料中“病人”由考生相互扮演,“病人”无阳性体征,无法完成欲测试的内容. 作者随机抽取2002年国家执业医师临床实践技能考试30岁以下本科学历考生5 000人.确定9个 自变量如下:①性别z1(男,z1=0;女,z1=1);②工作单位级别z2(二级及以下医疗机构,z2=0;三级医 院,z2=1);③考试评分方法z3(考官独立评分,z3=0;考官集体评分,z3=1);④考官回避制度z4(考官 未回避本单位考生,z4=0;考官已回避本单位考生,z4=1);⑤考题重复次数z5(重复3次及以上,z5= 0;重复3次以下,z5=1);⑥合格率控制措施z6(有控制,z6=0;无控制,z6=1);⑦考试基地级别z7(二 级甲等医院,z7=0;三级医院,z7=1);⑧模拟人质量z8(质量差,z8=0;质量好,z8 1);⑨“病人”体征 z9(无阳性体征,z9=0;有阳性体征,z9=1).以考生的考试成绩 (优,Y=1;中,Y=2;不合格,Y=3)为三 分类有序反应变量. 维普资讯 http://www.cqvip.com 1240 同济大学学报 第31卷 2.2 Logistic回归 表1 Logistic逐步回归极大似然估计分析 Tab.1 Analysis of nH 哪likelihood estimates onLogistic stepwise regression 对以上自变量与反应变量进行多分类有序 反应变量Logistic逐步回归分析,采用 statistical analysis system(SAs)软件【2J,取选人 因子的概率临界值为0.10.取删除因子的概率 临界值为0.10,SAS运行结果,除z1,z7被剔 除外,其他7个自变量均有统计学意义(P≤ 0.1).对回归方程整体检验(H0: =卢3= = =卢6=卢8= 9=0),SAS采用一2log L(L代 表似然函数值)、Score两种方法,本例P值均 为0.000 1,有高度统计学意义.参数估计及其 假设检验、比数比见表1. 2.3样本数据应用条件的假设检验 7个自变量均为2个水平,各自变量不同水平的组合共划分成2 =128组,对每一组,按式(2),(4), (5)分别计算P1,P2,P3. 第1组,7个自变量均取0: P1=exp(一1.017 0)/[1+exp(一1.017 0)]≈0.265 6; P2=exp(O.466 4)/[1+exp(O.466 4)]一P1≈0.614 5—0.265 6=0.348 9; P3=1一Pl— 2≈1—0.614 5=0.385 5. 第2组,z2取1,其他自变量均取0: P1=exp(一1.017 0+1.105 7 x 1)/[1+exp(一1.017 0+1.105 7 x 1)]≈0.286 7; P2=exp(O.466 4+1.105 7 x 1)/[1+exp(O.466 4+1.105 7 x 1)]一P1≈0.639 2—0.286 7 0.352 5; P3=1一Pl—p2 ̄-i一0.639 2=0.360 8. 第128组,7个自变量均取1: P1=exp(一1.017 0+0.105 7 x 1+0.092 8 x 1—0.155 3×1—0.160 5 x 1+0.142 8 x 1+ 0.109 1 x 1—0.086 9 x 1)/[1+exp(一1.071 0+0.105 7 x 1+0.092 8 x 1—0.155 3x 1— 0.160 5 x 1+0.142 8 x 1+0.109 1 x 1—0.086 9 x 1)]= exp(一1.017 0+0.043 2)/【1+exp(一1.017 0+0.043 2)]≈0.274 1; P2=ew(O.466 4+0.0432)/[1+exp(O.466 4+0.043 2)]一pl ̄-,O.624 7—0.274 1=0.350 6; P3=1一Pl—p2 ̄,l一0.624 7=0.375 3. 第1组实际频数合计53,对应Y取1,2,3水平格子的实际频数A分别为12,20,21.按式(6)~(8)计 算可得所对应的第1组3个格子的理论频数T分别为:14.076 8(53 x 0.256 96),18.491 7(53 x 0.348 9),20.431 5(53x0.385 5);第2组实际频数合计29,对应Y取1,2,3水平的实际频数A分别为 10,8,11,按式(6)~(8)计算得第2组3个格子的理论频数T分别为:8.314 3(29 x 0.286 7),10.222 5 (29x0.352 5),10.463 2(29x0.360 8);……;第128组实际频数合计31,对应Y取1,2,3水平格子的实 际频数A分别为10,12,9,按式(6)~(8)计算得第128组3个格子的理论频数T分别为:8.497 1(31 x 0.274 1),10.868 6(31 x 0.350 6),11.634 3(31 x 0.375 3).按式(9): =(12—14.076 8) /14.076 8+ (20—18.491 7) /18.491 7+(21—20.431 5) /20.431 5+(10—8.314 3) /8.314 3+(8—10.222 5)2/ 10.222 5+(11—10.463 2) /10.463 2+…+(10—8.497 1) /8.497 1十(12—10.868 6) /10.868 6+(9 11.634 3) /11.634 3 ̄-120.912 3.由式(10)得:L,=3 x 27一(3—1)一7—27=245.因为 =120.912 3 <262.73= 3.15(24O)< 3.15(245),故P>0.15.可认为样本数据符合多分类有序反应变量Logistic回归的 应用条件. 维普资讯 http://www.cqvip.com 第10期 高歌。等i多分类有序反应变量Logistic回归及其应用 2.4比数比分析 SAS计算的比数比,一律是用高水平的比数除以低水平的比数.从表1中看出:①X2的比数比为 1.814>1,可认为三级医院的考生比三级以下医疗机构考生的考试合格率高;②z3的比数比为1.275> 1,可认为考官集体评分的考生比考官独立评分的考生合格率高,集体评分易受到考试小组主考官个人意 见的左右;③.274的比数比为0.790<1,可认为考官回避本单位考生比未回避本单位考生时考生考试合格 率低;④.275的比数比为0.860<1,可认为考题重复3次以下比重复3次及以上考生合格率低;⑤X6的比 数比为1.738>1,可认为考试合格率考前无控制比考前有控制要高;⑥.278的比数比为1.390>1,可认为 模拟人质量好考试合格率高;⑦.279的比数比为0.917<1,可认为考试“病人”有阳性体征比无阳性体征考 试合格率低. 3结语 本文对多分类有序反应变量Logistic回归进行了补充和完善:推导出各自变量不同水平组合反应变 量取各水平的概率、理论频数的计算公式,设计出对样本数据应用条件做卡方检验的方法;证明了自变量 任两水平间的比数比与因变量各水平、各回归截距无关;分析出在其他自变量不变时,有统计意义的某自 变量任两水平间的比数比与对应Y取任何水平的概率间大小的关系. 以上研究结果成功应用于国家医师资格临床实践技能考试调查研究中,并据此提出6条改革措施:① 采用考官独立评分方法;②考官对本单位考生采取回避制度;③考题重复次数少于3次;④对考试合格 率采取考前控制措施;⑤尽快更新各考试基地的考试模拟人;⑥对考试“病人”进行具有阳性体征的统一 培训. 参考文献: [1]金丕焕.医用统计方法[M].上海:复旦大学出版社,2002. [2]金丕焕,苏炳华,贺佳.医用SAS统计分析[M].上海:上海医科大学出版社,2000. [3]梅人朗,李春昌.医学考试的理论与实践[M].上海i上海医科大学出版社,1990. [4]周东海,程振华.浅议我国医师资格考试的特点[J].中国卫生,2000,19(2):18—19. [5]张卫红,赵小文,李键,等.加强临床实践,培养高层次的医学人才[J].中国卫生人才,2000,15(11):27—28. [6]L;nd D s. e efect of the duration and structrue of a surgery clerkship on student performance[J].Journal of Surgical Research,1999,84 106—111. 下期文章摘要预报· 收益还原法及其在林地价格评估中的应用 单胜道,尤建新 收益还原法是国际上公认的土地价格评估的基本方法之一.林地收益价格主要由纯 收益和还原利率决定.目前,我国林地市场尚未发育,收益还原法是一种较好的林地价格 评估方法,但在具体的应用中受到了一定的限制.结合实例,对收益还原法在林地价格评 估中的应用作了客观的评价. 

因篇幅问题不能全部显示,请点此查看更多更全内容