学术投稿

流行病学调查报告数据标准化入口的SAS实现

王诗远;刘沛

关键词:流行病学, 调查报告, 数据标准化, 分析报告, 统计工作者, 自动分析, 应用, 统计图表, 统计分析, 数据整理, 多方合作, 变量标签, 变量命名, 报告程序, 数据库, 工作量, 不完整, 变量值, 制作, 障碍
摘要:Epidata以其操作简单,界面友好以及强大的录入和核查功能,尤其是可方便地下载免费的汉化版受到了我国流行病与医学统计工作者的青睐[1].但在应用中,尤其在大型流行病学分析报告过程中,由于多方合作及Epidata设计上的不合理等多方面原因,常常出现Epidata数据库变量命名不规范、变量标签及变量值标签缺失或不完整等问题.这些问题的存在不仅对数据整理造成了不便,也为统计分析和统计图表的制作增加了难度和工作量,同时也为标准化自动分析报告程序的构建和应用造成了障碍.
中国卫生统计杂志相关文献
  • 相对权重法在线性模型自变量相对重要性中的估计及其应用

    目的 在多元线性回归模型中,估计自变量的相对重要性.方法 运用相对权重法估计各变量的相对重要性,并应用于肝手术病人预计存活时间影响因素的评价.结果 血凝素、预后指数、酶功能的相对权重分别为:0.142、0.341、0.489;各变量对存活时间的贡献比例分别为:14.6%、35.1%、50.3%.结论 酶功能对肝手术病人预计存活时间的影响大,其次为预后指数,血凝素小.当自变量间存在相关时,相对权重法估计的自变量相对重要性结果更稳定精确,更加符合实际情况.

    作者:代鲁燕;沈其君;张波;黄启风 刊期: 2013年第01期

  • 社会基本医疗保障与卫生总费用的动态关系分析

    目的 探讨社会基本医疗保障对卫生总费用变化的作用.方法 利用2001~2010年辽宁省几种社会基本医疗保障和卫生总费用相关数据进行时间序列分析、筹资增长趋势分析与占卫生总费用比重变化分析.结果 从2002年起,卫生总费用平均每年以18.74%速度递增,其影响因素主要是社会医疗保障制度的建立和完善.到2011年,全省基本医疗保障经费占卫生总费用已经达到37.68%,成为卫生总费用构成的主体.结论 社会基本医疗保障在卫生总费用中占主体地位,是卫生总费用的主要筹资渠道.

    作者:王昕 刊期: 2013年第01期

  • 某院门诊接诊人数变动趋势分析

    本文通过分析我院近年来门诊接诊人数增长原因、门诊接诊人数构成变化、及门诊接诊人数的季节变动找出患者就诊时间上的规律及需求,从而为医院管理者及时制定相应的应对措施提供可靠依据.

    作者:陆春锦 刊期: 2013年第01期

  • 二阶验证性因子模型的AMOS实现

    目的 利用AMOS软件实现二阶验证性因子模型,通过实际的案例分析,以达到快速掌握SEM建模方法及AMOS软件准确实现的目的.方法 采用SPSS 15.0软件对CN-ADDQoL量表除两个独立分析的条目外的其余19个条目进行探索性因子分析,挖掘量表所隐含的深层意义与因子结构,提出初始模型,采用AMOS软件构建验证性因子模型对CN-ADDQoL量表的结构效度进行分析.结果 本研究的两个终模型只含有4个一阶因子,二阶因子与一阶因子关系很强(0.76,0.77,0.95,0.80),提示二阶因子能够充分表达一阶因子间的关系,且一阶与二阶因子模型拟合指数相差不大,一阶因子模型是一个更为省俭的模型,选取一阶验证性因子模型更为合理些.结论 研究2型糖尿病患者生存质量的影响因素时,把CN-ADDQoL量表判定为四维度量更为合理,运用AMOS软件可快速、方便地对量表进行结构效度分析.

    作者:付会斌;潘海燕;孔丹莉;丁元林 刊期: 2013年第01期

  • 《医学统计学》教学动画的设计与实现

    信息技术与学科课程的整合已经成为教育信息化进程中的一个热点和发展趋势[1].《医学统计学》是一门理论抽象、方法繁多、应用广泛的课程[2],目前教学过程中存在的普遍问题是:课时少,重点、难点内容多.动画作为信息技术中的重要组成部分,具有善于表现抽象的内容、以形喻理、深入浅出等特点.因此,在医学统计学教学过程中运用教学动画不仅是信息化教学改革的要求,更能提高知识传授的有效性.

    作者:罗虹;吴骋;贺佳 刊期: 2013年第01期

  • 南京市大学生亚健康状况及影响因素研究

    目的 了解南京市大学生的亚健康状况及影响因素,为制定科学的干预方法提供依据.方法 运用分层随机抽样的方法,对来自南京大学等四所学校的285名学生进行问卷调查,数据分析采用描述性统计分析,t检验和logistic回归分析.结果 南京市大学生的亚健康患病率为56.6%,在心理问题方面表现突出,例如渴望宁静(76.0%)和心烦意乱,应付不了(72.7%)高.女生的亚健康患病率高于男生,为64.2%(x2=6.721,P<0.01);大二学生的亚健康患病率高于其他组,为64.1%(x2=9.467,P<0.01);医学专业的亚健康患病率低于其他组,为35.4%(x2=20.517,P<0.01);适宜状态下的亚健康患病率低于其他组,为14.8%(x2=53.944,P <0.01);家庭年收入<1万元的学生的患病率高于其他组,为52.3%(x2 =8.422,P <0.01);每月个人消费小于600元的学生的亚健康患病率高于其他组,为57.9%(x2=32.895,P<0.01).同时,年级、专业、压力、家庭类型、每月个人消费和父亲健康程度是影响大学生亚健康状况的主要因素,OR(95% CI)值分别为4.718(1.171~19.007)、9.915 (2.623~ 37.480)、10.699(4.364 ~26.229)、1.214(0.109~13.493)、0.210(0.090~0.492)、0.165(0.053 ~0.512).结论 大学生的健康状况不容乐观,需要社会各方面加大关注,加强科学干预.

    作者:岳雨珊;俞君;朱黎婷;李忠汗;朱毅 刊期: 2013年第01期

  • 样本量及删失率对生存分析模型有效性和偏倚性的影响

    目的 探讨样本量及删失率对生存分析模型有效性和偏倚性的影响,为根据资料特点选用适合的生存分析方法提供参考依据.方法 以实际数据为总体,通过抽样模拟和删失模拟,比较不同样本量和删失率下,Cox模型和加速失效时间模型的有效性和偏倚性及其变化趋势.结果 对于大样本(≥500)或删失率较小(≤30%)的数据,两种模型的有效性和偏倚性相近,分析结果均较为可靠.当样本较小(300 ~400)或删失率较高(40%~60%)时,加速失效时间模型的分析结果更为可靠.结论 Cox模型对于大样本或删失率低的数据更为实用.加速失效时间模型的分析结果在样本量较少或删失率较高时更为可靠.

    作者:陈雯;陈昂;夏英华;凌莉 刊期: 2013年第01期

  • 双重差分模型在社区干预研究效果评价中的应用

    目的 介绍双重差分模型的原理和结构,及在社区干预准实验设计研究中的应用.方法 以“农村初级卫生保健项目(2001~2005周期)”家庭问卷调查资料为例,采用stata 9.2软件,拟合双重差分模型,并比较无协变量模型和含协变量模型的双重差分估计量.结果 两种模型的差分估计量接近,含协变量模型考虑了控制变量的影响,差分估计量更加准确.结论 双重差分法在社区干预准实验设计研究的效果评价中是一种适宜的方法.

    作者:刘小宁;高文龙;颜虹 刊期: 2013年第01期

  • 多水平模型在大学生预防艾滋病健康教育影响因素分析中的应用

    目的 探讨多水平模型在烟台市大学生艾滋病知信行影响因素中的应用.方法 采用整群随机抽样方法在烟台市4所高校抽取在校大学生作为调查对象,根据大学生艾滋病知识得分数据层次结构的特点,采用MLwiN 2.02软件进行多水平模型拟合.结果 大学生艾滋病知识数据存在聚集性,学校、学生两水平logistic回归和单水平logistic回归分析显示,性别、年级、生源地对大学生艾滋病知识得分的影响无统计学意义(P>0.05).双变量二分类反应变量模型拟合显示:知识和行为得分在学生水平上存在正相关(r =0.006,P<0.05).结论 多水平模型分析考虑了数据误差的层次性后,获得的结果更可靠;知识得分与艾滋病个人高危行为的相关关系比较有限,艾滋病的健康教育不应只注重知识的提高.

    作者:贾改珍;闫阳;徐天和;林林;韩春蕾;王玖 刊期: 2013年第01期

  • Epworth量表中缺失数据处理方法研究

    目的 结合调查数据,比较不同量表资料缺失数据的处理方法.方法 对不同缺失程度的随机缺失数据集采用条目均数填补法、自身均数填补法、多重填补法分别进行处理,并模拟100次,比较填补结果.结果 缺失率较低时,几种方法效果均较好.随着缺失率增高,填补前后条目及总分一致率逐渐下降,比较而言,自身均数填补法效果好,其次是多重填补法和条目均数填补法.结论 Epworth量表中缺失数据可采用自身均数填补法进行填补.

    作者:王睿;马修强;陆健;赵艳芳;贺佳 刊期: 2013年第01期

  • 决策树模型与回归模型在天津市某区公务员健康状况分析中的应用与比较

    目的 了解天津市某区公务员健康状况的影响因素,为提高该人群的健康水平提供依据.方法 于2008年9 ~12月,采用整群抽样的方法对天津市某区公务员进行健康状况及影响因素的问卷调查.应用SAS 8.2 Enterprise Miner模块建立决策树模型和回归模型,对该区公务员人群的健康状况影响因素进行分析和预测.结果 该区公务员总体患病率为47.0%,模型筛检出影响健康状况的因素有:年龄、体质指数、吸烟、被动吸烟、饮酒、睡眠时间、按时吃饭情况、体育锻炼花费时间、文化程度、婚姻状况,亚健康分值、心理健康分值.将logistic回归模型与决策树模型进行预测性能的比较,ROC面积比较结果发现,两者差别无统计学意义(x2=1.6073,P=0.2049).结论 公务员人群健康状况不容乐观,各种慢性病患病率较高,是今后开展健康管理的重点群体.

    作者:魏凤江;崔壮;李长平;宋春华;朱宝;刘媛媛;马骏 刊期: 2013年第01期

  • 新疆某医院老年患者住院情况分析

    随着人口老龄化步伐的加快,2010年底新疆60岁以上老年人口已达233.5万,占总人口的10.8%,说明新疆已经迈入老龄化社会[1].由于老年人的患病风险较大,60岁以上人群的患病率是一般人群的2.5~3.0倍[2],医院将面临人口老龄化的严重挑战.了解医院老年患者住院情况及其变化规律,有利于医疗资源有效配置,并能为医院规划提供可靠依据.

    作者:吴文华;黄晓威;修燕;邱杰;邵亚楠 刊期: 2013年第01期

  • 门诊患者就诊排队时间对应分析

    目的 了解某院各科门诊患者就诊排队时间情况.方法 随机抽取一周门诊就诊患者资料,采用定量分析和简单对应分析结合的方法对患者就诊排队时间及其影响因素进行分析.结果 全院门诊患者平均就诊排队时间为(31.84 ±34.07)分钟,排队时间位列全院前五位的专科为妇科、消化内科、口腔科、心血管内科、耳鼻喉科.不同星期、上下午、职称、每医生每工时门诊负担不同的科室,就诊患者就诊排队时间有差异(均P <0.01),各影响因素与排队时间对应分析结果与定量分析结果基本一致.结论 周四与周五就诊患者排队时间较其他天短,上午就诊患者排队时间较下午长,随医生职称升高,其接诊患者就诊排队时间加长,每医生每工时门诊负担较重的科室较负担轻的科室,其接诊患者就诊排队时间要短.此外,各影响因素与排队时间的定量分析与简单对应分析结果高度一致,但后者较为直观.

    作者:马玉全;尹平;杨晓慧;梅文华 刊期: 2013年第01期

  • 843例市区儿童意外伤害的院前急救分析

    儿童意外伤害已日益成为危害儿童生存及其质量的主要原因,本文通过对我市近6年院前急救的843例儿童意外伤害的病例回顾性统计分析,以期总结规律并能引起社会各界的重视,以减少各种意外伤害的发生.

    作者:宋成珍;李立新 刊期: 2013年第01期

  • 基于结构方程模型的大学生亚健康量表效度测评

    目的 考量《中国大学生亚健康状态测量量表》的结构效度.方法 采用结构方程模型的验证性因素分析,对1500名大学生施测以检验分量表和总量表的结构效度,同时采用可靠性分析再次验证量表的内部一致性、稳定性信度.结果 总量表和各分量表的一致性系数(α值)在0.803 ~0.845,12个维度的α值在0.821 ~0.851,稳定性系数均在0.70以上;3个分量表具有接受度较高的结构效度:卡方值与自由度的比值都小于3.0,TLI、CFI值均超过0.90,RMSEA值介于0.075 ~0.042,SRMR值都接近0.05;总量表具有接受度更佳的结构效度:x2/df为2.543;TLI、CFI值均超过0.95;RMSEA值为0.05,SRMR值为0.04.结论 量表可靠性强、结构效度佳,可作为我国大学生亚健康状态研究的测量工具.

    作者:郭太玮;朱勤;施鸿飞 刊期: 2013年第01期

  • 29957例出院病人疾病构成的帕累托图分析

    本文运用帕累托图分析2009年我院出院病人疾病构成情况,以了解阳江及周边地区主要病种、多发病种和正在危害人们身体健康的潜在疾病,以引起疾病监控部门和广大人民群众的重视.

    作者:陈健峰 刊期: 2013年第01期

  • 利用病例-对照研究结果统计量反推原始数据的计算方法

    在流行病学研究中,病例-对照研究是常用的方法之一.病例-对照研究数据分析的基本形式是不匹配不分层的四格表形式.基于四格表可计算病例-对照研究中表示疾病与暴露之间关联强度的指标比值比(odds ratio,OR)及其相关统计量(如OR值的标准差等).

    作者:王亚菲;裴丽君;卜雯婷;陈功;宋新明;郑晓瑛 刊期: 2013年第01期

  • 样本量估计及其在nQuery和SAS软件上的实现——率的比较(五)

    2.2.3 多样本率的差异性检验2.2.3.1 多个样本率比较的x2检验方法:Lachin(1977)[4]提出的多样本率检验的样本量估计是建立在自由度为g-1,非中心参数为N△2的非中心x2分布基础上的,检验效能的计算公式为,1-β=1-x2[x21-α,(g-1),g-1,N△2] (2-33)其中,π=8∑j=1rjπj/8∑j=1rjπj,v=8∑j=1rj(πj-(π)2/8∑j=1rj,△2 =v/(π)(1-(π))式中,g为组数;(π)为总阳性率;rj为各组样本量与第一组样本量的比值;v为率的整体标准误;△2为效应量.

    作者:朱玲湘;唐欣然;段重阳;陈平雁 刊期: 2013年第01期

  • 厦门市社区卫生服务中心资源配置调查分析

    目的 调查分析厦门市2010年社区卫生资源配置现状及公平性,了解居民满意度,为进一步提高社区卫生服务质量提供参考.方法 采用多阶段随机抽样选取社区卫生服务中心进行调查,应用洛伦茨曲线和基尼系数评价卫生服务公平性,应用Likert量表评价居民满意度.结果 共调查8家社区卫生服务中心;基尼系数分别为:人员编制G=0.319、固定资产G=0.470、财政补助G=0.631;居民对多个服务项目评分较高,尤其在看病用时和医生态度方面.结论 社区卫生服务中心是多数居民的首诊地点;其卫生资源配置的公平性较好,尤其在人员编制方面,但仍需加强财政投入;居民总体满意度较高.

    作者:林言冰;陈书;潘欢欢;汪金杨;刘彬;张寅坤;方亚 刊期: 2013年第01期

  • 应用指数平滑法预测上海市甲型病毒性肝炎发病趋势

    目的 应用指数平滑法拟合和预测本市甲肝疫情.方法 分别以1990~2008年按年度和月份的上海市甲肝发病资料数据建立指数平滑模型,以2009年的数据来评价模型的效果.结果 上海市甲肝发病趋势明显下降,年发病数据采用Holt趋势指数平滑模型佳,按月分布发病数使用Holt-Winters相乘模型拟合为佳,预测模型具有一定的参考意义.结论 针对上海市甲肝发病的不同类型数据,均可选用不同指数平滑模型拟合,该方法简单易行,为传染病预测提供了参考.

    作者:朱奕奕;赵琦;冯玮;王晔;徐飚 刊期: 2013年第01期

中国卫生统计杂志

中国卫生统计杂志

主管:中华人民共和国国家卫生和计划生育委员会

主办:中国卫生信息学会 中国医科大学