林德南;梁亮;梁实;陈研;宗文萍;廖剑锋;王心旺
R语言作为主流趋势的统计软件正在发挥越来越重要的作用.而Python语言作为一种面向对象的高级编程语言[1],易学易用,特别是近年来以Anaconda为首的Python发行版整合了大量的数据科学运算工具,使得Python能在数据处理领域发挥更大的作用.在实际应用中,一方面,R语言统计分析功能强大,但运算速度较慢且内存管理效率不高[2],导致其在大型项目的分析与管理方面处于劣势;另一方面,虽然Python有完善的内存优化系统,且可以方便地完成数据获取、软件接口对接和数据库交换等数据管理工作,但在数据分析方面又需借助R语言得以实现.鉴于此,本研究将结合两者的优势,介绍Python对R语言的调用方法,并通过实例展示其可行性.
作者:平凯珂;陈平雁 刊期: 2017年第02期
目的 比较五种基于LASSO的高维数据线性回归模型统计推断方法:LASSO-惩罚计分检验,多重样本拆分、稳定选择、低维投影、协方差检验.方法 采用R软件模拟不同情形的高维数据,用五种方法做统计推断,以期望假阳性率和检验效能为评价指标,比较这五种方法在不同高维数据情形下的表现.结果 在理想高维数据情形下,除协方差检验推断结果保守外,其余方法表现都较好.在复杂高维数据情形下,LASSO-惩罚计分检验的检验效能是五种方法中高的,其次为多重样本拆分,而LASSO-惩罚计分检验的EFP也是高的,多重样本拆分的EFP基本接近0.结论 在常见复杂高维数据中LASSO-惩罚计分检验和多重样本拆分是两种较好的高维线性回归模型统计推断方法,两者相对而言前者较宽松,后者较保守.在实际应用中可根据应用需求来选择合适的统计推断方法.
作者:赵俊琴;王慧;王彤 刊期: 2017年第02期
目的 探讨参数正则稳态脆弱模型在临床复发事件数据中的应用.方法 以慢性肉芽肿(CGD)患者为例构建参数正则稳态脆弱模型,假定复发事件的基线分布服从威布尔分布、指数分布或Gompertz分布,脆弱项服从正则稳态脆弱分布,采用边际极大似然估计(MMLE)来实现参数估计并进行不同条件下模型对比分析.结果 参数正则稳态脆弱模型既考虑了个体内复发时间的相关性,又考虑了不同个体间的异质性,可以用来分析慢性肉芽肿患者反复住院的影响因素,结果解释合理,软件实现便捷.结论 参数正则稳态脆弱模型适合分析临床复发数据并进行临床疗效评价或者影响因素研究.
作者:郭强;王晶晶;刘桂芬;罗天娥 刊期: 2017年第02期
结构方程模型(structural equation modeling,SEM)作为多变量资料统计分析技术之一,其在营销学、心理学、管理学、社会及行为科学等领域的量化研究上已成为主流分析技术.近5年,在生物-心理-社会医学模式的指导下,SEM在医学相关领域的科研工作中应用活跃,包括医疗纠纷、职业倦怠感、心理健康状况、自我管理行为等变量的成因分析或中介机制的探索,以及量表结构效度评定的验证性因素分析.本文在广泛参阅国内外SEM相关著作及文献的基础上,对SEM在科研工作中的应用误区进行剖析,以减少SEM的分析判断失误,提高其统计分析质量,使各学科研究过程更为科学、规范.
作者:王丽娜;李莎莎 刊期: 2017年第02期
目的 分析2012年山东省监测点居民伤害死亡的流行特征和疾病负担,为制定伤害预防控制策略和措施提供参考.方法 采用死亡率、早死指数、潜在寿命损失年(PYLL)、潜在工作损失年(WPYLL)、平均潜在工作损失年(AWPYLL)指标对伤害死亡数据进行分析.结果 2012山东省监测点居民伤害死亡率为53.36/10万,男性(72.8/10万)高于女性(33.45/10万),农村(57.64/10万)高于城市(42.92/10万),伤害死亡的主要原因依次是交通事故、自杀、其他意外伤害、跌落、淹溺和意外中毒.0 ~14岁年龄组人群伤害的主要死因是溺水,15 ~64岁人群则是交通伤害,65岁及以上人群则以自杀和交通事故为主,其次为跌倒.他杀和淹溺的早死指数位居高,男性高于女性,他杀在城市较高,而淹溺在农村较高.因交通事故导致的PYLL和WP YLL分别为82858人年和46300人年,因自杀导致的PYLL和WPYLL分别为31710人年和15377人年,男性均明显高于女性,农村高于城市.结论 伤害是导致“早死”和寿命损失的重要疾病负担,伤害死亡带来的社会和经济损失应引起相关部门的重视,应根据城乡、性别及年龄的实际情况采取针对性的有效防控措施.
作者:付振涛;王媛媛;郭晓雷;吴炳义;王在翔 刊期: 2017年第02期
目的 了解2010-2014年某医院普外科住院病例情况,探索时间序列模型在普外科住院病例中的应用,为医院管理决策服务.方法 在北京市某三级医院统计室导出2010年1月-2015年9月普外科住院病例资料,其中2010-2014年数据用于建立时间序列模型,2015年1到9月数据用于验证所建立的模型,具体统计过程借助SPSS 18.0完成.结果 2010-2014年普外科住院治疗人数逐年增加,从3614例上升至6841例,Winters可加性模型可对普外科住院病例进行较好拟合,R2 =0.907,总体相对误差为-5.19%.结论 时间序列分析可应用于临床,为资源和人员配置提供数据支持.
作者:王伟辉;崔燕;韩宝泉 刊期: 2017年第02期
目的 利用DEA评价2009-2013五年间各区样本社康中心基本公共卫生服务的效率,寻求有效的资源配置措施和方法,对进一步提高政府卫生支出效益进行探讨并提出可行的政策建议.方法 随机抽取深圳市各区67家社康中心,利用数据包络分析,对基本公共卫生服务项目进行效率评价.结果 (1)深圳市社区基本公共卫生服务的综合效率、纯技术效率、规模效率总体较高,但仍有部分地区在不同年度间存在投入冗余与产出不足情况;(2)规模效率少于1的地区除了2009年的宝安区、龙华新区和大鹏新区是规模递增,大部分地区处于规模报酬递减阶段.结论 为了达到优配置的基本公共卫生服务项目投入与产出,政府及各级公共卫生服务机构必须形成有效落实的政策法规,优化资源投入,合理的管理架构,高效的服务质量,健全的绩效考核体系,从而推动项目的有效开展,提高资源利用率.
作者:林德南;梁亮;梁实;陈研;宗文萍;廖剑锋;王心旺 刊期: 2017年第02期
目的 比较主成分回归分析与投影寻踪回归分析在数据存在共线性时效果之差别.方法 利用实际数据从拟合效果和预测效果两方面评价两种建模方法的优劣.结果 主成分回归模型的决定系数为0.8172,相对误差绝对值的平均值为6.42%,预测误差的均方为0.61;投影寻踪回归分析各模型的决定系数为0.8851~0.9944,相对误差绝对值的平均值为1.11% ~4.81%,预测误差的均方为0.03 ~ 0.38.结论 本实例数据(存在一定共线性)分析结果表明,投影寻踪回归分析的拟合效果与预测效果均优于主成分回归分析.
作者:胡完;孙岩松;胡良平 刊期: 2017年第02期
目的 通过Apriori算法分析高额医疗费用患者相关指标之间的关系,试图找到影响医疗费用的因素,利用R扩展医学统计的工作思路.方法 利用R软件中的arules包对2015年某院出院的高额治疗费用患者做关联规则分析,探索出院科室、住院天数与总费用,出院科室与性别,出院科室与药费,出院科室与有无手术的关联规则,并分析其原因.结果 某些科室住院天数越多,费用越高;而某些科室的住院天数与费用没有太大关系;胸外、心内、神外、ICU、心外五个病区出院的高额费用患者通常为男性;呼吸、ICU、心外、胸外、神外五个病区出院的高额费用患者的药费一般大于2万元;心外、胸外、骨科等病区的高额医疗费用的出院患者通常要行手术治疗手段.结论 Apriori算法可以挖掘数据间内在的关系,为临床决策提供一定的理论支持,R语言可以快捷的完成医学统计工作.
作者:郭慧敏;杜军;黄路非 刊期: 2017年第02期
目的 探讨基于LASSO回归模型与百度搜索数据构建流感疫情预测系统的可行性.方法 采用Bagging方法和模型性能的多指标优化评估策略,对传统LASSO回归模型进行改进,构建性能提升的集成LASSO回归模型,将其应用于中国大陆地区季节性流感流行趋势的预测研究.结果 与传统LASSO回归模型相比,本研究所构建的集成LASSO回归模型对2011年至2015年中国大陆地区流感流行趋势的预测偏差更小,说明集成LASSO回归模型的外部推断能力更强,适合于流感疫情的预测分析;本研究开发了开源的R软件程序包SparseLearner,方便用户进行调用和进一步开发研究.结论 Bagging方法和多指标优化评估策略相结合所构建的集成LASSO回归模型,有效地增强了传统LASSO回归模型的性能.本研究所构建的预测模型可以应用于流感等传染病疫情的预测研究.
作者:郭貔;王力;郝元涛 刊期: 2017年第02期
卫生统计学是开展生物医学实验、临床试验、流行病学调查和卫生管理医学研究的重要方法支撑.如何针对不同的资料类型,灵活地采用适宜的统计分析方法,挖掘出有意义的影响因素尤为重要.在卫生统计学习过程中,医学生普遍反映统计方法种类繁多,从t检验,到方差分析、简单线性回归、到多重线性回归,logistic回归等,看似每个章节都“独树一帜”,遇到实际问题,却无从下手[1-3];而教师由于教学时间紧迫,马不停蹄地向学生灌输各种方法,“埋头赶路”,容易忽略各个章节的有机联系.
作者:曹红艳;罗艳虹;张岩波 刊期: 2017年第02期
目的 了解铁岭市城区居民食管癌死亡趋势,为恶性肿瘤防治提供科学依据.方法 对2007-2015年城市居民食管癌死亡登记资料进行分析,计算粗死亡率、标化死亡率,用Joinpoint Regression Program 4.3.1分析年度变化百分比(APC),用GM(1,1)灰色模型进行预测.结果 铁岭城市居民2007-2015年食管癌的年均粗死亡率为7.95/10万,标化死亡率5.26/10万,食管癌粗死亡率年度变化百分比为1.95%;男性年均死亡率(粗死亡率为13.87/10万,标化死亡率8.78/10万)高于女性(粗死亡率为2.10/10万,标化死亡率1.54/10万),差异有统计学意义(x2=8.99,P=0.003);GM(1,1)模型预测2016-2019年铁岭市城市居民食管癌死亡率将继续呈上升趋势.结论 铁岭市食管癌死亡率呈上升趋势,尤其对60岁以上男性健康的威胁较大,应重视开展综合防治措施,降低食管癌对居民健康的威胁.
作者:张亮;陆文;赵侠 刊期: 2017年第02期
目的 建立慢阻肺急性加重人院人次的自回归积分滑动平均模型(ARIMA),科学预测慢阻肺急性加重入院人次,为该病的诊治以及合理利用医疗资源提供理论依据.方法 使用R语言(v.3.2.3)做模型的识别、模型的参数估计与检验,建立ARIMA模型,对某院2013-2015年慢阻肺急性加重出院人次进行模型拟合,用2016年1~3月的预测值与实际值作比较,检验模型的预测能力,并且预测2016年4-6月慢阻肺急性加重入院人次.结果 经过多次检验,确定ARIMA(2,2,1)(1,1,1)12模型预测能力佳,其残差序列是白噪声.用2016年1~3月数据来检验模型,其MAPE的绝对值均小于10%,说明模型的拟合优度相对较好,预测能力可靠,根据该模型预测2016年4~6月该院慢阻肺急性加重入院人次分别为162、160、159.结论 ARIMA模型能够很好的拟合慢阻肺急性加重的入院人次并进行短期预测,模型显示2016年该院的急性支气管炎的入院人次将有所上升,为医院合理利用医疗资源提供了有力依据.
作者:郭慧敏;杜军;黄路非 刊期: 2017年第02期
早提出“大数据”时代的麦肯锡公司称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素.人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来.”在医疗领域,随着医疗制度改革的不断深入和卫生信息化工作的推进,数字化医院信息系统、业务平台、智能化医疗设备在医院迅速普及开来,伴随之产生了大量的医疗卫生信息数据资源,医疗卫生领域也迎来了医疗大数据时代的浪潮.
作者:陈悟朝 刊期: 2017年第02期
目的 了解大连市部分社区居民的孤独感状况和影响因素,为改善居民孤独感提供理论依据.方法 采取随机抽样的方法,对大连市社区937名居民进行问卷调查.运用自编调查表收集该人群的基本信息,采用孤独感量表UCLA评估居民的孤独感状况.采用t检验,方差分析进行孤独感单因素分析,应用多元线性回归对孤独感影响因素进行多因素分析.结果 共回收有效问卷926份,该人群的孤独感得分为(46.76±6.16),单因素分析结果显示,孤独感评分在性别婚姻状况、家庭收入、饮酒、睡眠质量、体育锻炼等方面具有显著性差异(P<0.05).多元线性回归结果显示,体育锻炼、收入水平、睡眠质量、饮酒和独居对孤独感得分影响显著(P<0.05).结论 大连市部分社区居民孤独感状况处于中等水平,体育锻炼、睡眠质量、居住方式、饮酒行为、家庭收入是孤独感的影响因素.
作者:王予;徐洪斌 刊期: 2017年第02期
目的 分析和预测海南省医疗服务变化趋势,为相关部门合理制定区域卫生规划、提高卫生资源配置效率提供参考依据.方法 采用时间序列方法中的求和自回归移动平均模型(ARIMA)进行预测.结果 2002-2014年海南省医院诊疗人次数增长率为123%,医院入院人数增长率为330%.根据预测结果,2016-2020年海南省医院诊疗人次数分别为17599739、18550424、19501108、20451792和21402477;医院入院人数分别为1094002、1155515、1217028、1278541和1340054.结论 随着医疗服务需求的加大,有关部门在增加总量的同时,应进一步调整和优化结构,此外,还应加强基层医疗卫生资源的配置、促进分级诊疗制度的实施及医养结合产业的发展.
作者:黄小玲;曾渝;钟丽;李卫霞 刊期: 2017年第02期
随着国家疾病预防控制信息化建设的发展,自2004年我国传染病网络直报系统运行以来,需定期对各类医疗机构的传染病监测报告质量进行检查.国内已有不少学者发表过关于医疗机构传染病报告质量现状调查的相关文献[1-2],但几乎所有文献的调查方法均为分层抽样结合人工审查的方式,势必带来抽样误差、涵盖范围窄、工作量大等问题.
作者:李杰;顾月;邵佳奇;吕莉;孙凤妹;黄琦 刊期: 2017年第02期
卫生部统计显示,我国60岁以上老年人慢性病患病率是全部人口的3.2倍,老年人60岁后余寿中有60% ~ 80%的时间是带病生存.在老龄化形势日益严峻与慢性疾病多发的现实环境下,由年龄结构变化导致的医疗服务需要量和医疗服务费用正在不断攀升,但有限的医疗资源却难以满足不断高涨的需求,尤其是对医养结合的需求.中医药作为我国传统医学,在解决老年人健康养老问题上具有独特优势.
作者:邓敏;周晓平 刊期: 2017年第02期
在线医疗健康网站是一类能够提供在线挂号、在线问诊、线上诊疗、在线支付、医药电商和诊后服务等一系列互联网医疗服务以及一定程度满足用户健康需求的网站.诊前环节的互联网医疗服务使用率高,在线医疗保健信息查询、在线预约挂号和在线咨询问诊总使用率为18.4%[1].由上可见,在新医改的大背景下,在线医疗健康服务行业的市场巨大.由于传统的就医模式与在线就医之间有很大的差异,在线就医模式更需要用户满意度作为发展助力.
作者:姚亚男;邓朝华 刊期: 2017年第02期
目的 通过对新疆某三甲医院3114例肺癌患者住院时间的情况进行综合性分析,找到影响住院天数的原因,提出缩短超长住院天数的方法.方法 从医院信息系统调取2015年下半年出院肺癌患者信息,利用非条件logistic回归模型了解超长住院天数的影响因素.结果 logistic回归分析显示:肺癌患者的肿瘤分期、治疗方案、转科情况、疑难病例、抢救情况、手术等级、以及是否伴有呼吸系统疾病或出现术后感染、并发症对病人的住院天数的影响有统计学意义(P<0.05).结论 超常住院天数主要受到疾病本身因素、医院治疗方案、医疗操作水平以及是否患有伴随性疾病的影响;合理对病人进行分科、会诊、病例讨论是缩短住院天数的有效措施;只有统筹观察所有影响因素,有重点地控制主要影响因素,才能大程度地控制住院时间.
作者:韩芳;阿曼古力·依布拉音;米热古丽·哈米提;陈思雨;阿布都沙拉木·依米提 刊期: 2017年第02期