医学期刊统计学评阅常见问题汇总
时间:2024-07-24 09:59:14

随着科学研究的不断深入和发展,越来越多的期刊开始将统计学作为衡量文章质量的重要标准,并增设了统计评阅步骤,制定了相应的统计评阅规则。然而,令人遗憾的是,已发表的文章中仍有大约27%存在重大的统计错误。如果研究人员对统计评阅只是一知半解,等到被拒稿后才进行修改,那就如同通过“尸体解剖”来寻找失败的原因,为时已晚。因此,提前了解统计学评阅的常见问题,从撰稿阶段甚至研究设计阶段就开始考虑如何避免这些问题,将有利于更具科学性的研究结果的传播。


广东省卫生统计学会中的许多老师都是国内外医学期刊的签约统计评阅人。我们后续将基于统计评阅中的一些常见问题推出一系列文章,从研究设计、统计方法、结果和结论几个方面进行详细介绍。


一、设计类型


在医学领域,研究的质量与设计方法的选择紧密相连。论文中应明确设计类型,并基于该设计类型的特点来展开撰写。论文评阅中,设计类型不明确甚至选择错误等问题普遍存在。设计方法的选择取决于多种因素,包括前期研究结果、研究对象的可获得性、经费和时间限制。常见的研究设计可以根据是否施加人为主动干预分为观察性研究或实验性研究,根据研究开展的时间特点分为回顾性或前瞻性,根据研究结果的应用范围分为基础研究或应用研究,根据调查目的分为描述性或分析性,根据研究目的分为预防、诊断或治疗。


二、研究对象


研究对象是统计评阅中至关重要的元素。在研究开始前,确定研究对象是决定研究意义的重要因素之一;在得出结论后,研究对象又意味着研究结果的人群适用范围。是否全面描述了研究对象特征及其数据搜集方式等,往往是期刊评价研究质量的要点之一。


那么,需要在文章中报告研究对象的哪些内容呢?对于动物实验,需要提供动物的属性,如种系、体重等;对于人群试验,则要明确年龄、性别、民族、所患疾病等。对于研究对象数据搜集的方式,如果是调查数据,应报告数据收集的方式,如问卷、访谈等,还应报告调查对象的应答率;如果是从现有数据库调取,则要报告数据库的基本情况和数据来源。出于伦理学的考虑,文章中还应该提及数据的授权和研究的伦理审查情况。


三、抽样方法


大多数研究设计选择通过样本来认识总体,但样本与总体之间存在着一定的抽样误差。期刊编辑在审稿时会特别注意抽样方法的选择,以判断研究者抽取的样本是否能代表研究总体。


作为研究人员,应了解常用抽样方法的优缺点,结合自身研究特点选择合适的抽样方法,并在文章中对其加以描述。例如,在有总体框架的情况下,应尽量采取概率抽样的方法,以获得有代表性的样本。


四、样本量计算


BMJ期刊曾发表一篇关于随机对照试验中样本量计算的研究,它评估了包括柳叶刀在内的6个顶级期刊中关于样本量计算的问题,并报告发现仅有34%的研究报告了计算样本量所需的全部数据。样本量关系着研究结果的准确性和可推广性。期刊编辑在进行统计学评阅时,会对文章中样本量及其计算方法进行考量。有一些研究者因为不熟悉样本量的计算而选择忽略,而仅在收集数据后计算功效来评价样本量是否足够,这会影响临床结论的可靠性。


样本量计算方法的选择需要综合考虑研究目的、设计类型、主要结局指标、资料类型等因素,还要对检验水准(α,常用0.05)、检验功效(1-β,常用0.8、0.9)、组间差值或容许误差、单侧或双侧检验、脱落率(一般小于20%)等条件进行确定。因此,研究者需详细报告,尤其是样本量计算涉及的一些参数,以供审稿人和读者确定实验计划和主要结果的正确性。


五、检验功效


目前,文献中关于检验功效的问题主要集中在其计算方面。但需要研究者理解的是,功效的计算更多的是为了规划后续的研究,而不是分析当前已完成的数据。功效的计算主要应该在研究设计阶段进行。针对目前文献报告中的功效计算,研究者需报告估计检验功效所需的参数(如检验水准ɑ),这有利于审稿人对研究的质量做出判断。关于样本量和检验功效的详细内容,我们会在后续的系列推文中详细说明。


六、随机化


随机化是科学研究中的基本原则和避免偏倚的重要方法,通常体现在抽样和分组两个环节。是否采取了适当措施以体现随机化,也是期刊编辑所关注的重点。随机抽样是指抽样过程中采用随机化方法,使总体中所有对象都有固定的概率被抽中进入研究样本,从而使样本具有总体代表性。随机化分组则是指将研究对象随机地分配到不同的组别。常见的随机化分组方法主要包括简单随机化、区组随机化、分层随机化、动态随机化和随机化等。


在选择随机化方法时,应注意简单随机化虽然可以有效地处理试验组和对照组之间的均衡问题,但是针对小样本研究进行期中分析时,可能会导致两组之间的样本数量不平衡。因此,简单随机化目前在试验研究中并不常使用。区组随机化可以有效解决这一问题。它分为固定区组随机化和可变区组长度随机化。固定区组随机化需要固定区组长度,但区组的长度应谨慎选择:太短会影响组间数量的平衡,并且容易暴露区组末位分组信息;太长同样可能会导致两组之间的样本数量不平衡。所以,大部分研究一般将区组长度设置为4-8。而可变区组长度随机化采用多个区组长度产生随机序列,可以有效减少选择偏倚。当研究涉及一些会影响研究结局的混杂因素时,采用分层随机化等方法可以确保两组在混杂因素的平衡[。动态随机化分组是指在临床实验过程当中,按照一定的条件调整入组概率,从而保证各实验组间例数和某些重要的混杂因素接近一致。但是,由于操作复杂,目前动态随机化法在临床的应用还很少。此外,随着信息技术的显著发展,越来越多的临床试验采用随机化系统进行分组,这显著提升了临床研究的效率。


以下是各种随机分组方法的特点:


方法 内容 特点

简单随机化 直接对研究对象随机化分组,如掷硬币、随机数表。 优点:简单易操作;缺点:各组个体数可能不一致。

区组随机化 按招募顺序,每N个对象随机分组,再在每个区组内随机分组。 优点:各组数量相等,可逐渐累积病例;缺点:分组可能带有预见性,增加操作难度。

分层随机化 先将研究对象分为若干层,每个层内随机分组。 优点:可根据重要临床优点或预后因素分组;缺点:分组过多,研究对象过于分散。

动态随机化 确定控制因素的数量和权重来保证各试验组间例数和某些重要的混杂因素比如疾病分期、病理分型等接近一致。 优点:可以保证多个变量在两组分布均衡;缺点:操作复杂,目前只推荐在小样本临床实验中应用。

随机化 是临床实验中随机化分配、受试者管理、药品管理等服务所使用到的一种计算机信息系统。 优点:它有效解决了跨地域多中心临床实验中各分中心进度不均衡、药物过剩、药物超过保质期等问题;缺点:当技术上出现问题时,需要寻求专业人员解决。


七、盲法


在实验性研究中,盲法常常指让研究对象、研究人员或评估人员不清楚参与者接受的是何种干预。这样可以保护结果不会被主观因素所干扰,是避免偏倚的另一个重要措施。在研究前,需要考虑研究是否需要盲法以及采用何种盲法。若研究中使用了盲法,研究人员需要在文章中清楚地说明盲法的操作过程,必须报告盲法的实施对象(病人、医护人员、评价人员),盲法的实施措施(胶囊、片剂)、设计时编码的流程、过程中盲底保存的位置,分析时揭盲的时间与条件等,而不是简单地阐述所采用的是单盲、双盲或者三盲。如果试验所采用的盲法是正确且成功的,则必须报告成功的证据;如果盲法失败,也必须报告原因,比如安慰剂与试验药品之间存在差异。


八、匹配


匹配的使用可以在一定程度上平衡组间的混杂因素。如果使用了匹配,应该在文章中说明采用了何种比例的匹配方法,对哪些变量进行了匹配,产生了什么效果,最好能够引用文献以支持选取这个方法的科学性和合理性。在设置匹配时,暴露组(病例组)和对照组的匹配比一般不大于1:4。如果采用病例对照设计,应用匹配时需要注意匹配因素是否会对研究结果产生影响,比如匹配因素与待研究结局有关。此外,文章中应明确描述匹配样本中两组受试者之间的基线特征,在基线有无差异时应使用不受样本量影响并且适用于匹配数据的统计方法。


本篇推文主要从研究设计的方面简要介绍了学术期刊的统计学评阅中常见的问题。后续的推文将对方法、结果和结论的常见问题进行介绍,以期帮助研究人员规避研究“雷区”。


免责声明以上文章内容均来源于其他网络渠道,仅供欣赏,不代表本站观点,与本站立场无关,仅供学习和参考。如有涉及到您的权益,请来信告知(email:mlunwen@163.com),我们核实后会立刻删除。

上一篇:护理个案报告书写细则全面解析

下一篇:护士撰写并发表临床论文的分步指南