科学研究设计主要有哪几种，分别的特点和适用性是什么？

谷禾健康

在医学研究中，研究者如要想要弄清楚一个核心问题：某些因素（比如生活习惯、环境污染或药物治疗等）是否会影响人们的健康状况，通常要采用两种研究方法：实验研究和观察研究。

实验研究可以看作是一场精心设计的”科学实验”。研究人员会将参与者分成不同的组别，比如一组使用新药，另一组使用安慰剂（空白对照），通过严格控制各种条件，来准确判断新药的效果。这种方法的优点是可以直接证明“因果关系”，比如某种新药是否真的能治愈特定疾病。

然而，并非所有研究都适合用实验方法。比如，我们想研究吸烟对健康的影响，显然不能要求一组人去吸烟来做实验。这时候，观察研究就派上用场了，顾名思义，观察研究就是科学家们通过观察、记录和分析自然发生的现象来得出结论。

根据观察时间的不同，可以是：

对过去事件的回顾性研究
对当前状况的横断面研究
对未来发展的前瞻性研究

观察性和实验性研究设计具体可分为如下：

观察性研究设计（像一个细心的观察者）

描述性研究：最基础的研究方法像是给健康问题拍”快照”主要回答”是什么”的问题例如：调查某个地区的高血压患病情况
生态学研究：关注整个群体而不是个人比较不同地区或时期的健康状况例如：比较不同国家的癌症发病率
横断面研究：在某个时间点收集数据像是给人群健康状况拍”全家福”例如：调查某个城市居民的饮食习惯和健康状况
病例对照研究：比较已患病的人和未患病的人往回追溯可能的致病原因例如：研究某种癌症患者的过往生活习惯
队列研究：长期跟踪观察特定人群（分为2种）-A 前瞻性队列研究从现在开始往未来观察-B 回顾性队列研究回顾历史资料进行研究

实验/干预性研究设计（像一个主动的实验者）

随机对照试验被称为”金标准”研究方法随机将参与者分成实验组和对照组最常用于新药物和治疗方法的测试例如：测试新冠疫苗的效果
准实验研究介于观察性和实验性之间无法完全随机分组，但仍有一定干预例如：在某个社区推广健康教育项目

本文我们详细分享下每种研究方法的特点和适用性，并探讨了它们在不同情境下的应用和局限性。

观察性研究设计

——研究有害 · 不干预

它主要用于研究已知有害的原因，暴露和影响之间的关联。比如说，研究吸烟者的肺癌模式，研究人员无法进行干预并要求一组吸烟者停止吸烟，另一组未接触吸烟者开始吸烟。

观察性研究不影响人类受试者的暴露选择，并评价暴露或未暴露于感兴趣因素的受试者的结局。

然而，观察性研究的局限性之一是研究组中可能发生的特征差异。不同职业的人群可能会接触到不同的职业危害，同样，他们可能会在生活方式，健康状况等方面存在差异。由于这些不可测量的因素，确定正在研究的特定暴露的影响更具挑战性。

描述性研究

在描述性研究中，描述了健康问题的特征及其在特定时间在人群中的发生情况。由于同时记录暴露和结果，但没有进行随访跟踪，因此研究者无法确定因果关系。

然而，确保从所获得的结果得出的结论是有效的。在流行病学，公共卫生和社会科学中，这些研究通常用于提出假设。

根据研究对象的不同，这些研究可以分为个体层面的研究（比如流行病学调查和案例研究）和群体层面的研究（生态学研究）。

○ 特点：最基础的研究方法，像绘制“健康地图”

○ 目的：描述疾病在人群中的分布特征

○ 关注要素：时间、地点、人群特征

○ 实例：统计某个城市不同年龄段人群的糖尿病患病率

○ 优点：简单直观，成本较低

○ 局限：无法确定因果关系

生态学研究

在公共卫生研究中，如果研究对象是一个群体，而且只有群体的数据，则使用生态研究。在这种情况下，暴露和健康结果在所研究的群体中应该是清晰的，从而可以观察到暴露和疾病率之间的相关性。

它也用于研究暴露对疾病状况的影响需要在人口层面进行大规模比较的情况。生态谬误指的是一种混淆，当在群体水平上确定的关系被假设为对个人是正确的，就会发生这种混淆。简单来说，就是把群体的统计结果误认为是个体的实际情况。

在进行地理比较、研究社会阶层、移民群体和有关疾病的时间趋势时，通常会观察到生态研究设计的应用。

○ 特点：研究整体而非个人，像是”鸟瞰”健康问题

○ 目的：寻找群体层面的关联

○ 研究对象：不同地区、不同时期的群体数据

○ 实例：比较不同国家的饮食习惯与心脏病发病率的关系

○ 优点：可以发现大尺度的关联

○ 局限：可能出现”生态学谬误”（群体现象不一定适用于个人）

横断面研究

由于其相对简单的方法，这是最常用的研究设计。本研究设计的基本基础是研究和调查总人群的一部分，考虑到人群中的特征相似。

作为一种观察性研究，它详细描述了单一时间点（横断面）的暴露和健康结果。

在本研究中，暴露量和结局状态在一个时间点确定，因此未确立因果关系，被视为一种局限性。

横断面研究最流行的例子是同时收集多个特征的数据以探索相关性的调查，并通过合理的假设进行评估。它有助于描述结果在人群中的流行程度。这些研究被广泛用于遗传流行病学。

○ 特点：某一时间点的”快照”研究

○ 目的：了解某一时刻健康状况和相关因素

○ 研究方法：同时收集暴露因素和健康结果的信息

○ 实例：调查某高校学生的睡眠质量与学习成绩的关系

○ 优点：效率高，成本相对较低

○ 局限：难以确定因果时序

病例对照研究

这是一个对比研究，比较患病人群(病例组)和未患病人群(对照组)。为了通过回顾性方法研究和调查暴露情况并进行随访，横断面研究被用来研究具有较长潜伏期的疾病。

在回顾评估时，病例组有时可能会夸大其暴露程度，相比对照组而言，这被称为回忆偏倚。这也是该研究设计的一个局限性。

此外，识别和选择合适的对照组很重要，因为它们可能会因选择偏倚而影响研究结果。由于研究是回顾性的，病例对照研究设计广泛用于评估患病率而非发病率。

○ 特点：从结果往回追溯原因

○ 设计：将患病组（病例组）与未患病组（对照组）进行比较

○ 研究方向：回溯性研究过去的暴露情况

○ 实例：比较肺癌患者和健康人群的吸烟史

○ 优点：适合研究罕见疾病，成本较低

○ 局限：可能存在回忆偏倚

简单理解，假如做两种不同的调查：

-1 病例对照研究像“倒推式调查”
比如先找到100个胃病患者和100个没得胃病的人，然后回过头去问他们以前的饮食习惯，这样算出来的是”患病率”（有多少人得病）。
-2 队列研究像“跟踪式调查”
比如选择1000个健康人分两组：经常吃辣的和不吃辣的，然后跟踪观察5年，看谁得胃病，这样算出来的是”发病率”（新发生了多少病例）。

队列研究

队列或纵向研究设计是一种观察性流行病学研究，监测接触和未接触人群中疾病随时间的发展，参与者根据暴露及暴露水平进行分类。

与评估疾病患病率的病例对照研究不同，这种研究直接计算疾病的发病率。由于同时记录多个结局，队列研究中回忆偏倚的可能性很低，但选择偏倚的可能性很高。（关于回忆偏倚和选择偏倚在本章节后面详细介绍）

但是使用这种研究设计研究罕见疾病可能耗时且昂贵，这被认为是缺点之一。相关性的一种测量方法，即相对风险仅在队列研究中提供，因为它计算了暴露组和未暴露组的风险差异。

队列研究涉及对两个或两个以上的群体进行跟踪，从接触到结果，反之亦然。基于跟踪的时间点，队列研究可以分为前瞻性研究和回顾性研究。

5-1 前瞻性队列研究

在一项前瞻性队列研究中，没有疾病的人群根据他们是否有特定的风险因素进行分类，然后由研究人员进行一段时间的随访，看看是否会发展出研究中关注的疾病或健康结果。

○ 特点：从现在追踪到未来

○ 研究流程：选择健康人群，记录暴露因素，随访观察健康结果

○ 实例：追踪观察运动习惯对心血管疾病的影响

○ 优点：因果关系证据最强

○ 局限：耗时长，成本高

5-2 回顾性队列研究

在回顾性队列研究中，根据受试者暴露于特定风险因素的情况对受试者进行分类。与前瞻性研究不同，暴露和结局在研究期间已经发生。

○ 特点：利用历史资料进行研究

○ 研究流程：收集历史数据，分析暴露与结果关系

○ 实例：分析医院过去十年的病历资料

○ 优点：节省时间和资源

○ 局限：数据质量可能不够完整

回忆偏倚与选择偏倚

▼ 回忆偏倚（Recall Bias）

简单来说：人们在回忆过去事情时可能出现的记忆偏差。

生活中的例子：

比如问你：“上个月吃了几次快餐？”

生病的人可能会特别认真地回忆，因为觉得这可能与病情有关；
健康的人可能就随便估计一下，觉得不是什么重要的事。

结果：病人可能报告得更准确，而健康人的记忆可能不够准确。

医学研究中的情况：

患者可能会过分去强调某些可能与疾病相关的经历；
健康人则可能遗忘了一些细节。

这种差异会影响研究结果的准确性。

▼ 选择偏倚（Selection Bias）

简单来说：研究对象的选择不具有代表性，导致研究结果产生偏差。

生活中的例子：

假设要调查”年轻人的运动习惯“，你如果只在健身房门口发问卷，结果当然显示大家都经常运动。这就是典型的选择偏倚，因为你只选择了去健身房的人。

医学研究中的情况：

长期研究中，可能会有人中途退出，留下来的往往是：更关心健康的人、有时间参与研究的人、生活较稳定的人，这样的样本就不能代表整体人群。

为什么队列研究中，回忆偏倚低，选择偏倚高？

—回忆偏倚低：

队列研究通常是前瞻性的，研究者可以在结果发生之前收集信息，是实时记录，不需要回忆，而且数据通常是通过标准化的问卷、访谈或医疗记录直接收集的，而不是依赖于参与者的回忆。

—选择偏倚高：

因为要长期跟踪，有些人可能中途退出（搬家、失联等），能坚持参与的人可能特点相似，也就是说愿意参与研究的人群可能在某些特征上与不愿意参与的人群不同，还有在招募阶段，那些拒绝参与研究的人可能与参与者在某些关键特征上不同，这都可能导致研究出现选择偏倚。

如何减少回忆偏倚？

使用实时记录工具（如健康日记）
缩短回忆时间间隔
使用客观的记录方式

如何减少选择偏倚？

扩大取样范围
随机选择研究对象
采取措施减少参与者退出
分析退出者的特点

实验 / 干预性研究设计

——随机 · 减少偏见

在进行干预性研究时，研究者会采用随机化的方法来安排不同的实验条件给参与者。这样做的目的是为了通过随机分配，最大程度地减少主观偏见，并确保所比较的组在研究开始时相似。这样的设计有助于提升研究结果的有效性，因为它减少了组间差异可能由非干预因素引起的可能性。

随机化是实验设计中的基本原则，对于确保研究结论的准确性至关重要。

随机对照试验

随机临床试验，也称为随机对照试验(RCT)，被认为是流行病学研究设计中的基准。这种研究设计的原理是将受试者随机分配到已定义的人群组别中。

研究者将受试者随机分配到对照组。由于随机化可以防止混杂因素并减少选择偏倚，因此相比观察性流行病学研究具有优势。

由于实验组和对照组相似，实验组接受暴露和治疗，而对照组根据研究目的不接受任何治疗或接受无效治疗。这也意味着干预措施是组间唯一的区别，从而可以将结果效应归因于干预措施的差异。

尽管在评估因果关系的有效性和可信度方面被认为是研究设计的黄金标准，但由于伦理原因、样本量小以及随机化受试者和地点的困难，许多研究者不倾向于采用这种方法。

RCT的核心特征

随机分配：这是RCT最重要的特征，确保研究对象被随机分到不同组别。

对照设计：包括实验组和对照组的对比。

干预措施：实验组接受特定干预，对照组可能不接受干预或接受安慰剂。

RCT的优势

减少偏倚：通过随机化减少选择偏倚

控制混杂因素：随机分配可以平衡已知和未知的混杂因素

因果推断：能够较好地评估干预措施与结果之间的因果关系

RCT的局限性

伦理考虑：某些研究可能涉及伦理问题，无法进行随机分配

样本量限制：往往需要较大样本量，但实际操作中可能难以实现

实施困难：在某些情况下难以进行随机化或控制研究条件

外推性问题：研究结果可能难以推广到更广泛的人群

RCT的应用场景

新药物临床试验
新治疗方法的评估
预防措施的效果研究
医疗器械的评估

研究设计要点：

明确的纳入排除标准
适当的随机化方法
充分的样本量
合理的对照设计
标准化的结果评估

随机对照试验(RCT）的质量控制措施

盲法设计（单盲、双盲等）
依从性监测
标准化操作流程
数据质量控制

这种研究设计虽然被认为是医学研究的”黄金标准”，但在实际应用中需要权衡其可行性、伦理性和资源投入等多个方面。研究者需要根据具体研究目的和条件，选择最适合的研究设计方法。

准实验研究

在医学信息学文献中，准实验研究也被称为非随机或干预前后研究，介于个体随机临床试验（变量受控）和观察性研究（变量无控制）之间。

这种研究设计用于回答研究问题、检验假设，并调查研究中干预措施与结果之间的因果关系。它是一种在没有随机化的情况下评估干预措施的实验研究设计。

与随机对照试验不同，准实验性研究旨在提高有效性并产生显著的结论，同时认识到实践的局限性和伦理问题。

准实验研究的两种主要类型是有对照组的准实验设计和无对照组的准实验设计，其中指标在干预前后都被观察。

准实验研究的定位

介于RCT和观察性研究之间
保留了部分实验性质，但没有完全随机化
在无法进行RCT时的替代方案

主要特征

非随机化分组
干预措施的实施
前后测量比较
可能包含对照组

研究目的

评估干预效果
检验研究假设
探索因果关系
产生有价值的研究结论

两种主要类型

a) 有对照组的准实验设计：

包括实验组和对照组
可以比较组间差异
更好地控制混杂因素

b) 无对照组的准实验设计：

仅观察干预组
比较干预前后的变化
设计更简单但证据级别较低

优势

在RCT不可行时提供替代方案
较好的现实可行性
较少的伦理限制
成本相对较低
更容易获得较大样本量

局限性

缺乏随机化可能导致选择偏倚
因果推断的强度低于RCT
难以控制所有混杂因素
内部效度可能受到威胁

适用场景

政策评估研究
教育干预研究
公共卫生项目评估
组织变革研究
社区干预项目

质量控制要点

仔细选择对照组
详细记录干预过程
标准化数据收集
考虑潜在混杂因素
适当的统计分析方法

研究设计注意事项

明确界定干预措施
选择合适的结局指标
确定适当的观察时间点
考虑可能的偏倚来源
制定详细的实施方案

准实验研究在实际研究中具有重要价值，特别是在无法进行RCT的情况下。研究者需要充分认识其优势和局限性，合理设计研究方案，确保研究质量和结果的可靠性。同时，在结果解释时也要注意其证据级别的限制，避免过度推论。

结语

➦ 研究中的结果解释与影响因素控制

在流行病学研究中，调查得出的结果反映了暴露与结果发展之间的真实关联。然而，重要的是要考虑到这些发现也可能是由于随机误差、偏倚或混杂而可能出现的不同解释的结果。这可能会导致研究人员得出错误的结果和结论，例如存在统计关联，而它不存在，反之亦然。值得注意的是，这些偶然性、偏倚和混杂效应在观察性研究设计中普遍存在。因此，需要在设计和分析阶段考虑这些因素，从而减少其在流行病学研究中的影响。

➦ 偏倚对研究有效性的影响

由于偏倚而导致的测量误差可能发生在流行病学调查的多个时间点，并影响结果的内部和外部有效性。研究偏倚、混杂变量和变量的交互作用也会影响研究中关联和因果关系程度的建立和确定。在这种情况下，应提醒研究人员、流行病学家和公共卫生人员减少或避免偏倚，以确保研究结果的可靠性和有效性。

此外，还要注意混杂因素的出现可能会导致严重的失真，从而可能改变效果的方向。它有两种类型：当观察到的关联向远离null时为正混杂，当关联向null倾斜时为负混杂。

➦ 关于混杂变量

与因变量或疾病以及自变量或正在研究的因素相关的因子称为混杂变量。它影响疾病的风险，扭曲其他变量对所研究疾病的影响。当存在这种不需要的变量可以预测效果时，该研究无法提供暴露与结果之间的真实关联，夸大或稀释了所研究变量之间存在的实际关系。与健康结果有直接因果关系的各种因素，如个人年龄、性别、生活方式、社会经济地位、种族群体等，都是潜在的混杂因素。

举个例子，一项假设喝咖啡的人比不喝咖啡的人更容易患心脏病的研究，可能受到吸烟的第三个因素的影响。喝咖啡的人可能比不喝咖啡的人更习惯吸烟，在这里，吸烟是影响疾病与喝咖啡习惯之间关联的混杂因素。因此，心脏病可能是吸烟而不是咖啡的结果。

在研究的设计阶段和数据分析阶段，有几种方法可以减少混杂。

➯ 设计阶段使用的方法简要说明如下：

随机化：随机化是临床试验中使用的理想方法，涉及将参与者随机分配到变量分布相等的组中，限制潜在的混杂因素。

限制：参与研究的人数减少到在混杂因素方面相似的个体。

匹配：选择控件的方式应使潜在混杂因素的存在与案例中的存在相似。它可以通过对匹配或频率匹配来完成。

➯ 分析阶段使用的方法简要说明如下：

分层：涉及评估不同水平（如年龄或性别）的混杂因素中暴露与结果之间的关联。

多变量分析：涉及统计建模，以同时限制多个混杂变量，然后评估每个混杂变量及其影响。

标准化：涉及使用标准参考人群来中和研究组之间的混杂因素的影响。

无论是被誉为”金标准”的随机对照试验，还是灵活实用的观察性研究，都在推动医学科学发展中发挥着不可替代的作用。

实验性研究，以其能够直接证明因果关系的能力，被视为评估新药物和治疗方法的“金标准”。然而，由于伦理和实践的限制，并非所有情况下都适用。

观察性研究，作为一种更为灵活的方法，通过自然观察来揭示现象之间的关联，尽管它们在确定因果关系方面存在局限。

我们可以看到，实际上没有一种研究设计是万能的。每种方法都有其优势和局限，研究人员在设计和实施研究时，需要权衡研究目的和实际情况，严格控制可能的偏倚，在保证科学严谨性的同时也要考虑现实可行性和伦理要求。

在探索未知领域的征途上，每一步都充满了挑战与机遇。随着研究方法的不断发展和创新，我们期待未来能够有更多的工具和策略来应对医学研究中的挑战。

主要参考文献

Munnangi, S. & Boktor, S.W. (2023) Epidemiology Of Study Design. StatPearls Publishing.

Belbasis, L., & Bellou, V. (2018). Introduction to Epidemiological Studies. Genetic Epidemiology, 1–6. doi:10.1007/978-1-4939-7868-7_1

Rivas-Ruiz, F., Expósito-Ruiz, M., & Domínguez-Almendros, S. (2012). Research designs in clinical epidemiology. Allergologia Et Immunopathologia, 40(2), 117–124.

https://www.appinio.com/en/blog/market-research/quasi-experimental-design

Wang, J. & Attia, J. (2010). Study Designs in Epidemiology and Levels of Evidence. American Journal Of Opthalmology. 367-370. DOI.1016/j.ajo.2009.08.001

Dipika Shrestha. 2024. Study Designs in Epidemiology. Microbe Notes.

Harris, A.D., McGregor, J.C., Perencevich, E.N., Furuno, J.P., Zhu, J., Peterson, D.E. & Finkelstein, J. (2006). The use and interpretation of quasi-experimental studies in medical informatics. J Am Med Inform Assoc. 13(1):16-23.

Maciejewski, M. L. (2018). Quasi-experimental design. Biostatistics & Epidemiology. 1–10.

Tag Archive 回顾性研究

科学研究设计主要有哪几种，分别的特点和适用性是什么？

观察性研究设计

回忆偏倚与选择偏倚

实验 / 干预性研究设计

结语

分类目录

标签

Tag Archive 回顾性研究

科学研究设计主要有哪几种，分别的特点和适用性是什么？

观察性研究设计

回忆偏倚与选择偏倚

实验 / 干预性研究设计

结 语

分类目录

标签

结语