SPSS倾向性评分后，基线不平原因及解决方案全解析

评分 2026-06-19 0°

在统计分析中，倾向性评分（Propensity Score, PS）是一种常用的方法，用于估计干预措施的效果。它通过匹配暴露组和未暴露组在一系列协变量上的概率，以减少混杂因素的影响。然而，在实际应用中，我们可能会遇到基线不平的问题，即暴露组和未暴露组在匹配前的一些关键变量上存在显著差异。以下是对基线不平原因及解决方案的详细解析。

基线不平的原因

样本选择偏差：在数据收集过程中，暴露组和未暴露组可能由于某些原因而存在不同的样本选择过程，导致两组在关键变量上存在差异。
信息缺失：在某些情况下，可能存在关键变量的信息缺失，导致无法准确匹配。
模型设定问题：倾向性评分模型的设定可能存在偏差，导致匹配后的基线不平。
干预措施本身：干预措施可能对某些变量产生直接或间接的影响，导致基线不平。

解决方案

1. 样本选择偏差

增加样本量：通过增加样本量，可以减少样本选择偏差的影响。
分层抽样：在抽样过程中，根据关键变量进行分层，以减少分层内的偏差。

2. 信息缺失

多重插补：对于缺失的数据，可以使用多重插补方法进行估计。
数据清洗：尽可能填补缺失值，或者删除含有缺失值的样本。

3. 模型设定问题

优化模型：根据研究目的和数据特点，选择合适的模型进行倾向性评分。
调整协变量：增加或调整协变量，以更好地反映两组间的差异。

4. 干预措施本身

干预措施评估：对干预措施进行评估，了解其对基线变量的影响。
调整干预措施：根据评估结果，调整干预措施，以减少其对基线变量的影响。

案例分析

假设我们要研究某种药物对高血压患者血压的影响。在倾向性评分后，我们发现暴露组和未暴露组在年龄、性别、体重等关键变量上存在显著差异。

原因分析

样本选择偏差：可能是因为年龄较大的患者更倾向于接受药物治疗。
信息缺失：部分患者的年龄、性别等关键变量信息缺失。
模型设定问题：倾向性评分模型可能没有考虑所有关键变量。
干预措施本身：药物可能对体重有影响，导致基线不平。

解决方案

增加样本量，减少样本选择偏差。
使用多重插补方法填补缺失值。
优化倾向性评分模型，增加或调整协变量。
评估药物对体重的影响，并调整干预措施。

通过以上方法，我们可以有效地解决SPSS倾向性评分后的基线不平问题，提高研究结果的可靠性。