Como lidar com a multiplicidade de dados de ensaios clínicos

Toda vez que você executar um teste de significância estatística, você corre o risco de ser enganado por flutuações aleatórias em pensar que algum efeito real está presente em seus dados quando, na verdade, não existe nenhum.

Este cenário é um chamado erro de tipo I. Quando você diz que você precisa p lt; 0,05 para significância, você está testando a 0,05 (ou 5 por cento) nível alfa ou dizer que você deseja limitar a sua taxa de erro tipo I a 5 por cento. Mas essa taxa de erro de 5 por cento aplica-se a todo e qualquer teste estatístico de executar.

Quanto mais análises de executar em um conjunto de dados, quanto mais o seu nível de alfa globais aumenta: executar dois testes e sua chance de pelo menos um deles saindo falsamente significativa é de cerca de 10 percentual executar 40 testes, e ao nível global alfa salta para 87 por cento. Isto é referido como o problema de MultiplicEuty, ou como Tipo de inflação I erro.

Alguns métodos estatísticos que envolvem comparações múltiplas (como testes post-hoc na sequência de uma análise de variância para a comparação de vários grupos) incorporar um ajuste de built-in para manter o alfa global de apenas 5 por cento em todas as comparações. Mas quando você está testando diferentes hipóteses, como comparar variáveis ​​diferentes em momentos diferentes entre os diferentes grupos, cabe a você decidir que tipo de estratégia de controle alpha (se houver) que deseja implementar.


Você tem várias opções, incluindo o seguinte:

  • Não controlam o multiplicidade e aceitar a probabilidade de que alguns de seus resultados "significativos" será falsamente significativa. Esta estratégia é frequentemente usado com hipóteses relacionadas ao secundário e exploratória objectivos- o protocolo indica geralmente que há inferências finais serão feitas a partir desses testes exploratórios. Quaisquer resultados "significativos" será considerado apenas "sinais" de possíveis efeitos reais e terá de ser confirmado em estudos posteriores antes de quaisquer conclusões finais são desenhados.

  • Controlar o nível alfa do outro lado apenas as hipóteses mais importantes. Se você tem dois objetivos co-primários, você pode controlar alpha através dos testes de estes dois objectivos.

    Você pode controlar alfa para 5 por cento (ou a qualquer nível desejado) através de um conjunto de n testes de hipóteses em várias maneiras, a seguir estão alguns dos mais populares:

  • O ajuste Bonferroni: Testar cada hipótese no 0,05 /n nível alfa. Então, para controlar alfa global de 0,05 em dois parâmetros primários, você precisa p lt; 0,025 para a significância ao testar cada um.

  • A estratégia de ensaio hierárquica: Posição seus terminais em ordem decrescente de importância. Testar o mais importante em primeiro lugar, e se dá P lt; 0,05, concluir que o efeito é real. Em seguida, teste o próximo mais importante, mais uma vez usando p lt; 0,05 para a significância.

    Continue até obter um resultado não significante (p> 0,05) -, em seguida, interromper o teste (ou considerar todos os outros testes para ser apenas exploratória e não tirar quaisquer conclusões formais sobre eles).

  • Controlando a taxa de descoberta de falsas (FDR): Esta abordagem tornou-se popular nos últimos anos para lidar com a multiplicidade de grande escala, que surge em áreas como teste genômico e análise de imagem digital que pode envolver muitos milhares de testes (como um por gene ou um por pixel), em vez de apenas alguns .

    Em vez de tentar evitar até mesmo uma solteiro falsa conclusão de significância (como a outros métodos de controle alpha clássico Bonferroni e fazer), você simplesmente quer controlar a proporção de testes que saem falsamente positiva, limitando taxa de descoberta de que falsas para uma fração razoável de todos os testes. Estes resultados positivos podem então ser testado em um estudo de acompanhamento.

» » » » Como lidar com a multiplicidade de dados de ensaios clínicos