Como inserir dados de data e hora para Bioestatística

Quando você inserir dados numéricos em seu computador, dom't combinar dois números em uma única variável (como 145/85 para a pressão arterial sistólica e diastólica). Quando se trata de datas e horários, no entanto, exatamente o oposto é verdadeiro!

A maioria dos softwares estatísticos pode representar datas e horas como uma única variável (um "instantâneo" em um cronograma contínuo), a fim de aproveitar que, se você pode - digite a data e hora como uma variável (por exemplo, 07/15/2010 08 : 23), não como uma variável de data e um de tempo variável.

Este método é especialmente útil quando se lida com eventos que ocorrem ao longo de um curto intervalo de tempo (como eventos que ocorrem durante o parto).

A maioria estatística data programas de loja e tempo internamente como um número, especificando o número de dias (e frações de dias) de alguns arbitrária "data zero." Aqui estão as datas de zero para alguns programas comuns:

  • Excel: Meia-noite no início 31 de dezembro de 1899 (esta é também a data mais antiga que o Excel pode armazenar). Então, 21 de novembro de 2012, em 6:00, é armazenado internamente como 41,234.75 (o .75 é porque 18:00 é 3/4 do caminho através desse dia).

  • SPSS: 14 de outubro de 1582 (data do calendário gregoriano foi adotado para substituir o calendário juliano).

  • SAS: 1960/01/01 (uma data totalmente arbitrária).

Alguns programas podem armazenar uma data e hora como um Julian Date, cuja a zero ocorreu ao meio-dia, hora de Greenwich, em 1º de janeiro de 4713 BC. (Nada de especial aconteceu naquela data-"foi originalmente escolhido puramente uma conveniência numérica.)

E se você não sabe o dia do mês? Isso acontece muito com a história médica itens- você ouve algo como "eu tenho a gripe em setembro de 2004." A maioria dos softwares insiste que uma variável de data ser uma data completa e não aceitará apenas um mês e um ano.

Neste caso, um argumento pode ser feito para definir o dia para 15 (em torno de meados de mês), com o fundamento de que o erro é a mesma probabilidade de ser de ambos os lados e, portanto, tende a anular, em média. Da mesma forma, se tanto o mês e dia estão faltando, você pode configurá-los a 30 de Junho ou 1 de Julho (em meados do ano) para atingir o mesmo tipo de cancelamento de erro média.

Se apenas alguns registros têm datas parciais, você pode querer criar uma outra variável para indicar se a data está completa ou parcial, de modo que você pode dizer, se você precisa, quer 2004/09/15 realmente significa 15 de setembro de 2004, ou apenas Setembro de 2004.

Completamente datas em falta devem normalmente apenas ser deixado Blank- maioria trata de software de estatística células em branco de dados como desaparecidos.

Devido à forma como a maioria dos programas de estatísticas armazenar datas e horas, eles podem facilmente calcular intervalos entre quaisquer dois pontos no tempo, o que é chamado "calendário de aritmética", que você pode indicar como uma subtração simples. Portanto, é geralmente mais fácil e mais seguro para entrar datas e horas e deixar o computador calcular os intervalos entre eles do que para calcular os intervalos de si mesmo.

Por exemplo, se você criar variáveis ​​para a data de nascimento (DOB) E uma data de visita (VisDt) Em Excel, muitas vezes você pode ter Excel calcular um muito precisos idade no momento da visita com esta fórmula simples:

Idade = (VisDt - DOB) /365.25

Da mesma forma, em estudos de câncer, você pode facilmente e com precisão calcular intervalos de diagnóstico ou tratamento de remissão e recidiva, bem como o tempo total de sobrevivência, a partir das datas dos eventos correspondentes.

menu