Como para prever valores novos dados com R

Além de descrever as relações, modelos também pode ser utilizada para prever valores de novos dados. Por isso, muitos sistemas de modelo em R usar a mesma função, convenientemente chamada prever()

. Cada paradigma de modelagem em R tem uma função de prever com o seu próprio sabor, mas, em geral, a funcionalidade básica é a mesma em todos eles.

Como obter os valores de dados

Por exemplo, um fabricante de automóveis tem três projetos para um carro novo e quer saber o que a quilometragem prevista é com base no peso de cada novo design. A fim de fazer isso, você primeiro criar um quadro de dados com os novos valores - por exemplo, como este:

> new.cars lt; - data.frame (p = C (1.7, 2.4, 3.6))

Certifique-se sempre os nomes das variáveis ​​que você usa são as mesmas usadas no modelo. Quando você faz isso, você simplesmente chamar o prever() funcionar com os argumentos adequados, como este:

> Prever (Model, newdata = new.cars) 12.328,19952 24,45839 18,04503

Então, o carro mais leve tem uma quilometragem prevista de 28,2 milhas por galão eo carro mais pesado tem uma quilometragem prevista de 18 milhas por galão, de acordo com este modelo. É claro que, se você usar um modelo inadequado, as previsões podem ser praticamente fora também.

Confiança em suas previsões

Para se ter uma idéia sobre a precisão das previsões, você pode pedir para intervalos em torno de sua previsão. Para obter uma matriz com a previsão e um intervalo de confiança de 95 por cento em torno da previsão média, você definir o argumento intervalo para 'confiança' como isso:

> Prever (Model, newdata = new.cars, intervalo = "confiança") ajuste lwr UPR1 28,19952 26,14755 30,251502 24,45839 23,01617 25,900623 18,04503 16,86172 19,22834

Agora você sabe que - de acordo com o seu modelo - um carro com um peso de 2,4 toneladas tem, na média, uma quilometragem entre 23 e 25,9 milhas por galão. Da mesma forma, você pode pedir um intervalo de previsão de 95 por cento, definindo o intervalo de argumento para 'predição':

> Prever (Model, newdata = new.cars, intervalo = 'previsão') ajuste lwr UPR1 28,19952 21,64930 34,749752 24,45839 18,07287 30,843923 18,04503 11,71296 24,37710

Esta informação diz que 95 por cento dos carros com um peso de 2,4 toneladas têm uma quilometragem em algum lugar entre 18,1 e 30,8 milhas por galão - assumindo que o seu modelo é correto, é claro.

Se você preferir construir o seu próprio intervalo de confiança, você pode obter os erros padrão em suas previsões bem, definindo o argumento se.fit para VERDADE. Você não pode pegar um vetor ou uma matriz-em vez disso, você obtém uma lista com um elemento caber que contém as previsões e um elemento se.fit que contém os erros padrão.

menu