Análise Exploratória de Dados (EDA)

Antes de aplicar técnicas estatísticas para um conjunto de dados, é importante examinar os dados para compreender as suas propriedades básicas. É possível utilizar uma série de técnicas que são colectivamente conhecidas como Análise Exploratória de Dados

(EDA) para analisar um conjunto de dados. EDA ajuda a garantir que você escolhe as técnicas estatísticas corretas para analisar e prever os dados. Os dois tipos básicos de técnicas são EDA gráfico técnicas e quantitativo técnicas.

técnicas gráfica EDA

técnicas gráfica EDA mostrar as propriedades fundamentais de um conjunto de dados em um formato conveniente. Muitas vezes é mais fácil de compreender as propriedades de uma variável e as relações entre as variáveis, olhando para gráficos em vez de olhar para os dados brutos. É possível utilizar várias técnicas gráficas, de acordo com o tipo de dados a serem analisados. Você usar o seguinte:

  • Os diagramas de caixa

  • histogramas

  • gráficos de probabilidade normais

  • gráficos de dispersão

técnicas quantitativas EDA

técnicas quantitativas EDA fornecer um método mais rigoroso de determinação das propriedades fundamentais de um conjunto de dados. Duas das mais importantes destas técnicas são

  • estimativa de intervalo.

  • Testando hipóteses.

Intervalo estimativas são utilizadas para criar um alcance de valores dentro do qual uma variável é provável cair. Hipótese o teste é utilizado para testar várias propostas sobre um conjunto de dados, tal como

  • O valor médio do conjunto de dados.

  • O desvio padrão do conjunto de dados.

  • A distribuição de probabilidade do conjunto de dados segue.

teste de hipóteses é uma técnica nuclear em estatísticas.

menu