Como realçar Outliers estatísticas no Excel

Ao realizar a análise de dados, você geralmente assumem que os seus valores giram em torno de algum ponto central de dados (a mediana). Mas por vezes, alguns dos valores cair demasiado longe do ponto central. Esses valores são chamados de valores atípicos (eles estão fora da faixa esperada). Outliers pode distorcer suas análises estatísticas, levando-o a conclusões falsas ou enganosas sobre os seus dados.

Você pode usar algumas fórmulas simples e formatação condicional para destacar os valores discrepantes em seus dados.

A primeira etapa na identificação de outliers é para localizar o centro estatística do intervalo. Para fazer isso prospecção, você começar por encontrar o 1º e 3º quartis. UMA quartil é uma divisão estatística de um conjunto de dados em quatro grupos iguais, com cada grupo tornando-se 25 por cento dos dados. A 25 por cento superior de um conjunto é considerado para ser o primeiro quartil, ao passo que a parte inferior 25 por cento é considerado o quarto quartil.

No Excel, você pode facilmente obter valores quartil usando a função QUARTILE. Esta função requer dois argumentos: um intervalo de dados eo número quartil você deseja.

No exemplo mostrado, os valores nas células E3 e E4 são o 1º e 3º quartis para os dados no intervalo B3: B20.

image0.jpg

Tomando estes dois quartis, você pode calcular a 50 por cento estatística do conjunto de dados, subtraindo o 3º quartil do primeiro quartil. Este 50 por cento estatística é chamado o intervalo interquartil (IQR). Figura 9-18 exibe o IQR na célula E5.

Agora a pergunta é, o quão longe da média 50 por cento pode um valor sentar e ainda ser considerado um # 147 razoável # 148- valor? Os estatísticos geralmente concordam que IQR * 1.5 pode ser usado para estabelecer uma vedação superior e inferior razoável:

A vedação inferior é igual ao primeiro quartil - IQR * 1.5.
A vedação superior é igual ao terceiro quartil + IQR * 1.5.

Como você pode ver, as células E7 e E8 calcular as cercas superiores e inferiores finais. Qualquer valor maior do que a vedação superior ou inferior do que a vedação inferior é considerado um outlier.

Neste ponto, a regra de formatação condicional é fácil de implementar.

Para construir esta regra básica de formatação, siga estes passos:

  1. Selecione as células de dados na sua faixa-alvo (células B3: B20 neste exemplo), clique na guia Início da Faixa de Opções do Excel e, em seguida, selecione regra de formatação condicional-Nova.

    Isso abre a caixa de diálogo Nova Regra de Formatação.

    image1.jpg
  2. Na caixa de listagem na parte superior da caixa de diálogo, clique no usar uma fórmula para determinar quais as células para formatar opção.

    Esta seleção avalia valores com base em uma fórmula que você especificar. Se um determinado valor é avaliada como TRUE, a formatação condicional é aplicada a essa célula.

  3. Na caixa de entrada a fórmula, insira a fórmula apresentada aqui.

    Note-se que você usa o ou função para comparar o valor em sua célula-alvo (B3) para ambas as cercas superiores e inferiores encontrados em células $ E $ 7 e US $ E $ 8, respectivamente. Se a célula-alvo é maior do que a vedação superior ou inferior a cerca menor, é considerado um outlier e, portanto, será avaliada como TRUE, provocando a formatação condicional.

    = OU (B3lt; $ E $ 8, B3> $ E $ 7)

    Note-se que na fórmula, que exclua os símbolos de dólar referência absoluta ($) para a célula alvo (B3). Se você clicar em célula B3 em vez de digitar a referência de célula, o Excel faz automaticamente a sua referência de célula absoluta. É importante que você não incluir os símbolos do dólar referência absoluta na sua célula-alvo, porque você precisa Excel para aplicar esta regra de formatação baseada na própria o valor de cada célula.

  4. Clique no botão Formatar.

    Isso abre a caixa de diálogo Format Cells, onde você tem um conjunto completo de opções para formatar a fonte, borda e preencher para a sua célula-alvo. Depois de ter completado escolher suas opções de formatação, clique no botão OK para confirmar as alterações e retornar à caixa de diálogo Nova regra de formatação.

  5. Voltar na caixa de diálogo Nova Regra de Formatação, clique no botão OK para confirmar a regra de formatação.

    Se você precisa editar a regra de formatação condicional, basta colocar o cursor em qualquer uma das células de dados dentro de sua faixa formatado e, em seguida, vá para a aba inicial e selecione regras de formatação condicional-Manage. Isso abre a caixa de diálogo Gerenciador de Regras de Formatação Condicional. Clique na regra que deseja editar, em seguida, clique no botão Editar regra.

menu