Omni Calculator logo

Calculadora de Diagrama de Caixa

Created by Maciej Kowalski, PhD candidate
Reviewed by Anna Szczepanek, PhD and Jack Bowater
Translated by João Rafael Lucio dos Santos, PhD and Luna Maldonado Fontes
Last updated: Oct 30, 2024


Boas-vindas à calculadora de diagrama de caixa da Omni, a sua nova ferramenta de gráficos favorita. Um diagrama de caixa é talvez a maneira mais comum de visualizar um conjunto de dados sem listar os valores individuais. Ele usa o chamado resumo de cinco números 🇺🇸, que descreve a distribuição das entradas na linha numérica. Se nenhuma dessas terminologias sofisticadas estiver clara para você, não se preocupe! Em breve, veremos o que é um diagrama de caixa e explicaremos como ler este tipo de gráfico. E para aqueles que não são tão novatos em estatística, apresentaremos a você o diagrama de caixa modificado que separa os outliers (valores atípicos) do diagrama de caixa (box plot).

O que é um diagrama de caixa?

Um diagrama de caixa (também conhecido como diagrama de extremos e quartis ou box plot) representa a distribuição de um conjunto de dados. É usado com mais frequência para analisar grandes sequências de números nas quais não nos importamos muito com os valores individuais, mas preferimos ver onde a maioria deles se enquadra e a que distância estão os valores extremos.

Vamos dar uma olhada em um exemplo de diagrama de extremos e quartis e explicar seus componentes.

Um exemplo de diagrama de caixa.

Em essência, as cinco linhas horizontais são tudo o que você precisa entender. Esse grupo é chamado de resumo de cinco números de um conjunto de dados e, é claro, que a nossa calculadora de digrama de caixa fornece seus valores com o gráfico correspondente. É hora de você entender o que cada um desses valores significa.

  1. O máximo

    Bastante simples: é a maior entrada no conjunto de dados. No gráfico, é a linha azul escura superior.

  2. O terceiro quartil

    Um quartil é um quarto do conjunto de dados. Dessa forma, o terceiro quartil marca o final do intervalo em que se encontram três quartos das entradas. Em termos de fórmula, é a mediana da metade superior dos valores. No gráfico, é o lado superior da caixa.

  3. A mediana

    Ela marca o meio do conjunto de dados. Não é o mesmo que a média, como você pode checar. Em vez disso, ela configura um ponto que divide o conjunto de dados ao meio, ou seja, metade das entradas superiores estão acima da mediana e metade das entradas inferiores abaixo dela. Na figura, é a linha azul clara no meio.

  4. O primeiro quartil

    Semelhante ao seu equivalente no ponto 2, ele marca o final do intervalo no qual se encontra um quarto dos valores. Juntamente com o terceiro quartil, ele forma o intervalo interquartil, ou seja, a caixa no exemplo do diagrama acima, onde está aproximadamente metade das entradas. No gráfico, está localizado na parte inferior da caixa.

  5. O mínimo

    O oposto do máximo: marca a menor entrada do conjunto de dados. No gráfico, é a linha azul escura inferior.

Muito bem, agora que você sabe o que é um diagrama de caixa e pode identificar seus componentes, é hora de ver como fazer um diagrama na prática. Por enquanto, vamos nos concentrar em instruções e fórmulas gerais, que depois aplicaremos a um exemplo numérico. Além disso, também explicaremos em detalhes como ler um diagrama de caixa.

Como você pode ver, várias noções estatísticas estão envolvidas aqui. Se você não estiver familiarizado com nenhuma delas, visite nossas ferramentas dedicadas!

Como fazer um diagrama de caixa

Conforme mencionado na seção anterior, a calculadora de diagrama de caixa é basicamente uma ferramenta para visualizar cinco valores associados a um conjunto de dados. Portanto, explicar como encontrá-los parece ser uma coisa razoável para começar, você não acha?

Digamos que você tenha uma sequência de números a1,a2,,ana_1, a_2, \ldots, a_n. Para simplificar, vamos supor que eles estejam listados do menor para o maior. Se não estivessem, teríamos que primeiramente ordená-los. Além disso, os passos para gerar um diagrama de caixa estão apresentados em uma ordem diferente daquela da seção anterior. Isso ocorre porque geralmente é mais fácil calcular os cinco números na ordem dada abaixo.

  • O máximo

    Esse é o maior dos números. No nosso caso, as entradas estão ordenadas, portanto, temos maˊximo=an\textrm{máximo} = a_n.

  • O mínimo

    O menor dos números. Na sequência ordenada, é mıˊnimo=a1\textrm{mínimo} = a_1.

  • A mediana

    Precisamos encontrar o valor com o mesmo número de entradas à esquerda (ou seja, menores) e à direita (ou seja, maiores). Se nn for ímpar, essa entrada existe de fato e temos mediana=a(n+1)/2\textrm{mediana} = a_{(n+1)/2}. Por outro lado, se nn for par, precisaremos tirar a média dos dois dados do meio, ou seja, mediana=12(an/2+a(n+2)/2)\textrm{mediana} = \frac 12 (a_{n/2} + a_{(n+2)/2}).

  • O primeiro quartil

    É a mediana da metade inferior das entradas. No entanto, temos novamente de levar em conta a paridade de nn. Para ser precisos, se nn for par, a sequência se dividirá perfeitamente em metades, portanto, não há problema: encontraremos a mediana da metade inferior. Por outro lado, se nn for ímpar, ou seja, quando mediana=a(n+1)/2\textrm{mediana} =a_{(n+1)/2}, então o primeiro quartil é a mediana de todas as entradas que vão de a1a_1 até e incluindo a(n+1)/2a_{(n+1)/2}.

  • O terceiro quartil

    A mediana da metade superior das entradas. Calculamos da mesma forma que o primeiro quartil, mas pegamos a outra metade. Para nn termos, consideramos as entradas que vão de a(n+1)/2a_{(n+1)/2} até ana_n (ou seja, o número a(n+1)/2a_{(n+1)/2} aparece em ambos os cálculos).

Quando tivermos os cinco valores, podemos preparar os lápis de cor: é hora de desenhar!

Para representar graficamente um diagrama de caixa, começamos com a própria caixa. Marcamos o primeiro e o terceiro quartis na linha e desenhamos um retângulo cujos dois lados opostos correspondem a esses valores (a largura do retângulo não importa). Observe como a calculadora de diagrama de caixa gera o gráfico verticalmente com a escala à esquerda, mesmo que, às vezes, você possa encontrar versões horizontais. Em seguida, marcamos a mediana com uma linha dentro do retângulo que é paralela aos quartis. Com isso, temos parte da caixa pronta.

Agora, vamos aos quartis. Procuramos o máximo e o mínimo na escala e desenhamos linhas nos locais correspondentes, novamente paralelas aos quartis. Feito isso, conectamos seus pontos médios aos lados da caixa, marcando o terceiro e o primeiro quartis, respectivamente.

Quando terminar a última etapa, você poderá se considerar um fabricante de diagramas de caixa, e o gráfico estará pronto!

Como ler um diagrama de caixa

Suponha que você receba um exemplo de diagrama de caixa e queira interpretar o conjunto de dados subjacente sem conhecer as entradas em si. Esta seção diz a você exatamente como fazer isso.

Explicaremos a você como ler um diagrama de caixa listando as informações que ele fornece, sem nenhuma ordem específica. Para referência, analisaremos o mesmo exemplo da primeira seção deste artigo.

Diagrama de caixa.
  • As cinco linhas horizontais no gráfico marcam o resumo de cinco números do conjunto de dados. De cima para baixo, elas são: o máximo, o terceiro quartil, a mediana, o primeiro quartil e o mínimo.
  • As duas linhas de limite são os extremos do conjunto de dados. Em outras palavras, todas as entradas do conjunto de dados (não importa quantas sejam) estão em algum lugar entre os dois valores.
  • A caixa marca o intervalo interquartil. Para ser precisos, é onde está cerca de metade das entradas.
  • A linha que passa pelo meio da caixa é a mediana. Você pode pensar nela como o meio do conjunto de dados: metade das entradas é maior e a outra metade é menor. No entanto, ela não é o mesmo que a média.
  • Se a caixa for “fina”, o conjunto de dados não está muito espalhado ou disperso. Em particular, nesse caso, pode haver muitas repetições semelhantes ou iguais à mediana.
  • Se as caixas de quartis (ou seja, as linhas que conectam a caixa ao mínimo e ao máximo) forem longas, então os valores extremos são muito diferentes da maior parte do conjunto de dados. Na verdade, eles podem ser os outliers (ou valores atípicos), do diagrama de caixa. Se esse for o caso, você pode ter interesse em examinar o diagrama de caixa modificado em vez desta versão mais simples.

Foi muita informação, você não acha? É quase como se pudéssemos conhecer o conjunto de dados sem saber os valores das entradas.

Ainda assim, conforme sugerido no último ponto, há uma maneira de melhorar nossa análise de conjunto de dados em casos extremos. Até aqui, aprendemos o que é um diagrama de caixa, portanto, estamos prontos para estudar seu irmão mais velho: o diagrama de caixa modificado (obviamente, também disponível em nossa ferramenta).

O diagrama de caixa modificado

Às vezes, um conjunto de dados tem alguns registros que diferem muito dos demais. Por exemplo, pode haver um aluno particularmente bom que tirou uma nota muito melhor em um teste do que o restante da turma. Se você não for essa pessoa, seus pais poderão reclamar que você não está estudando tanto quanto seu colega. Nesse caso, você pode usar o diagrama de caixa modificado para mostrar a eles que você está se esforçando tanto quanto qualquer outro aluno e que este colega certamente é um alienígena que está fora da média.

A versão modificada do diagrama de caixa separa os chamados outliers (valores atípicos) do restante do conjunto de dados. Para sermo mais precisos, é simplesmente o gráfico normal, conforme explicado na primeira seção do artigo, mas obtido somente dos não outliers, ou seja, não pegamos os valores que são inexplicavelmente grandes ou incomumente pequenos. Ainda assim, não nos esquecemos desses tipos peculiares: os outliers do diagrama de caixa continuam na imagem como pontos individuais, apenas além dos quartis.

Suponha que Q1 e Q3 sejam o primeiro e o terceiro quartil de todo o conjunto de dados, respectivamente (outliers ou não). Denote o intervalo interquartil por IIQ = Q3 - Q1.

💡 Um outlier é uma entrada x que satisfaz uma das seguintes desigualdades: x < Q1 - 1,5 ⋅ IIQ ou x > Q3 + 1,5 ⋅ IIQ. Saiba mais com nossa calculadora de outlier 🇺🇸. Para descobrir o que é IIQ, vá direto para a calculadora de intervalo interquartil 🇺🇸.

Em outras palavras, desenhar um diagrama de caixa modificado é um processo de várias camadas. Em primeiro lugar, precisamos encontrar os quartis de todas as entradas e verificar se há algum valor discrepante. Em caso afirmativo, nós os retiramos e seguimos as instruções usuais da segunda seção deste artigo, considerando o conjunto de dados reduzido. Observe que isso significa calcular os quartis novamente porque o conjunto de dados agora é diferente.

Muito bem, chega de teoria por hoje! É hora de aplicar nosso conhecimento adquirido e usar a calculadora de diagrama de caixa do Omni com alguns dados numéricos.

Exemplo: usando a calculadora de diagrama de caixa

Suponha que você seja um professor de educação física do ensino médio e um dia decidiu testar seus alunos com uma corrida de 100 metros rasos. Todas as vinte pessoas que você chamou se revezam para correr a distância enquanto você anota seus tempos. Eles são:

13,2s, 14,1s, 11,9s, 15,2s, 14,5s, 12,9s, 12,7s, 14,1s, 18,3s, 15,6s, 14,5s, 13,8s, 12,9s, 13,3s, 13,9s, 16,6s, 15s, 14,2s, 17,4s, 16,2s.

Além de avaliar os alunos, você decide analisar o desempenho da classe como um todo. E que melhor maneira de fazer isso do que desenhar o diagrama de caixa?

Em primeiro lugar, veremos como a tarefa é fácil com a nossa ferramenta. Na parte superior, podemos escolher entre a versão normal e a modificada. Não precisamos da versão sofisticada aqui, portanto, basta escolher “Eu gostaria de ver o diagrama de caixa normal.

Em seguida, inserimos os dados. Observe que, embora haja apenas oito campos visíveis no início, novos campos aparecem assim que você começa a fornecer as entradas (no total, você pode inserir até trinta valores). Além disso, observe como a calculadora de diagrama de caixa já mostra a resposta para dois números e ajusta o resultado e o gráfico a cada entrada consecutiva. Após inserir o último valor, você pode rolar para baixo para visualizar o resumo de cinco números do nosso conjunto de dados e o diagrama de caixa associado.

Agora, vamos ver como você pode construir seu diagrama de caixa à mão, ou seja, sem a ajuda da nossa calculadora. De acordo com as instruções vistas na seção sobre como fazer um diagrama de caixa, começamos ordenando as entradas. Em outras palavras, em vez da sequência acima, trabalharemos com:

11,9s, 12,7s, 12,9s, 12,9s, 13,2s, 13,3s, 13,8s, 13,9s, 14,1s, 14,1s, 14,2s, 14,5s, 14,5s, 15s, 15,2s, 15,6s, 16,2s, 16,6s, 17,4s, 18,3s.

A partir disso, já podemos identificar:

mínimo = 11,9s e máximo = 18,3s.

Em segundo lugar, procuramos a mediana. Temos vinte entradas (um número par, portanto, será a média aritmética) do 10º e 11º valores, ou seja:

mediana = (14,1s + 14,2s) / 2 = 14,15s.

Em seguida, precisamos dos quartis, ou seja, as medianas da primeira e da segunda metade do conjunto de dados. Cada um contém 20 / 2 = 10 entradas (novamente um número par), portanto, eles serão novamente as médias aritméticas: da 5ª e 6ª entradas para o primeiro quartil e da 15ª e 16ª entradas para o terceiro:

Q1 = (13,2s + 13,3s) / 2 = 13,25s

Q3 = (15,2s + 15,6s) / 2 = 15,4s

Com isso, temos todos os componentes de um diagrama de caixa, de modo que podemos desenhar a representação visual de nosso conjunto de dados:

Diagrama de caixa do conjunto de dados fornecido.

Vemos que, em geral, os resultados não diferiram muito entre os alunos. Ainda assim, temos um máximo alto, então, talvez seja uma boa ideia incentivar esse aluno a melhorar o seu desempenho.

FAQ

Como gerar um diagrama de caixa?

Para fazer um diagrama de caixa, você precisa:

  1. Ordenar o conjunto de dados do menor para o maior.

  2. Identificar o mínimo (a primeira entrada ordenada).

  3. Identificar o máximo (a última entrada ordenada).

  4. Encontrar a mediana de todo o conjunto de dados.

  5. Encontrar o primeiro quartil, ou seja, a mediana da metade inferior das entradas.

  6. Encontrar o terceiro quartil, ou seja, a mediana da metade superior das entradas.

  7. Fazer o diagrama de caixa desenhando:

    • Uma caixa com dois lados nos valores dos pontos 5-6;
    • Uma linha que atravessa a caixa no valor do ponto 4;
    • Linhas paralelas à linha acima nos valores dos pontos 2-3;
    • Uma linha conectando os pontos 2 e 5; e
    • Uma linha conectando os pontos 3 e 6.

Como ler um diagrama de caixa?

Você pode ler as seguintes informações de um diagrama de caixa:

  • As linhas horizontais no gráfico correspondem ao resumo de cinco números;
  • As linhas superior e inferior são, respectivamente, o máximo e o mínimo;
  • A caixa corresponde ao intervalo interquartil;
  • A linha que atravessa a caixa corresponde à mediana;
  • As entradas do conjunto de dados estão entre a linha superior e a inferior; e
  • Cerca de metade dos valores está dentro do intervalo interquartil.

Onde está a média em um diagrama de caixa?

A calculadora de diagrama de caixa da Omni não exibe a média, mas algumas fontes a adicionam ao gráfico usando um ponto, um sinal de mais ou um diamante. Em seguida, podemos compará-la com a mediana para analisar a assimetria do conjunto de dados.

Como encontrar o intervalo interquartil de um diagrama de caixa?

Para encontrar o intervalo interquartil de um diagrama de caixa, você precisa:

  1. Ler o valor do lado superior da caixa.
  2. Ler o valor do lado inferior.
  3. Subtrair o número do ponto 2 do número dado em 1.
  4. É isso! Você encontrou o intervalo interquartil do diagrama de caixa.

Como gerar um diagrama de caixa modificado?

Para fazer um diagrama de caixa modificado, você precisa:

  1. Ordenar o conjunto de dados do menor para o maior.

  2. Encontrar o primeiro e o terceiro quartis.

  3. Calcular o intervalo interquartil IIQ.

  4. Com base em IIQ, verifique se há algum valor discrepante.

  5. Grave o conjunto de dados sem os outliers.

  6. Encontre o resumo de cinco números do conjunto de dados reduzido.

  7. Desenhe o diagrama de caixa regular do conjunto de dados reduzido.

  8. Se houver outliers, marque-os como pontos individuais.

Maciej Kowalski, PhD candidate
I'd like to see a
regular
box plot.
Values (enter up to 30 numbers)
#1
#2
#3
#4
#5
#6
#7
#8
Check out 32 similar collection of journalist's guide calculators
AveragePercentagePercentage change… 29 more
People also viewed…

Car heat

The hot car calculator shows how fast a car's interior heats up during a summer day.

Discount

The discount calculator uses a product's original price and discount percentage to find the final price and the amount you save.

Hypergeometric distribution

Use the hypergeometric distribution calculator to find the probability (or cumulative probability) associated with the hypergeometric distribution.

Rayleigh distribution

Our Rayleigh distribution calculator helps you generate samples from the Rayleigh distribution, or determine probabilities, cdf, pdf, quantiles, and common measures in this distribution.