Como lidar com o teorema do limite central e ele está relacionado à distribuição normal?
Deve haver uma razão pela qual a distribuição normal é TÃO popular. Quer dizer, se considerarmos que uma distribuição normal com uma média de \(\mu\) e variância \({{\sigma }^{2}}\) tem uma função de densidade como a mostrada abaixo
\[f\left( x \right)=\frac{1}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)\]
então, deve-se pensar que é popular não exatamente devido à simplicidade de sua função de densidade.
Manipulando a distribuição normal
Na verdade, os alunos do Stats temem ter que lidar com a distribuição normal no que diz respeito à sua manipulação algébrica porque, claro, pode ser complicado. Por exemplo, a função de densidade \(f\left( x \right)\) apresentada acima é de fato uma densidade, como pode ser provado (embora não seja elementar fazê-lo) que
\[\int\limits_{-\infty }^{\infty }{\frac{1}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}=1\]
E uma vez que esta densidade \(f\left( x \right)\) é uma densidade válida, devemos ter então que
\[\int\limits_{-\infty }^{\infty }{\frac{x}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}=\mu\]
and\[\int\limits_{-\infty }^{\infty }{\frac{{{x}^{2}}}{\sqrt{2\pi {{\sigma }^{2}}}}\exp \left( -\frac{{{\left( x-\mu \right)}^{2}}}{2{{\sigma }^{2}}} \right)dx}={{\mu }^{2}}+{{\sigma }^{2}}\]
que não são triviais de provar (especialmente o último). Então, sim, é difícil lidar algebricamente com a distribuição normal. Mas então, por que é tão popular ??
Distribuição normal padrão e pontuações Z
Um bom motivo, que provavelmente é um motivo forte o suficiente por si só, é que por meio de um simples estandardização processo, podemos reduzir QUALQUER distribuição normal \(N\left( \mu ,{{\sigma }^{2}} \right)\) para a distribuição normal padrão, com é a distribuição normal que tem uma média de zero e um desvio padrão de 1, ou \(N\left( 0,1 \right)\). A padronização consiste em reduzir a variável original X para pontuações z usando a seguinte expressão:
\[Z=\frac{X-\mu }{\sigma }\]
Na verdade, pode ser provado que se X tem uma distribuição normal com média \(\mu\) e variância \({{\sigma }^{2}}\), \(N\left( \mu ,{{\sigma }^{2}} \right)\), então \(Z\) definido como
\[Z=\frac{X-\mu }{\sigma}\]
também tem uma distribuição normal, mas com média 0 e desvio padrão 1. Essa pequena redução acaba sendo EXTREMAMENTE eficiente, porque usando podemos reduzir o cálculo de QUALQUER probabilidade de distribuição normal ao cálculo de probabilidades para a distribuição normal padrão. Você já se perguntou por que a parte de trás dos livros de estatísticas vem com tabelas de distribuição normal SOMENTE para a distribuição normal padrão? É porque todas as distribuições normais podem ser reduzidas às distribuições normais padrão, por meio de z-scores, e seria realmente impraticável, ou impossível, imprimir TODAS as tabelas possíveis para todas as distribuições normais possíveis.
Exemplo: Suponha que o peso médio das crianças na quinta série seja de 72 libras, com um desvio padrão de 8 libras, e a distribuição segue a distribuição normal. Calcule a probabilidade de uma criança aleatória pesar menos de 75,5 libras.
Solução: Observe que o evento \(X<75.5\) pode ser expresso de forma equivalente a
\[X-72<75.5-72\]
Por quê? Porque simplesmente subtraímos 72 de ambos os lados da desigualdade, o que não altera as soluções da desigualdade. Seguindo o mesmo raciocínio, posso dividir os dois lados por 8 para obter um evento equivalente
\[\frac{X-72}{8}<\frac{75.5-72}{8}\]
POR FAVOR, NÃO SEJA CONFUSO AQUI: Tudo o que estamos dizendo é que se X for uma solução de \(X<75.5\), então X também é uma solução de \(X-72<75.5-72\), e então X também é uma solução de \(\frac{X-72}{8}<\frac{75.5-72}{8}\). E, inversamente, se X for uma solução de \(\frac{X-72}{8}<\frac{75.5-72}{8}\), então X também é uma solução de \(X-72<75.5-72\) e X também é uma solução de \(X<75.5\). Isso é o que queremos dizer quando dizemos que os eventos \(\left\{ X<75.5 \right\}\), \(\left\{ X-72<75.5-72 \right\}\) e \(\left\{ \frac{X-72}{8}<\frac{75.5-72}{8} \right\}\) são EQUIVALENTES (isto é, eles definem o mesmo conjunto de soluções).
Portanto, neste exemplo, precisamos calcular a seguinte probabilidade:
\[\Pr \left( X<75.5 \right)=\Pr \left( \frac{X-72}{8}<\frac{75.5-72}{8} \right)=\Pr \left( Z<0.4375 \right)=0.6691\]
Como você pode ver, padrão com uma certa distribuição normal, fiz a transformação para obter um evento equivalente que envolve um Z-score e, então, posso usar qualquer tabela de distribuição normal padrão (ou Excel) para calcular a probabilidade final.
O Teorema do Limite Central (CLT)
Se o acima exposto não foi um motivo forte o suficiente para você AMAR a distribuição normal (apesar de sua forma algébrica incômoda), vou lhe dar um motivo ao qual você não pode resistir. Acontece que existem muitos tipos de distribuições de probabilidade (quero dizer, MUITAS), que podem ter propriedades completamente diferentes da distribuição normal. Mas, se você pegar repetições de uma variável aleatória, de QUALQUER distribuição, e calcular sua média, essas médias serão (o que você acha?) Perigosamente semelhantes a uma distribuição normal, especialmente quando o tamanho da amostra (número de repetições) é grande .
Então, o processo de tirar as médias de uma amostra de valores vindos de QUALQUER distribuição de probabilidade e agora analisar a distribuição dessas médias, começamos a ver uma distribuição normal (quando o tamanho da amostra é grande). De alguma forma, tirar médias dobra a forma original da distribuição e a torna normal, INDEPENDENTEMENTE da distribuição subjacente. Este fato é uma das descobertas mais surpreendentes da Estatística, feita por Carl Friederich Gauss. Uma palavra de cautela, o Teorema do Limite Central tem uma formulação estatística formal, que não incluiremos aqui, mas afirma que a média da amostra CONVERGE para uma distribuição normal, em um certo sentido de probabilidade. Sem entrar em muitos detalhes técnicos, isso significa que, para a maioria dos casos, as médias da amostra têm uma distribuição normal APROXIMADA para um tamanho de amostra suficientemente grande. É muito comum que às vezes os instrutores dêem uma interpretação errada, dizendo que a distribuição das médias da amostra TORNA-SE uma distribuição normal, o que não é verdade em geral (na verdade, só é verdade quando a distribuição original subjacente é normal).
É por isso que a distribuição normal é altamente valorizada: é porque tem esse tipo de propriedade mágica que tirando as médias de qualquer distribuição você acabará com algo que parece bastante normal, se você pegar um tamanho de amostra grande o suficiente.