O Uso da Notação em Estatística Básica - Parte II
Este é um seguimento do seção anterior , onde foram apresentadas as notações mais comuns para estatísticas descritivas. É crucial entender como a notação é usada, já que a notação em matemática e estatística é usada como atalhos , e como tal, se você não compreender o seu significado, logo se perderá e REALMENTE não entenderá o que está sendo falado.
Nos próximos parágrafos daremos continuidade a esta série, tentando esclarecer o uso da notação na Estatística Inferencial, onde se usa notação mais profusa e sofisticada, e conseqüentemente você deve prestar atenção ao que vem.
Notação em estatísticas inferenciais
Os símbolos e notações a seguir são comumente usados ao trabalhar com estatísticas inferenciais. Esses símbolos ainda são usados na maioria das aulas de Estatística.
· \(\mu\): Este é o símbolo genérico que representa a média da população. Este é um parâmetro (porque é uma constante que não é construída com informações de amostra). Às vezes, \(\mu\) vem com um sub-índice para representar a média da população de qual variável estamos falando. Por exemplo, se virmos \({{\mu }_{X}}\), esse símbolo se refere à média da população da variável aleatória \(X\). Em termos gerais, se\(f\left( x \right)\) é a variável aleatória de distribuição (densidade) \(X\), a média da população é calculada com a seguinte expressão:
\[{{\mu }_{X}}=\int\limits_{-\infty }^{\infty }{x\,f\left( x \right)dx}\]
no caso de uma variável aleatória contínua, ou
\[{{\mu }_{X}}=\sum\limits_{k}{{{x}_{k}}f\left( {{x}_{k}} \right)}\]
para o caso de uma distribuição discreta.
Algumas coisas a serem lembradas: Embora \(\mu\) seja o símbolo genérico para se referir à média da população, existem certas distribuições que normalmente usam símbolos diferentes. Por exemplo, se X é uma variável aleatória de Poisson, a tradição é usar \(\lambda\) como o símbolo para a média da população. O importante a ter em conta é que se trata apenas de uma notação, ou seja, uma CONVENÇÃO.
· \({{\sigma }^{2}}\): Esta é a variação da população, que é calculada como
\[{{\sigma }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\mu }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}\]
Este é um parâmetro de população, porque é um número fixo (não uma variável aleatória) que não é construído a partir de informações da amostra). Da mesma forma que com a média da população, é comum adicionar um sub-índice para representar a variável subjacente. Isto é, \(\sigma _{X}^{2}\) representa a variância da população da variável aleatória X, enquanto \(\sigma _{Y}^{2}\) representa a variância da população da variável aleatória Y.
Novamente, o mesmo que no caso anterior, esta é uma NOTATION (ou atalho, se preferir) mais comum para escrever a variância da população. Mas há casos em que a tradição é usar outra coisa. Por exemplo, se X tem uma distribuição de Poisson, então mencionamos antes que a média da população é conhecida como \(\lambda\) e, ao calcular a variância da população, descobrimos que ela também é igual a \(\lambda\). Nesse caso, escreveríamos \(\sigma _{X}^{2}=\lambda\). Então, por favor, por favor, não se confunda entre um notação parte de \(\sigma _{X}^{2}=\lambda\) e a parte de cálculo de \(\sigma _{X}^{2}=\lambda\).
· \(\sigma\): Este é o desvio padrão da população, que é calculado tomando a raiz quadrada da variância da população, ou simplesmente usando a fórmula abaixo,
\[\sigma =\sqrt{\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}}\]
Este é um parâmetro, porque é um número fixo que não é construído com informações de amostra.
· \({{H}_{0}}\): Esta é a notação para o hipótese nula . No teste de hipótese, a hipótese nula é a hipótese de nenhum efeito
· \({{H}_{A}}\): Esta é a notação para o hipótese alternativa . No teste de hipótese, a hipótese alternativa é a hipótese que pode ser provada se os dados da amostra forem suficientemente improváveis, se a hipótese nula Ho for verdadeira
· \(\Theta\): Este é um símbolo menos comumente usado e representa o conjunto de todos os valores possíveis para o parâmetro de população. Por exemplo, se X for uma variável aleatória normalmente distribuída, com uma variação de população de \({{\sigma }^{2}}=1\) e uma média de população desconhecida \(\mu\), o conjunto de todos os valores possíveis que podem ser obtidos por \(\mu\) é toda a linha real. Então, em outras palavras, teríamos nesse caso que \(\Theta =\left( -\infty ,\infty \right)\).
· \({{\Theta }_{0}}\): No contexto do símbolo acima, este símbolo representa os valores possíveis assumidos por um parâmetro de população conforme declarado na hipótese nula de um teste de hipótese. Por exemplo, suponha que X seja uma variável aleatória normalmente distribuída, com uma variância da população de \({{\sigma }^{2}}=1\) e uma média da população desconhecida, e estamos interessados em testar as seguintes hipóteses nulas e alternativas:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
Nesse caso, teríamos que \({{\Theta }_{0}}=\left\{ 0 \right\}\) .
· \({{\Theta }_{A}}\): Ao longo das linhas dos símbolos anteriores, este símbolo representa os valores possíveis assumidos por um parâmetro de população conforme declarado na hipótese alternativa de um teste de hipótese. Por exemplo, suponha que X seja uma variável aleatória normalmente distribuída, com uma variância da população de \({{\sigma }^{2}}=1\) e uma média da população desconhecida, e estamos interessados em testar as seguintes hipóteses nulas e alternativas:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
Nesse caso, teríamos que \({{\Theta }_{A}}=\left( -\infty ,0 \right)\cup \left( 0,\infty \right)\) . Observe que, por definição, precisamos ter esse \(\Theta ={{\Theta }_{0}}\cup {{\Theta }_{A}}\).
· \(\rho\): Corresponde à correlação populacional entre as variáveis X e Y. Para ser mais explícito sobre as variáveis envolvidas, a notação pode ser escrita como \(\rho \left( X,Y \right)\) ou mesmo \({{\rho }_{X,Y}}\).
· \(\pi\): Embora não seja universal, este símbolo é usado para representar uma proporção da população. Ao longo dessas linhas, \({{\pi }_{1}}\) representará a proporção da população (para alguma variável categórica) na população 1, etc. Às vezes, um simples \(p\) é usado para representar uma proporção da população, mas acho que é uma má ideia, embora, mais ou menos, \(p\) é a notação mais comumente usada para representar uma proporção da população.
· \(\sim\): O símbolo "til" é usado para representar que uma determinada variável aleatória tem uma distribuição especificada. Por exemplo, se virmos: \(X\tilde{\ }Poisson\left( \lambda \right)\), interpretamos como: "X é uma variável aleatória que tem uma distribuição de Poisson com média \(\lambda\)".