Использование записи в базовой статистике - часть II
Это следующее из Предёдущий раздел Там, где были представлены наиболее распространенные обозначения для описательной статистики.Крайне важно понять, как используется обозначение, поскольку используются обозначения в математике и статистике, как ярлыки И как таковой, если вы не понимаете их смысл, вы скоро потеряете и действительно не понимаете, о чем говорят.
В следующих параграфах мы продолжим эту серию, пытаясь уточнить использование обозначения в расставленной статистике, где используются более обильные и сложные обозначения, и, следовательно, вы должны обратить внимание на то, что приходит.
Обозначение в расставленной статистике
Следующие символы и обозначения обычно используются при работе с выделенной статистикой.Эти символы все еще используются на протяжении большей части вашего класса статистики.
· \(\mu\): Это универсальный символ, который означает, что представляет население.Это параметр (потому что он постоянен, который не построен с образцом информации).Иногда \(\mu\) поставляется с поддецендентом для представления населения, означающего какую переменную, о которой мы говорим.Например, если мы увидим \({{\mu }_{X}}\), этот символ относится к населению среднее значение случайной переменной \(X\).В целом, если _\(f\left( x \right)\) - это распределение (плотность) Случайная вариабельная \(X\), среднее значение населения рассчитывается со следующим выражением:
\[{{\mu }_{X}}=\int\limits_{-\infty }^{\infty }{x\,f\left( x \right)dx}\]
В случае непрерывной случайной переменной или
\[{{\mu }_{X}}=\sum\limits_{k}{{{x}_{k}}f\left( {{x}_{k}} \right)}\]
Для случая дискретного распределения.
Пару вещей, чтобы иметь в виду: хотя \(\mu\) - это универсальный символ для обозначения среднего уровня населения, существуют определенные распределения, которые обычно используют разные символы.Например, если X является случайной переменной пуассона, традиция должна использовать __xxyz_b__ как символ для населения означает.Важно помнить, что это только нотация, это конвенция.
· \({{\sigma }^{2}}\): Это дисперсия населения, которая рассчитывается как
\[{{\sigma }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\mu }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}\]
Это параметр популяции, потому что это фиксированное число (не случайная переменная), которая не построена из образца информации).То же, что и с участием населения, обычно добавляют поддекс для представления базовой переменной.Это, \(\sigma _{X}^{2}\) представляет собой дисперсию населения случайной переменной X, тогда как \(\sigma _{Y}^{2}\) представляет собой дисперсию населения случайной переменной Y.
Опять же, как и в предыдущем случае, это наиболее распространенная запись (или ярлык, если вы будете) писать дисперсию населения.Но есть случаи, когда традиция состоит в том, чтобы использовать что-то еще.Например, если X имеет распределение пуассона, то мы упомянули до того, как среднее значение населения называется __xxyz_a__, и оказывается, что при вычислении дисперсии населения мы находим, что он также равен \(\lambda\).В таком случае мы бы написали \(\sigma _{X}^{2}=\lambda\).Итак, пожалуйста, пожалуйста, не запутайтесь между нотация Часть \(\sigma _{X}^{2}=\lambda\) и расчетная часть \(\sigma _{X}^{2}=\lambda\).
· \(\sigma\): Это стандартное отклонение населения, которое вычисляется путем принятия квадратного корня дисперсии населения или просто с помощью формулы ниже,
\[\sigma =\sqrt{\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}}\]
Это параметр, потому что это фиксированное число, которое не построено с информацией о образце.
· \({{H}_{0}}\): это обозначение для нулевая гипотеза ОтказВ тестировании гипотезы нулевая гипотеза - это гипотеза без эффекта
· \({{H}_{A}}\): это обозначение для Альтернативная гипотеза ОтказВ тестировании гипотезы альтернативная гипотеза - это гипотеза, которая может быть доказана, если данные образца достаточно маловероятны, если нулевая гипотеза Ho была правдой
· \(\Theta\): Это менее часто используемый символ, и он представляет набор всех возможных значений для параметра популяции.Например, если X является нормально распределенной случайной величиной, с дисперсией населения \({{\sigma }^{2}}=1\) и неизвестного населения означает \(\mu\), набор всех возможных значений, которые могут быть предприняты \(\mu\), является всей реальной линией.Так что, другими словами, мы бы имеем в этом случае, что \(\Theta =\left( -\infty ,\infty \right)\).
· __Xxyz_a__: в контексте вышеуказанного символа этот символ представляет собой возможные значения, предпринятые параметром популяции, как указано в нулевой гипотезе теста гипотеза.Например, предположим, что X является нормально распределенной случайной величиной, с дисперсией населения \({{\sigma }^{2}}=1\), и неизвестное население означает, и мы заинтересованы в тестировании следующих нулевых и альтернативных гипотез:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
В этом случае у нас было бы, чтобы \({{\Theta }_{0}}=\left\{ 0 \right\}\) Отказ
· __Xxyz_a__: вдоль линий предыдущих символов этот символ представляет собой возможные значения, предпринимаемые параметром популяции, как указано в альтернативной гипотезе теста гипотезы.Например, предположим, что X является нормально распределенной случайной величиной, с дисперсией населения \({{\sigma }^{2}}=1\), и неизвестное население означает, и мы заинтересованы в тестировании следующих нулевых и альтернативных гипотез:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
В этом случае у нас было бы, чтобы \({{\Theta }_{A}}=\left( -\infty ,0 \right)\cup \left( 0,\infty \right)\) Отказ Обратите внимание, что по определению нам нужно иметь это \(\Theta ={{\Theta }_{0}}\cup {{\Theta }_{A}}\).
· __Xxyz_a__: Это соответствует корреляции населения между переменными X и Y. Чтобы быть более явным относительно вовлеченных переменных, нотация может быть записана как \(\rho \left( X,Y \right)\) или даже \({{\rho }_{X,Y}}\).
· \(\pi\): Хотя не универсальный, этот символ используется для представления пропорции населения.Вдоль этих строк \({{\pi }_{1}}\) будет представлять пропорцию населения (для некоторой категориальной переменной) в популяции 1 и т. Д. Иногда простой __xxyz_c__ используется для представления пропорции населения, но я думаю, что это плохая идея, хотя, более или менее,\(p\) - это наиболее часто используемая запись для представления пропорции населения.
· \(\sim\): символ "Tilde" используется для представления того, что определенная случайная переменная имеет указанное распределение.Например, если мы видим: \(X\tilde{\ }Poisson\left( \lambda \right)\), мы интерпретируем его как: "X - это случайная переменная, которая имеет распределение пуассона со средним __xxyz_c__".