Использование записи в базовой статистике - Часть I
Одна вещь, которая приносит студенты очень часто, и я бы сказал, что это больше необходимо, это либеральное использование математической обозначения, которая происходит в статистике, даже на основных уровнях.Чаще всего было бы желательно, инструкторы используют обозначение, о которых учащиеся не уверены.По праву, поэтому учителя видят в использовании обозначения способа выражения идей в точном, однозначном, более компактным способом.И как и идеи накапливаются, использование обозначения может стать более запутанным или запутанным достаточно, чтобы покинуть студентов смущенным и кусать пыль.
В следующих параграфах мы попытаемся уточнить использование обозначения в статистике снизу вверх, от обозначений в наиболее основной описательной статистике, на обозначения, используемую в более сложных тестах гипотезы.
Обозначение в описательной статистике
Следующие символы обычно используются при работе с описательной статистикой.Эти символы все еще используются на протяжении большей части вашего класса статистики.
\(\bar{X}\): Это образец означает среднее, что соответствует арифметическому среднему значению из образца \({{X}_{1}}\), \({{X}_{2}}\), ..., __ xyz_d__.Это статистика (потому что она построена с образцами информации).В некоторых курсах, особенно в социальных и поведенческих науках, они используют \(M\) для обозначения среднего образца.
\({s}^{2}\): Это дисперсия образца, которая вычисляется как
\[{{s}^{2}}=\frac{1}{n-1}\left( \sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}} \right)\]
Это статистика (потому что она построена с образцами информации).Есть и другие версии вышеуказанной формулы, но все они приводят к тому же численному значению.
__Xxyz_a__: Это выборка стандартного отклонения, которое вычисляется путем принятия квадратного корня дисперсии образца или просто с помощью вышеуказанной формулы, которая вычисляется из данных образца \({X}_{1}\), \({{X}_{2}}\), ..., __ xyz_d__
\[s=\sqrt{\frac{1}{n-1}\left( \sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}} \right)}\]
Это статистика (потому что она построена с образцами информации).Есть и другие версии вышеуказанной формулы, но все они приводят к тому же численному значению.
\(SS\): Это "сумма квадратов".Эта статистика измеряет квадратную вариацию переменной \(X\) в отношении образца среднего.Если у вас есть образец \({{X}_{1}}\), \({X}_{2}\), ..., __ xyz_e__, формула, используемая для вычисления это
\[SS=\sum\limits_{i=1}^{n}{{{\left( {{X}_{i}}-\bar{X} \right)}^{2}}}\]Часто подписки используется для указания, какую переменную мы ссылаемся, если не ясно.Например, вы можете написать \(S{{S}_{X}}\), чтобы ссылаться на сумму квадратов переменной \(X\), или вы можете написать \(S{{S}_{Y}}\) для обозначения суммы квадратов переменной Y. В социальных и поведенческих науках вы обычно напишите сумму квадратов \(X\)Как \(SS_{XX}\) вместо \(SS_{X}\), но это все просто о том, что является предпочтительным нотацией, которое имеет больше смысла.Существуют другие выражения, которые эквивалентны, когда речь идет о высказывании суммы квадратов.Например, здесь у нас есть два альтернативных способа написать сумму квадратов:
\[S{{S}_{XX}}=\sum\limits_{i=1}^{n}{{{\left( {{X}_{i}}-\bar{X} \right)}^{2}}}=\sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}}\]
На основании вышеизложенного существует четкая связь между отклонением образца и суммой квадратов:
\[{{s}^{2}}=\frac{S{{S}_{XX}}}{n-1}\]
Обратите внимание, что обозначение иногда чрезмерно, а иногда несовместимо.Действительно, очень часто используют индекс для суммы квадратов (например, в __xxyz_a__), чтобы указать, какую переменную мы имеем в виду (\(X\) в этом случае).Хотя в случае отклонения или стандартного отклонения такое использование подписчиков менее распространено, хотя все еще приемлемо.Например, вы можете написать \({{s}_{X}}\), чтобы указать образец стандартного отклонения переменной \(X\) или точнее, __xxyz_c__ указывает, что пример стандартного отклонения вычисляется от образца \({{X}_{1}}\), __xxyz_e __, ..., __ xyz_f__.
\(m\): образец медиана.Точка (или интерполированная точка), которая устанавливает середину распределения.Не существует универсального соглашения о ссылке с медиана образца как \(m\), но это обычная практика.
\({{Q}_{j}}\): это j готовность квартиль с \(j=1,2,3,4\).Это точки (или интерполированные точки), которые разделяют распределение в кварталах.Обратите внимание, что \({{Q}_{2}}\) - медиана.
\({{P}_{x}}\): Это X-Th Proctile, с \(0\le x\le 100\).Это точки (или интерполированные точки), так что X процентов распределения слева от этих точек.Соблюдайте, что \(m={{Q}_{2}}={{P}_{50}}\).
IQR: Это Интерквартирный диапазон И он определяется как \(IQR={{Q}_{3}}-{{Q}_{1}}\), что является разницей между третьим и первыми квартилями.Это обычно используется в качестве меры дисперсии и обнаружение выбросов.
Другая описательная статистика: есть много менее распространенной описательной статистики, для которой нет универсальных символов для использования.Например, асигнат, куртсорсис, моменты высшего порядка и т. Д. Иногда используются, но не компактные символы универсально используются для их обозначения.