Учебники статистики: окончательное руководство по процентам - все трюки на книге
Это хорошая тема для учебника, потому что концепция процентиль Как правило, сбивает с толку благодаря тому факту, что скорее путающие данные иногда предоставляются студентам, и там много конвенций, которые иногда могут быть вводят в заблуждение и даже неправильно.В следующих параграфах мы будем отдалены концепцию процентиль Точно, чтобы вы точно знали, о чем мы говорим.
Кумулятивное распределение
Прежде всего, нам нужно прояснить о определении процентиля, который связан с концепцией кумулятивного распределения.Для случайной переменной X связанная накопительная функция распределения определяется как
\[{{F}_{X}}\left( x \right)=\Pr \left( X\le x \right)\]Это, для данного значения Икс , связанная совокупная функция распределения является вероятность того, что случайная величина меньше или равна Икс ОтказОбратите внимание, что символ используется Икс Поскольку аргумент является общим аргументом функций.Если мы напишем \({{F}_{X}}\left( y \right)\), мы имеем в виду совокупное распределение по стоимости у (что соответствует вероятности, что случайная переменная меньше или равна у ), или если мы пишем \({{F}_{X}}\left( 4 \right)\), мы имеем в виду кумулятивное распределение при 4 (что соответствует вероятности, что случайная величина меньше или равна 4).
С таким как определение, понятно, \({{F}_{X}}\) - это функция, которая принимает значения от 0 до 1 (так как она исходит от вероятности), и он не уменьшается (это, это либо увеличивается, либо остается постоянным, но он никогда не уменьшается), но то, что менее очевидно, и которое может быть доказано от аксионов вероятности, любая кумулятивная функция распределения \({{F}_{X}}\) довольно хорошо ведет себя, поскольку она является правой непрерывной (которая очень примерно означает, что функция либо непрерывна, либо может потенциально иметь"Прыжки" .... Это сложнее, чем это, но на данный момент вы можете так думать).В целом случайные переменные, которые принимают непрерывный диапазон значений, будут иметь непрерывную совокупную функцию \({{F}_{X}}\), тогда как случайные переменные, которые принимают дискретный диапазон значений, будут иметь "прыжки" на графике их связанного __xxyz_a__.
Что такое процентиль?
Теперь мы можем определить процентиль.Для \(\alpha \in \left[ 0,1 \right]\), мы определяем процентиль __xxyz_b__ как \({{P}_{\alpha }}\), так что
\[\Pr \left( X\le {{P}_{\alpha }} \right)=\alpha\]На человеческом языке __xxyz_A__ процентиль является точкой, так что вероятность того, что случайная величина меньше или равная той точке, точно \(\alpha\).Например, 0,10 процентиля представляет собой точку распределения, так что вероятность того, что случайная величина меньше или равная той точке, ровно 0,10.Как правило, вместо того, чтобы просить, например, для 0,10 процента, вас будет предложено за 10% процентиля или 10-й процентиль.Это простые языки, которые должны знать.
Процент \({{P}_{\alpha }}\) для случайной переменной X хорошо определен, когда на кумулятивной функции распределения \({{F}_{X}}\left( x \right)\) непрерывна.Если \({{F}_{X}}\left( x \right)\) имеет "прыжки" в своем графике, то может быть немного сложнее определить некоторые процентильные значения.Вот почему проценты хорошо определены для непрерывных случайных переменных (таких как нормальное распределение, экспоненциальное распределение и т. Д.), но может быть сложно для дискретных переменных (таких как Пуассон, биномиальный и т. Д.).
Как вычислить это процентиль?
Во-первых, вам нужно знать совокупную функцию \({{F}_{X}}\).Итак, для \(\alpha\) между 0 и 1 нам нужно решить для \(x\):
\[\alpha ={{F}_{X}}\left( x \right)\]Соблюдайте, что решение x вышеуказанное уравнение такое же, как пересекать кривую \( F_{X}(x)\) с линией \(y=\alpha\) (которая параллельна оси X).Когда \({{F}_{X}}\) непрерывны, существует пересечение между линией \(y=\alpha\) и \({{F}_{X}}\left( x \right)\), но это не обязательно верно для всех значений __xxyz_e__ для не непрерывного \({{F}_{X}}\left( x \right)\).
Процент является параметром или статистикой?
Для определениямы обеспечили,процентильявляется параметромнаселения,так как это зависитисключительноот функции распределения, а не навыборочныхданных.Именноздесь и возникаетпутаница.Иногдастуденты получаютобразцыданныхпросятвычислитьпроцентиль.На самом деле,то, что онипросят, чтобы вычислитьобразецпроцентиль,статистика, котораявычисляется с использованиемвыборкиданных,имы надеемся, чтобудетхорошей оценкойсоответствующего.населенияпроцентиль.