استخدام التدوين في الإحصاءات الأساسية - الجزء الثاني
هذه متابعة من القمس السابا , حيث تم تقديم الرموز الأكثر شيوعا للإحصاءات الوصفية.من الأهمية بمكان أن نفهم كيف يتم استخدام الترميز, حيث يتم استخدام الرموز في الرياضيات والإحصاءات اختصارات , وبالتالي, إذا كنت لا تفهم معناها, فسوف تفقد قريبا ولا تفهمها حقا ما يجري تحدث عنه.
في الفقرات التالية, سنواصل هذه السلسلة, مما يحاول توضيح استخدام الترميز في الإحصاءات الاستدلالية, حيث يتم استخدام تدوين أكثر ثنائية ومتطورة, وبالتالي يجب عليك الانتباه إلى ما يأتي.
تدوين الإحصاءات الاستنتاجية
يتم استخدام الرموز والشبكات التالية عادة عند العمل مع الإحصاءات الاستنتاجية.لا تزال هذه الرموز تستخدم في جميع أنحاء معظم فئة الإحصاءات الخاصة بك.
\(\mu\): هذا هو الرمز العام الذي يمثله السكان يعني.هذه هي المعلمة (لأنه ثابت غير مصنوع من معلومات عينة).في بعض الأحيان, يأتي \(\mu\) مع فهرس فرعي لتمثيل متوسط عدد المتغير الذي نتحدث عنه.على سبيل المثال, إذا كنا نرى \({{\mu }_{X}}\), فإن هذا الرمز يشير إلى متوسط متوسط المتغير العشوائي \(X\).من الناحية العامة, IF\(f\left( x \right)\) هو التوزيع (الكثافة) المتغير العشوائي \(X\), يتم حساب سكان السكان بالتعبير التالي:
\[{{\mu }_{X}}=\int\limits_{-\infty }^{\infty }{x\,f\left( x \right)dx}\]
في حالة متغير عشوائي مستمر, أو
\[{{\mu }_{X}}=\sum\limits_{k}{{{x}_{k}}f\left( {{x}_{k}} \right)}\]
لحالة توزيع منفصل.
بضعة أشياء يجب وضعها في الاعتبار: على الرغم من \(\mu\) هو الرمز العام للإشارة إلى متوسط السكان, فهناك توزيعات معينة تستخدم عادة رموز مختلفة.على سبيل المثال, إذا كان X عبارة عن متغير عشوائي Poisson, فإن التقليد هو استخدام \(\lambda\) كما يعني رمز للسكان.الشيء المهم هو أن نضع في الاعتبار هو أنه مجرد تدوين, وهذا هو الاتفاقية.
\({{\sigma }^{2}}\): هذا هو التباين السكاني, الذي تم حسابه
\[{{\sigma }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\mu }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}\]
هذه هي المعلمة السكانية, لأنها رقم ثابت (وليس متغير عشوائي) لم يتم بناؤه من معلومات عينة).كما يعني نفس السكان, من المعتاد إضافة فهرس فرعي لتمثيل المتغير الأساسي.هذا هو, \(\sigma _{X}^{2}\) يمثل التباين السكاني للمتغير العشوائي X, بينما يمثل \(\sigma _{Y}^{2}\) التباين السكاني للمتغير العشوائي Y.
مرة أخرى, كما هو الحال في الحالة السابقة, هذا تدوين أكثر شيوعا (أو اختصار, إذا كنت كذلك) لكتابة التباين السكاني.ولكن هناك حالات حيث يكون التقليد هو استخدام شيء آخر.على سبيل المثال, إذا كان X يحتوي على توزيع Poisson, ثم ذكرنا قبل أن يشار إلى السكان على أنه \(\lambda\), واتضح أنه عند حساب التباين السكاني, نجد أنه يساوي \(\lambda\) كذلك.في مثل هذه الحالة, سنكتب \(\sigma _{X}^{2}=\lambda\).إذن, من فضلك, من فضلك, لا تشعر بالارتباك بين الرموز جزء من \(\sigma _{X}^{2}=\lambda\) وجزء الحساب من \(\sigma _{X}^{2}=\lambda\).
__ \(\sigma\): هذا هو الانحراف المعياري السكاني, الذي يتم حسابه باستخدام الجذر التربيعي للتباين السكاني, أو ببساطة باستخدام الصيغة أدناه,
\[\sigma =\sqrt{\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}}\]
هذه هي المعلمة, لأنه رقم ثابت غير مصنوع بمعلومات عينة.
\({{H}_{0}}\): هذا هو تدوين فرضية العدم وبعدفي اختبار الفرضية, الفرضية الفارغة هي فرضية أي تأثير
\({{H}_{A}}\): هذا هو تدوين فرضية بديلة وبعدفي اختبار الفرضية, فإن الفرضية البديلة هي الفرضية التي يمكن إثباتها إذا كانت بيانات العينة غير مرجحة بما فيه الكفاية, إذا كانت الفرضية الفارغة هي صحيحة
\(\Theta\): هذا رمز أقل استخداما, ويمثل مجموعة من جميع القيم الممكنة لمعلمة السكان.على سبيل المثال, إذا كان X هو متغير عشوائي موزعة عادة, مع وجود تباين سكاني ل \({{\sigma }^{2}}=1\), ويعني عدد السكان غير المعروفين \(\mu\), مجموعة جميع القيم المحتملة التي يمكن أن تؤخذ بواسطة \(\mu\) هي الخط الحقيقي بأكمله.لذلك, بمعنى آخر, سيكون لدينا في هذه الحالة \(\Theta =\left( -\infty ,\infty \right)\).
__ \({{\Theta }_{0}}\): في سياق الرمز أعلاه, يمثل هذا الرمز القيم المحتملة التي اتخذتها معلمة سكانية كما هو مذكور في الفرضية الفارغة للاختبار الفرضية.على سبيل المثال, افترض أن X هو متغير عشوائي موزعة عادة, مع وجود تباين سكاني ل \({{\sigma }^{2}}=1\), وسكان مجهولين يعني, ونحن مهتمون باختبار الفرضيات الخالية والبديلة التالية:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
في هذه الحالة, سيكون لدينا ذلك \({{\Theta }_{0}}=\left\{ 0 \right\}\) وبعد
\({{\Theta }_{A}}\): على غرار الرموز السابقة, يمثل هذا الرمز القيم المحتملة التي اتخذتها معلمة سكانية كما هو مذكور في الفرضية البديلة لمختبر الفرضية.على سبيل المثال, افترض أن X هو متغير عشوائي موزعة عادة, مع وجود تباين سكاني ل \({{\sigma }^{2}}=1\), وسكان مجهولين يعني, ونحن مهتمون باختبار الفرضيات الخالية والبديلة التالية:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
في هذه الحالة, سيكون لدينا ذلك \({{\Theta }_{A}}=\left( -\infty ,0 \right)\cup \left( 0,\infty \right)\) وبعد لاحظ أنه بحكم التعريف, نحتاج إلى أن يكون ذلك \(\Theta ={{\Theta }_{0}}\cup {{\Theta }_{A}}\).
__ \(\rho\): يتوافق هذا مع الارتباط السكاني بين المتغيرات x و y. من أجل أن تكون أكثر وضوحا حول المتغيرات المعنية, يمكن كتابة التدوين ك \(\rho \left( X,Y \right)\) أو حتى \({{\rho }_{X,Y}}\).
\(\pi\): على الرغم من أن هذا ليس عالميا, يتم استخدام هذا الرمز لتمثيل نسبة السكان.على طول هذه الخطوط, \({{\pi }_{1}}\) سيمثل النسبة السكانية (لبعض المتغير القاطع) في عدد السكان 1, وما إلى ذلك في بعض الأحيان, يتم استخدام عادي \(p\) لتمثيل نسبة سكانية, لكنني أعتقد أن هذه فكرة سيئة, على الرغم من ذلك, أكثر أو أقل,\(p\) هو التدوين الأكثر استخداما لتمثيل نسبة السكان.
\(\sim\): يتم استخدام رمز "Tilde" لتمثيل أن المتغير العشوائي معين لديه توزيع محدد.على سبيل المثال, إذا رأينا: \(X\tilde{\ }Poisson\left( \lambda \right)\), فسوف نفسرها على النحو التالي: "X هو متغير عشوائي يحتوي على توزيع Poisson مع متوسط \(\lambda\)".