استخدام التدوين في الإحصاءات الأساسية - الجزء الأول
هناك شيء واحد يحصل على حيرة من الطلاب في كثير من الأحيان, وأود أن أقول أكثر من اللازم, هو الاستخدام الليبرالي للترميز الرياضي الذي يحدث في الإحصاءات, حتى على المستويات الأساسية.في كثير من الأحيان مما هو مطلوب, يستخدم المدربون تدوينات أن الطلاب غير متأكدين.بحق لذلك, يرى المعلمون في استخدام الرموز طريقة للتعبير عن الأفكار بطريقة دقيقة وغير متكافئة أكثر إحكاما.وكما تراكم الأفكار, يمكن أن يصبح استخدام الترميز أكثر توافقا, أو معقد بما يكفي لمغادرة الطلاب في حيرة ويعضون الغبار.
في الفقرات التالية, سنحاول توضيح استخدام التدوين في الإحصاءات من الأسفل لأعلى, من الرواعات في أبسط الإحصاءات الوصفية, إلى الترميز المستخدم في اختبارات فرضية أكثر تطورا.
تدوين الإحصاءات الوصفية
تستخدم الرموز التالية عادة عند العمل مع الإحصاءات الوصفية.لا تزال هذه الرموز تستخدم في جميع أنحاء معظم فئة الإحصاءات الخاصة بك.
\(\bar{X}\): هذه هي العينة المتوسط, والتي تتوافق مع المتوسط الحسابي للقيمة من عينة \({{X}_{1}}\), __xyz_c __, ..., __ xyz_d__.هذا إحصائي (لأنه شيد مع معلومات عينة).في بعض الدورات, خاصة في العلوم الاجتماعية والسلوكية, يستخدمون \(M\) للإشارة إلى متوسط العينة.
\({s}^{2}\): هذا هو تباين العينة, التي تم حسابها
\[{{s}^{2}}=\frac{1}{n-1}\left( \sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}} \right)\]
هذا إحصائي (لأنه شيد مع معلومات عينة).هناك إصدارات أخرى من الصيغة المذكورة أعلاه, لكنها تؤدي جميعها إلى نفس القيمة العددية.
\(s\): هذا هو الانحراف المعياري العينة, الذي يتم حسابه من خلال أخذ الجذر التربيعي من تباين العينة, أو ببساطة باستخدام الصيغة أعلاه, والتي يتم حسابها من بيانات العينة \({X}_{1}\), __xyz_c __, ..., __ xyz_d__
\[s=\sqrt{\frac{1}{n-1}\left( \sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}} \right)}\]
هذا إحصائي (لأنه شيد مع معلومات عينة).هناك إصدارات أخرى من الصيغة المذكورة أعلاه, لكنها تؤدي جميعها إلى نفس القيمة العددية.
\(SS\): هذا هو "مجموع المربعات".تقيس هذه الإحصاءات الاختلاف التربيعي لمتغير \(X\) فيما يتعلق بالعينة يعني.إذا كان لديك نموذج \({{X}_{1}}\), __xyz_d __, ..., __ xyz_e__, الصيغة المستخدمة لحسابها
\[SS=\sum\limits_{i=1}^{n}{{{\left( {{X}_{i}}-\bar{X} \right)}^{2}}}\]في كثير من الأحيان, يتم استخدام ضجة كبيرة للإشارة إلى المتغير الذي نشير إليه, إن لم يكن واضحا.على سبيل المثال, يمكنك كتابة \(S{{S}_{X}}\) للإشارة إلى مجموع مربعات المتغير \(X\), أو يمكنك كتابة \(S{{S}_{Y}}\) للإشارة إلى مجموع المربعات من المتغير Y. في العلوم الاجتماعية والسلوكية, ستكتب عادة مجموع المربعات من \(X\)كما \(SS_{XX}\) بدلا من \(SS_{X}\), ولكن كل شيء ببساطة حول ما هو التدوين المفضل الذي يجعل أكثر منطقية.هناك تعبيرات أخرى تعادلها عندما يتعلق الأمر بالتعبير عن مجموع المربعات.على سبيل المثال, هنا لدينا طريقتان البديلة لكتابة مجموع المربعات:
\[S{{S}_{XX}}=\sum\limits_{i=1}^{n}{{{\left( {{X}_{i}}-\bar{X} \right)}^{2}}}=\sum\limits_{i=1}^{n}{X_{i}^{2}}-\frac{1}{n}{{\left( \sum\limits_{i=1}^{n}{{{X}_{i}}} \right)}^{2}}\]
بناء على ما سبق, هناك صلة واضحة بين تباين العينة ومجموع المربعات:
\[{{s}^{2}}=\frac{S{{S}_{XX}}}{n-1}\]
لاحظ أن التدوين في بعض الأحيان مفرط, وأحيانا غير متسقة.في الواقع, من الشائع جدا استخدام ضجة كبيرة لمجموع المربعات (كما هو الحال في \(S{{S}_{XX}}\)) للإشارة إلى المتغير الذي نشير إليه (\(X\) في هذه الحالة).على الرغم من أنه, في حالة التباين أو الانحراف المعياري, فإن استخدام المشترعي المعياري أقل شيوعا, على الرغم من أنه لا يزال مقبولا.على سبيل المثال, يمكنك كتابة \({{s}_{X}}\) لتحديد نموذج الانحراف المعياري للمتغير \(X\), أو أكثر صرامة, \({{s}_{X}}\) يشير إلى الانحراف المعياري للعينة المحسوبة من العينة \({{X}_{1}}\), __xyz_e __, ..., __ xyz_f__ التي تأتي من المتغير العشوائي \(X\).
\(m\): عينة الوسيط.النقطة (أو النقطة المحمولة) التي تحدد منتصف التوزيع.لا يوجد اتفاق عالمي حول إحالة العينة المتوسطة كما \(m\), لكنها ممارسة شائعة.
\({{Q}_{j}}\): هذا هو J ذ الربع, مع \(j=1,2,3,4\).هذه هي النقاط (أو النقاط الملتوية) التي تقسم التوزيع في أرباع.لاحظ أن \({{Q}_{2}}\) هو الوسيط.
\({{P}_{x}}\): هذه هي النسبة المئوية X عشر, مع \(0\le x\le 100\).هذه هي النقاط (أو النقاط الملتوية) بحيث تكون X في المائة من التوزيع على يسار هذه النقاط.لاحظ أن \(m={{Q}_{2}}={{P}_{50}}\).
IQR: هذا ال النطاق الربيعي , يتم تعريفه على أنه \(IQR={{Q}_{3}}-{{Q}_{1}}\), وهو الفرق بين الربع الثالث والأول.يستخدم هذا عادة كمقياس للتشتت والكشف عن القيم المتطرفة.
الإحصاءات الوصفية الأخرى: هناك العديد من الإحصاءات الوصفية الأقل استخداما التي لا توجد رموز عالمية لاستخدامها.على سبيل المثال, يتم استخدام Skewness, Kurtorsis, لحظات الطلب العالي, إلخ, في بعض الأحيان, ولكن لا تستخدم الرموز المدمجة عالميا للدلالة عليها.