مربع والخط الطولي مؤامرة
يعتبر Box and Whisker Plot , أو المعروف أيضًا باسم Box-plot , نوعًا من التصوير الرسومي للعينة , والذي يوفر سهولة رؤية الميزات الرئيسية لتوزيع العينة.
يوفر مخطط المربع والشعرة الوسيط بالإضافة إلى الربيعين الأول والثالث في "المربع" الخاص به , والحد الأدنى والحد الأقصى في "الطولي".
عندما يكون الحد الأدنى أو الأقصى متطرفين للغاية , فقم بـ "تقليم" الخط الطولي ونقوم بتوضيح وجود قيمة خارجية.
في الرسم البياني أعلاه , لديك مثال لكيفية ظهور مربع المخطط: لديك "الصندوق" والشعيرات.
يتم تحديد الخلاصة النهائية للمربع بواسطة الربع الأول (\(Q_1\)).
يتم تحديد السطر الأوسط للمربع بواسطة الوسيط (\(Q_2\)).
يتم تحديد السطر العلوي من المربع بواسطة الربع الثالث (\(Q_3\)).
الآن , بالنسبة للشعيرات , توجد قاعدة يجب اتباعها: يتم تحديد الطولي السفلي بالحد الأدنى للعينة , ويتم تحديد الطولي العلوي بالحد الأقصى للعينة. بشرط أن يكون حجم الطولي أصغر من \(1.5 \times IQR\) , حيث \(IQR\) هو النطاق بين الشرائح الربعية , ويتم تحديده بواسطة \(IQR = Q_3 - Q_1\).
انظر نموذج الرسم البياني أدناه.
إذن , إذا كان الحد الأدنى للعينة أكبر من \(Q_1 - 1.5 \times IQR\) , فسيتم تحديد الطولي السفلي بالحد الأدنى. خلاف ذلك , يتم تعريفه بواسطة \(Q_1 - 1.5 \times IQR\).
وبالمثل , إذا كان الحد الأقصى للعينة أقل من \(Q_3 + 1.5 \times IQR\) , فسيتم تحديد الطولي العلوي بواسطة الحد الأقصى. خلاف ذلك , يتم تعريفه بواسطة \(Q_3 + 1.5 \times IQR\).
مثال 1
قم ببناء مخطط مربع للعينة التالية:
28 , 36 , 43 , 30 , 46 , 19 , 46 , 36 , 34 , 38 , 42 , 29 , 37 , 35 , 39 , 39 , 30 , 39 , 36 , 38 , 30 , 41 , 42 , 46 , 40 , 33 , 30 , 40 , 43 , 30 , 42 , 39 , 30 , 35 , 38 , 41 , 30 , 37 , 40 , 30 , 30 , 35 , 39 , 37 , 42 , 42 , 37 , 38 , 32 , 51
إجابه:
نحصل على أن الحد الأقصى والحد الأدنى
\[\min = 19\] \[\max = 51\]يوضح الجدول التالي البيانات بترتيب تصاعدي:
البيانات (بترتيب تصاعدي) |
19 |
28 |
29 |
30 |
30 |
30 |
30 |
30 |
30 |
30 |
30 |
30 |
32 |
33 |
34 |
35 |
35 |
35 |
36 |
36 |
36 |
37 |
37 |
37 |
37 |
38 |
38 |
38 |
38 |
39 |
39 |
39 |
39 |
39 |
40 |
40 |
40 |
41 |
41 |
42 |
42 |
42 |
42 |
42 |
43 |
43 |
46 |
46 |
46 |
51 |
الوسيط إذن
\[Median=\frac{{37}+{38}}{2}=37.5\]موضع المئين الخامس والعشرين هو
\[{{L}_{25}}=\frac{P}{100}\times \left( n+1 \right)=\frac{25}{100}\times \left( 50+1 \right) = {12.75}\]ثم حصلنا على ذلك
\[{{Q}_{1}}={30} +{0.75}\times \left( {32}-{30} \right) = {31.5}\]موضع المئين 75 هو
\[{{L}_{75}}=\frac{P}{100}\times \left( n+1 \right)=\frac{75}{100}\times \left( 50+1 \right) = {38.25}\]ثم حصلنا على ذلك
\[{{Q}_{3}}={41}+{0.25}\times \left( {41}-{41} \right) = {41}\]ومن ثم , فإن الملخص المكون من 5 أرقام هو
\[\min = 19, Q_1 = 31.5, Q_2 = 37.5, Q_3 = 41, \max = 51\]المدى الربيعي في هذه الحالة هو \(IQR = Q_3 - Q_1 = 41 - 31.5 = 9.5\). بالتالي,
\(Q_1 - 1.5 \times IQR = 31.5 - 1.5 \times 9.5 = 17.25\)
\(Q_3 + 1.5 \times IQR = 41 + 1.5 \times 9.5 = 55.25\)
لاحظ أن الحد الأدنى هو 19 , وهو أكبر من \(Q_1 - 1.5 \times IQR = 17.25\). والحد الأقصى 51 وهو أقل من \(Q_3 + 1.5 \times IQR = 55.25\).
نستنتج أن الطولي السفلي هو الحد الأدنى , والشعيرة العلوية هي الحد الأقصى في هذه الحالة. بيانيا
مثال 2
ابحث عن مخطط المربع لنفس العينة من المثال السابق , ولكن عندما تستبدل "51" بـ "81".
إجابه:
نحصل على أن الحد الأقصى والحد الأدنى
\[\min = 19\] \[\max = 81\]يوضح الجدول التالي البيانات بترتيب تصاعدي:
البيانات (بترتيب تصاعدي) |
19 |
28 |
29 |
30 |
30 |
30 |
30 |
30 |
30 |
30 |
30 |
30 |
32 |
33 |
34 |
35 |
35 |
35 |
36 |
36 |
36 |
37 |
37 |
37 |
37 |
38 |
38 |
38 |
38 |
39 |
39 |
39 |
39 |
39 |
40 |
40 |
40 |
41 |
41 |
42 |
42 |
42 |
42 |
42 |
43 |
43 |
46 |
46 |
46 |
81 |
الوسيط إذن
\[Median=\frac{{37}+{38}}{2}=37.5\]موضع المئين الخامس والعشرين هو
\[{{L}_{25}}=\frac{P}{100}\times \left( n+1 \right)=\frac{25}{100}\times \left( 50+1 \right) = {12.75}\]ثم حصلنا على ذلك
\[{{Q}_{1}}={30} +{0.75}\times \left( {32}-{30} \right) = {31.5}\]موضع المئين 75 هو
\[{{L}_{75}}=\frac{P}{100}\times \left( n+1 \right)=\frac{75}{100}\times \left( 50+1 \right) = {38.25}\]ثم حصلنا على ذلك
\[{{Q}_{3}}={41}+{0.25}\times \left( {41}-{41} \right) = {41}\]ومن ثم , فإن الملخص المكون من 5 أرقام هو
\[\min = 19, Q_1 = 31.5, Q_2 = 37.5, Q_3 = 41, \max = 81\]المدى الربيعي في هذه الحالة هو \(IQR = Q_3 - Q_1 = 41 - 31.5 = 9.5\). بالتالي,
\(Q_1 - 1.5 \times IQR = 31.5 - 1.5 \times 9.5 = 17.25\)
\(Q_3 + 1.5 \times IQR = 41 + 1.5 \times 9.5 = 55.25\)
لاحظ أن الحد الأدنى هو 19 , وهو أكبر من \(Q_1 - 1.5 \times IQR = 17.25\). ولكن الآن الحد الأقصى هو 81 , والذي يتجاوز \(Q_3 + 1.5 \times IQR = 55.25\). ومن ثم , فإن القيمة "81" هي قيمة متقطعة.
نستنتج أن الطولي السفلي هو الحد الأدنى , ويتم تحديد الطولي العلوي بواسطة \(Q_3 + 1.5 \times IQR = 55.25\). بيانيا
المزيد عن Boxplot
السؤال الرئيسي الذي يطرحه الناس هو ماذا تخبرك بوكسبلوتس. ماذا يمثلون. والجواب بسيط: يعطونك وصفًا موجزًا لتوزيع العينة عن طريق توفير رسم بياني تخطيطي يوضح الموضع النسبي للعينة ملخص من 5 أرقام .
بهذه الطريقة , يمكنك البحث عن ملفات القيم المتطرفة , يمكنك تقييم درجة انحراف التوزيع , ويمكنك مسح المناطق التي تحتوي على 25٪ و 50٪ و 75٪ من إجمالي التوزيع بسرعة.
الفرق بين Box-plot و Histogram
أحد الأشياء المتعلقة بمخطط الصندوق هو أنه يوفر معلومات مختلفة قليلاً عن المعلومات التي يوفرها الرسم البياني.
في الواقع , يُظهر الرسم البياني الشكل الأولي للتوزيع , بناءً على الفئات المستخدمة لتصنيف القيم المحتملة للمتغير العشوائي. من ناحية أخرى , يوفر مربع المخطط معلومات ملخصة حول الربعية والملخص المكون من 5 أرقام , والذي يخبرك كثيرًا عن الموضع النسبي للربيع الأول والثالث فيما يتعلق بالمتوسط.
بعبارة أخرى , فإن مخطط الصندوق , على عكس المدرج التكراري , يقدم رسمًا بيانيًا يمثل a ملخص التوزيع , وليس تصويرًا خامًا. القيم الأولية الوحيدة التي ستدخل في boxplot هي القيم المتطرفة (إن وجدت).
التطبيقات
التطبيق الأكثر كلاسيكية لمخطط الصندوق هو اكتشاف القيم المتطرفة. حسب التعريف , يحد مخطط المربع من حجم الشعيرات 1.5 مرة من النطاق الرباعي \((IQR)\) من نهايات المربع (والتي يتم تحديدها بواسطة \(Q_1\) و \(Q_3\).
إذن , أي نقاط تتجاوز الحد الأقصى لحجم الشعيرات سيتم شرحها في مخطط المربع وسيتم اعتبارها استثناءً.
تدرب على المفاهيم التي تعلمتها في هذا البرنامج التعليمي باستخدام هذا صانع مربع مؤامرة . هذا هو صانع الرسم البياني الآخر الذي سيسمح برؤية الخواص التوزيعية لتوزيع العينة في لمحة واحدة صانع الرسم البياني , أو هذا صانع قطع الجذعية والأوراق .