نمودار جعبه ای

نمودار جعبه ای چیست؟
25 فوریه 2022 توسط AMY ESSELMAN

 

نمودار جعبه ای

این مقاله، بخشی از مجموعه «بازگشت به اصول» به نام «... چیست؟» است، که در آن برخی از موضوعات و سوالات رایجی که برای ما مطرح می شود را بررسی می کنیم. ما بسیاری از مطالب را در پست‌های قبلی پوشش داده‌ایم، بنابراین این مجموعه به ما اجازه می‌دهد تا بسیاری از منابع متفاوت را گرد هم بیاوریم و یک منبع واحد برای یادگیری شما ایجاد کنیم. ما معتقدیم مهم است که گاه به گاه روی دانش پایه ای، صرف نظر از اینکه در کجای سفر یادگیری خود هستید، توقف داشته باشید. موفقیت بسیاری از بصری سازی ها به درک دقیق مفاهیم اساسی بستگی دارد. بنابراین، چه برای اولین بار است که این مطلب را یاد می‌گیرید، چه برای تقویتِ اصول اصلی مطالعه می‌کنید، یا به دنبال منابعی برای به اشتراک گذاشتن با دیگران (مانند راهنمای نمودار جامع ما) هستید، به ما بپیوندید تا اصول اولیه را بازبینی کنیم.


یک نمودار جعبه ای - که گاهی طرح جعبه و سبیل هم نامیده می شود - یک نمایشگر متراکم است که هدف آن فراهم کردن پس زمینه (context) آماری قابل توجهی برای هر مجموعه داده معین است. نمودار به صورت بصری چندین معیار خلاصه را در یک نمای واحد نشان می دهد:
• حداقل: کوچکترین مقدار
• حداکثر: بزرگترین مقدار
• میانه: مقدار وسط زمانی که اعداد مرتب می شوند (یا میانگین دو مقدار میانی اگر تعداد نقاط داده زوج وجود داشته باشد) - که به عنوان صدک 50 نیز شناخته می شود زیرا نیمی از مقادیر بالاتر (و پایین تر) میانه هستند.
• چارک پایین: میانه نیمه پایین (هر چیزی کمتر از میانه کل مجموعه داده) - که به عنوان صدک 25 نیز شناخته می شود
• چارک بالایی: میانه نیمه بالایی (هر چیزی بیشتر از میانه کل مجموعه داده) - که به عنوان صدک 75 نیز شناخته می شود
بیایید این معیارها را با مجموعه داده کوچکی از نمرات آزمون با مقادیر زیر نشان دهیم: 67، 76، 80، 82، 84، 85، 90، 92، و 98.

تشریح اجزای مختلف نمودار جعبه box plot

 

چگونه یک نمودار جعبه ای را تحلیل می کنید؟
بخش "جعبه" یک نمودار جعبه ای ، چارک های پایینی و بالایی را مشخص می کند. در داخل کادر خطی وجود دارد که مقدار میانه را نشان می دهد. خطوطی وجود دارند که خارج از کادر امتداد می‌یابند (موسوم به whiskers یا سِبیل) تا محدوده‌ای از مقادیر را در یک مجموعه داده مشخص به تصویر بکشند. اگر نقاط پرت وجود داشته باشد، نقاط منفرد در راستای سبیل ها برای نشان دادن مقادیر پرت ترسیم می شوند.

در زیر، نمودار جعبه ای برای مجموعه داده نمره آزمون در بالا آمده است. توجه داشته باشید که اگر «مقادیر پَرت» در مجموعه داده ما وجود داشته باشد، سبیل‌ها «حداقل» و «حداکثر» را نشان می‌دهند، به استثنای مقادیرِ حدّی که به صورت نقطه ترسیم می‌شوند. در این حالت، محور از صفر شروع نمی شود زیرا ما فقط روی محدوده مقادیر ممکن تمرکز می کنیم.
 

اجزای مختلف نمودار جعبه در یک مثال

مانندِ نمودارهای میله ای، نمودارهای جعبه می توانند افقی یا عمودی باشند. نمودار جعبه ای  افقی گزینه خوبی برای نام‌های دسته‌بندیِ طولانی ست، در حالی که اگر ترتیب دسته‌ها از راست به چپ منطقی‌تر باشد، جهت عمودی می‌تواند انتخاب بهتری باشد. آگاه بودن در مورد جهت نموداری که انتخاب می کنید، می تواند خوانایی و درک داده ها را بهبود بخشد.

 

نمودار جعبه ای افقی و عمودی box plot


چه زمانی باید از نمودار جعبه ای استفاده کرد؟
نمودار جعبه ای ‌ها هنگام ارزیابی توزیع‌ مجموعه داده‌های متعدد در کنار هم، یک نمایش متراکم ارائه می‌دهند. به عنوان مثال، نمودار زیر نمرات آزمون را بین دروس مقایسه می کند.

نمرات دروس مختلف با نمودار جعبه ای box plot


 در این سناریو می بینیم که دامنه امتیازات برای زبان انگلیسی در مقایسه با هنر بزرگتر است. به طور کلی، نمرات هنر بالاتر است و بیشتر نزدیک هم هستند. میانه نمره ریاضی نسبت به سایر دروس پایین‌تر است و هیچ یک از درس‌ها دارای نمرات پرت یا افراطی در آزمون نیستند.

 

چه زمانی نباید از نمودار جعبه ای استفاده کرد؟

اگر به طور منظم آمار مجموعه داده ها را ارزیابی کنید، ممکن است نمودار جعبه ای تصویری آشنا باشد، اما این نوع نمودار برای بسیاری از افراد ناآشنا است و می تواند آنها را درگیر یک منحنی یادگیری کند. انتخاب یک نمایشگر متفاوت ممکن است از سردرگمی برای مخاطبانی که این نمودار را نمی شناسند و یا نحوه تجزیه و تحلیل آماری را که به تصویر می‌کشد نمی‌دانند، جلوگیری کند.

اگر در حال ارائه یک نمودار جعبه ای هستید، برای سهولت در تفسیر آن موارد زیر را در نظر بگیرید:

• نمودار را تکه تکه روایت کنید و بسازید. یک نوع نمودار پیچیده مانند این زمانی که به یکباره ارائه می شود می تواند بسیار سنگین باشد. درعوض، همانطور که ارائه می‌دهید، ساختار یک جعبه را روایت و متحرک کنید و مخاطبان خود را در درک ساختار نمودار و معنای هر شاخص همراهی کنید.
• از کلمات بهره ببرید. همیشه خوب است که وضوح و پس زمینه را از طریق استفاده هوشمندانه از عناوین نمودار و حاشیه نویسی ارائه دهید. اگر به صورت زنده ارائه نمی‌کنید، حاشیه‌نویسی آزادانه یک نمودار جعبه (یا استفاده تکراری از یک نوع نمودار ساده‌تر) می‌تواند به بینندگانی که در غیر این صورت درک نمی‌کنند که چگونه نمودار را تفسیر کنند، کمک کند.

نکته دیگری که باید از آن آگاه بود این است که یک نمودار جعبه ای توزیع داده ها را به دقت یک هیستوگرام یا نمودارهای توزیع دیگر نمایش نمی دهد. در موقعیت‌های خاص، نمودارهای جعبه می‌توانند اطلاعات اساسی مهم را پنهان کنند. به عنوان مثال، تشخیص اینکه آیا مجموعه داده شما چندنمایی (multimodes) است یا نه - به این معنی که مقادیر در بیش از یک نقطه جمع می شوند - از یک نمودار جعبه ای می تواند دشوار باشد. در تصویر زیر، اکثر مقادیر در محدوده دهه‌های 60 و 90 تجمع دارند، همانطور که در هیستوگرام نشان داده شده است، اما این از نمودار جعبه‌ای که همان مجموعه داده را نشان می‌دهد، آشکار نیست.

مقایسه هیستوگرام و نمودار جعبه ای


انواع متداول یک نمودار جعبه ای چیست؟

از زمانِ ایجاد نمودار جعبه ای ، برای نمایش عناصر بیشتر از شکل توزیع یک مجموعه داده، گونه های متفاوتی از آن ایجاد شده است.

در یک «نمودار جعبه ای با عرض متغیر»، عرض جعبه برای نمایش اندازه داده ها در هر گروه تنظیم می شود. یک مجموعه داده بزرگتر از مجموعه کوچکتر در این نمودار عریض تر خواهد بود.
 

نمودار جعبه ای با عرض متغیر


یک «نمودار جعبه ای شکاف دار» در مقدار متوسط باریک می شود. بریدگی ها شکلی از «فاصله اطمینان» را در اطراف میانه تجسم می کنند که به مقایسه مجموعه داده های مختلف کمک می کند. اگر بریدگی‌های جعبه‌های دو نمودار جعبه متفاوت با هم همپوشانی نداشته باشند، از نظر آماری تفاوت معنی‌داری بین میانه‌ها وجود دارد.

نمودار جعبه ای شکاف دار


 یک «نمودارِ ویولن» یک نمودار جعبه را با یک منحنی توزیع ترکیب می کند. عرض هر منحنی با فراوانی تقریبی نقاط داده در هر گروه مطابقت دارد. از آنجایی که نقشه های ویولن اطلاعات بیشتری را نمایش می دهند، شلوغ تر از طرح های سنتی هستند.

نمودارِ ویولن

 

کجا می توانید تمرین کنید و در مورد نمودار جعبه ای بیشتر بدانید؟

اگر مخاطب شما با این نوع نمودار آشنا نیست، این ویدیو مروری بر نمودارها و گزینه های جایگزین ارائه می دهد. برای کاربرد مرتبط، سری به این تمرین در انجمن SWD، که یک نمودار جعبه را ارائه میدهد، بزنید.

اکثر ابزارهای نموداری نمودارهای جعبه ای را به عنوان یک نوع نمودار استاندارد ارائه می دهند. پیوندهای ابزارهای رایج در زیر ارائه شده است.

 

شما می توانید سفر خود را در بقیه سری «... چیست؟» ما با سر زدن به نمودارهای متداولی مانند نمودار میله ای و نمودار خطی، ادامه دهید؛ یا در صفحه راهنمای نمودار جامع ما برای یافتن نمودارهای بیشتر چرخی بزنید.