نقشه درختی

6 سپتامبر 2022 توسط SIMON ROWE

این مقاله، بخشی از مجموعه «بازگشت به اصول» به نام «... چیست؟» است، که در آن برخی از موضوعات و سوالات رایجی که برای ما مطرح می شود را بررسی می کنیم. ما بسیاری از مطالب را در پست‌های قبلی پوشش داده‌ایم، بنابراین این مجموعه به ما اجازه می‌دهد تا بسیاری از منابع متفاوت را گرد هم بیاوریم و یک منبع واحد برای یادگیری شما ایجاد کنیم. ما معتقدیم مهم است که گاه به گاه روی دانش پایه ای، صرف نظر از اینکه در کجای سفر یادگیری خود هستید، توقف داشته باشید. موفقیت بسیاری از بصری سازی ها به درک دقیق مفاهیم اساسی بستگی دارد. بنابراین، چه برای اولین بار است که این مطلب را یاد می‌گیرید، چه برای تقویتِ اصول اصلی مطالعه می‌کنید، یا به دنبال منابعی برای به اشتراک گذاشتن با دیگران (مانند راهنمای نمودار جامع ما) هستید، به ما بپیوندید تا اصول اولیه را بازبینی کنیم.

 

در اوایل دهه 1990، دکتر بن اشنایدرمن در تلاش بود تا چالش یافتن راهی برای ارزیابی مناسب فهرست فایل های گسترده در رایانه را حل کند. در آن زمان، روش‌های تجسم موجود به دلیل شبکه بالقوه پیچیده ساختارهای پوشه مناسب نبودند.

پوشه و زیرپوشه های درختی یک هارد
 پوشه های موجود در این تصویر فقط 0.05 درصد از کل ظرفیت هارد دیسک را شامل می شود


دکتر Shneiderman "نقشه درختی" را به منظور بصری سازی این حجم عظیم از داده ها - بدون استفاده از سطوح مختلف پوشه ها و زیرپوشه ها - به روشی کارآمد و بدون اشغال بخش زیادی از صفحه نمایش، توسعه داد. نقشه درختی از مجموعه ای از مستطیل های تو در تو، با اندازه متناسب با مقدار داده مربوطه، برای ایجاد یک نمای سازمان یافته و چند سطحی در هر مجموعه داده سلسله مراتبی استفاده می کند.

جنبه سلسله مراتبی زمانی ایجاد می‌شود که مستطیل‌های (شاخه‌های) اولیه و بزرگ‌تر با مستطیل‌های کوچک‌تر (شاخه‌های فرعی) که نمایانگر سطح بعدی در سلسله‌مراتب هستند، شکسته می‌شوند. در مثال های زیر، مرحله 1 کل واحدهای فروخته شده را قبل خرد کردن آن به فروش به تفکیک شهر (مرحله 2) و در نهایت، بر اساس شهر و محصول (مرحله 3) نشان می دهد.
 

نمای کلی نقشه درختی

نمای با یک شکست در نقشه درختی

نمای با دو شکست در نقشه درختی


 بیایید به مثال دیگری نگاهی بیندازیم.

نقشه درختی treemap-هزینه نقل و انتقال بازیکنان در لیگ های اروپایی


 این نقشه درختی مجموع هزینه‌های نقل و انتقالات باشگاه‌های فوتبال پنج لیگ برتر اروپا را به تصویر می‌کشد. اندازه مستطیل ها ارزش کل بازیکنان خریداری شده را بر حسب پوند نشان می دهد و رنگ برای هر یک از پنج لیگ اعمال می شود.

 

مرتب سازی
مستطیل‌های یک نقشه درختی بر اساس اندازه مرتب شده‌اند، از بزرگ‌ترین در گوشه بالا سمت چپ شروع می‌شوند و به سمت کوچک‌ترین در پایین سمت راست پیش می‌روند. هنگامی که چندین سطح سلسله مراتبی نمایش داده می شود، این ترتیب برای هر یک از مستطیل های تو در تو تکرار می شود.

در این مثال، اولین سطح سلسله مراتب "لیگ" است و بنابراین بزرگترین لیگ (لیگ برتر انگلیس) در گوشه سمت چپ بالا و کوچکترین (لیگ 1 فرانسه) در پایین سمت راست قرار دارد. سطح دوم سلسله مراتب "باشگاه" است. بنابراین، در هر لیگ، باشگاه‌ها با بزرگ‌ترین مقدار در سمت چپ بالا (چلسی، یوونتوس، بارسلونا، بایرن مونیخ و پی‌اس‌جی) و کوچک‌ترین در پایین سمت راست دسته‌بندی می‌شوند.


سایز بندی
مستطیل ها را می توان با استفاده از تعدادی الگوریتم مختلف اندازه و مرتب کرد. ما در این پست به جزئیات این الگوریتم‌ها نمی‌پردازیم - اغلب، ابزارهای نقشه درختی از پیش تعبیه شده در برنامه‌های نرم‌افزاری ما کمی حالت جعبه سیاه دارند - اما Excel و Tableau، در میان همه برنامه‌های محبوب، از الگوریتم "squuarified" استفاده می‌کنند. ، که سعی می کند هر مستطیل تا جایی که داده ها و چیدمان کلی اجازه می دهد، شبیه به یک مربع ارائه کند.

توجه به این نکته ضروری است که اندازه هر مستطیل توسط خود داده تعیین می شود و نمی توان از نقشه درختی برای نشان دادن نقاط داده صفر یا با ارزش منفی استفاده کرد.

 

رنگ

همانطور که در مثال بالا، رنگ را می توان بطور دسته ای برای تاکید بر مرزهای بین مستطیل های سطح بالاتر استفاده کرد. به عنوان جایگزین، رنگ را می توان به صورت نقشه گرمایی برای نشان دادن مقادیر استفاده کرد.

 

تعامل

به دلیل ماهیت خود، نقشه های درختی برای برچسب زدن مستطیل های کوچکتر در تصویر، چالشی را ایجاد می کنند که منجر به تعدادی بخش بی نام می شود. به همین دلیل، دیدن نقشه‌های درختی که به صورت تعاملی استفاده می‌شوند، رایج‌تر است، جایی که کاربر می‌تواند برای نمایش آن مقادیر، روی یک بخش کلیک کرده یا ماوس را روی آن نگه دارد و احتمالاً اطلاعات دقیق‌تری را بدست آورد.

 

چه زمانی از نقشه درختی استفاده می کنید؟

نقشه‌های درختی می‌توانند در موقعیت‌های مختلفی، بسته به داده‌های شما، فضای موجود و روابطی که باید با نمودار خود کاوش یا تأکید کنی، مناسب باشند.


می خواهید یک رابطه جزء به کل را بین تعداد زیادی از دسته ها بصری کنید.

در حالی که نمودار دایره ای ممکن است با سه یا کمتر بخش به بهترین وجه کار کند، نقشه درختی با بسیاری از بخش ها به خوبی کار می کند. الگوهای موجود در داده‌ها راحت‌تر دیده می‌شوند و نقشه درختی را انتخاب خوبی برای استفاده در مرحله اکتشاف برای تحلیل کردن می‌کند. (به زودی نمونه ای از آن را بررسی خواهیم کرد.)


مقایسه دقیق بین دسته ها مهم نیست.

نقشه‌های درختی یک نمای عالی در سطح بالا از دسته‌ها و زیرمجموعه‌هایی که مشابه یا کاملاً متفاوت به نظر می‌رسند ارائه می‌کنند. استفاده موثر از رنگ به این مقایسه ها کمک می کند. ممکن است به دلیل تعداد مستطیل‌ها، اتکا به مقایسه مقادیر بر اساس مساحت، و از دست دادن برچسب‌های خوانا، مقداری دقت را از دست بدهید، اما در مرحله اکتشافیِ تجزیه و تحلیل شما، ممکن است یک مصالحه ارزشمند باشد.

 

باید استفاده بهینه از فضا را در اولویت قرار دهید.

توانایی نمایش هزاران مورد در مقدار کمی از فضای صفحه نمایش از مزایای نقشه درختی است. تنها محدودیت تعداد مستطیل هایی است که می توانند به صورت خوانا برچسب گذاری شوند.


داده های شما سلسله مراتبی است.

به سختی می توانید روشی زیباتر یا کارآمدتر برای تجسم داده ها در سطوح سلسله مراتبی چندگانه نسبت به نقشه درختی پیدا کنید. و کاملاً هم منطقی است، زیرا نیاز به انجام چنین کاری در وهله اول، انگیزه ایجاد آن بود.


با عطف توجه خود به مثال، می‌توانیم چند مشاهده سریع انجام دهیم.

نقشه درختی treemap-هزینه نقل و انتقال بازیکنان در لیگ های اروپایی

• لیگ برتر انگلیس (به رنگ آبی تیره) حدود ⅓ از کل هزینه های این پنج لیگ را نشان می دهد
• فرانسه (نارنجی) و آلمان (خاکستری) به مراتب کمتر از انگلیس، ایتالیا و اسپانیا هزینه کرده اند
• چهار تیم پرهزینه ایتالیا (زرد) حدود 50 درصد از کل هزینه های سری آ را تشکیل می دهند.
• بایرن مونیخ (به سمت راست بالا) حدود نیمی از کل چلسی (در سمت چپ بالا) را صرف کرده است.
ما در اینجا مشاهدات کلی انجام می دهیم، این همان چیزی است که نقشه های درختی به ما اجازه می دهند تا به خوبی انجام دهیم. ما می‌توانیم برچسب‌هایی (جایی که فضا اجازه می‌دهد) اضافه کنیم تا مقدار هزینه ‌شده را نیز نمایش دهیم.

چالش های استفاده از نقشه درختی چیست؟

ممکن است مخاطبان شما با آنها ناآشنا باشند.

یک مشکل معمولی با انواع نمودارهای جدیدتر مانند نقشه درختی این است که اگرچه از نظر بصری جذاب هستند، ممکن است از ما بخواهند که توضیحی در مورد نحوه خواندن آنها ارائه دهیم. در بسیاری از موارد، یک نوع نمودار دیگر داده‌ها را به‌طور مؤثرتری نشان می‌دهد، به‌ویژه اگر بتوانیم داده‌هایی را که برای اشتراک‌گذاری انتخاب می‌کنیم، با دقت جمع‌بندی یا ویرایش کنیم.


مقایسه دقیق مساحت ها دشوار است.

ما در مقایسه‌های بصری بر اساس طول و ارتفاع یا موقعیت نقطه‌ها بسیار کارآمد هستیم. در حالی که ما نمی توانیم منطقه و شدت رنگ را دقیقاً ارزیابی کنیم. اگر داده ها تفاوت قابل توجهی نشان ندهند، نقشه درختی را با مستطیل هایی با اندازه های مشابه اما نه یکسان پر می کنیم، این موضوع، مقایسه ها را به ویژه دشوار می کند. همیشه در نظر داشته باشید که آیا نمودار میله ای یا نمودار خطی ممکن است سریعتر به درک مخاطب دست یابد.

 

پردازش آنها ممکن است طاقت فرسا باشد.

در حالی که توانایی بصری سازی هزاران مورد در سطوح مختلف سلسله مراتبی، یک نقطه قوت نقشه های درختی است، این مقدار بسیار زیاد اطلاعات می تواند برای مخاطبان طاقت فرسا شود. اگر اکثر مستطیل‌های شما برچسب‌گذاری نشده‌اند یا سطوحِ مختلف سلسله‌مراتب غیرقابل تشخیص هستند، روش دیگری را برای بصری سازی داده‌ها در نظر بگیرید.

 

آنها فقط می توانند برای مجموعه داده هایی استفاده شوند که در آنها هر مقدار بزرگتر از صفر است.

مقدار اندازه گیری مستطیل نمی تواند مقدار منفی داشته باشد. این نکته، موارد استفاده بالقوه آن را محدود می کند، برای مثال نمی توانید سود و زیان را با آن به تصویر بکشید.


برخی از این چالش‌ها زمانی آشکار می‌شوند که سؤالات ظریف‌تری در مورد مثال از خود می‌پرسیم.
 

نقشه درختی treemap-هزینه نقل و انتقال بازیکنان در لیگ های اروپایی

• کدام لیگ بیشتر هزینه کرده است: آلمان یا فرانسه؟
• آیا شش تیم برتر انگلیس بیشتر از ایتالیا هزینه کرده اند؟
• شش تیم برتر هر لیگ چه نسبتی از خرج می کنند؟
• ناتینگهام فارست چقدر هزینه کرده است؟
خوب، سوال آخر کمی ناعادلانه است. مستطیل ناتینگهام فارست حتی برچسب گذاری نشده است، اما این خود چالشی است که در بالا به آن اشاره شد. توجه داشته باشید که چگونه پاسخ دادن به این سؤالات بسیار دشوارتر است، زیرا به مقایسه دقیق تری نسبت به این نقشه درختی نیاز دارند.


جایگزین های نقشه درختی

در بسیاری از موارد، نقشه‌های درختی را می‌توان با نمودارهای میله‌ای (برای داده‌هایی که دارای یک متغیر کمی و یک متغیر طبقه‌ای هستند) یا نمودارهای پراکنده (برای داده‌هایی با دو متغیر کمی) جایگزین کرد.

بیایید مثال خود را با استفاده از دو نمودار میله‌ای برای بیان داستان کلی هزینه‌های بین لیگ‌ها و نحوه تعادل بین 6 تیم خرج‌کننده برتر و بقیه در نظر بگیریم. در حالی که این بینش ها با کاوش در نقشه درختی یافت شدند، مسلماً با استفاده از نوارهای زیر بهتر توضیح داده می شوند.

مانند هر نوع نمودار، مطمئن شوید که نقشه درختی به دلایل درست انتخاب شده است. به این معنا که اطمینان حاصل کنید که تصویر با داستان و داده‌های پشتیبان آن مطابقت دارد، و سعی نکنید داده‌ها را مجبور به انتخاب نموداری کمتر از حد مطلوب کنید یا این نمودار را به دلایل شخصی یا زیبایی‌شناختی انتخاب کنید.

 

از کجا می توانم درباره نقشه های درختی بیشتر بیاموزم؟

• در مورد جزئیات فنی تحقیقات نقشه درختی از دانشگاه مریلند بخوانید
نحوه ایجاد نقشه درختی در Microsoft Office را بررسی کنید
• الیزابت ریکس، داستان‌گوی داده‌های SWD، جایگزینی برای نقشه‌های درختی در این بازآرایی واقعی ارائه می‌کند.
نقشه های درختی جغرافیایی، گونه ای ظریف از نقشه درختی کلاسیک را، در این گفتگوی جذاب با عضو انجمن، راب رادبرن در مورد نقشه های درختی جغرافیایی کاوش کنید.