6 سپتامبر 2022 توسط SIMON ROWE
این مقاله، بخشی از مجموعه «بازگشت به اصول» به نام «... چیست؟» است، که در آن برخی از موضوعات و سوالات رایجی که برای ما مطرح می شود را بررسی می کنیم. ما بسیاری از مطالب را در پستهای قبلی پوشش دادهایم، بنابراین این مجموعه به ما اجازه میدهد تا بسیاری از منابع متفاوت را گرد هم بیاوریم و یک منبع واحد برای یادگیری شما ایجاد کنیم. ما معتقدیم مهم است که گاه به گاه روی دانش پایه ای، صرف نظر از اینکه در کجای سفر یادگیری خود هستید، توقف داشته باشید. موفقیت بسیاری از بصری سازی ها به درک دقیق مفاهیم اساسی بستگی دارد. بنابراین، چه برای اولین بار است که این مطلب را یاد میگیرید، چه برای تقویتِ اصول اصلی مطالعه میکنید، یا به دنبال منابعی برای به اشتراک گذاشتن با دیگران (مانند راهنمای نمودار جامع ما) هستید، به ما بپیوندید تا اصول اولیه را بازبینی کنیم.
در اوایل دهه 1990، دکتر بن اشنایدرمن در تلاش بود تا چالش یافتن راهی برای ارزیابی مناسب فهرست فایل های گسترده در رایانه را حل کند. در آن زمان، روشهای تجسم موجود به دلیل شبکه بالقوه پیچیده ساختارهای پوشه مناسب نبودند.
![پوشه و زیرپوشه های درختی یک هارد](https://storytellingwithdata.ir/uploads/b93f8a4a38594116b39bcae74a4d6181.png)
دکتر Shneiderman "نقشه درختی" را به منظور بصری سازی این حجم عظیم از داده ها - بدون استفاده از سطوح مختلف پوشه ها و زیرپوشه ها - به روشی کارآمد و بدون اشغال بخش زیادی از صفحه نمایش، توسعه داد. نقشه درختی از مجموعه ای از مستطیل های تو در تو، با اندازه متناسب با مقدار داده مربوطه، برای ایجاد یک نمای سازمان یافته و چند سطحی در هر مجموعه داده سلسله مراتبی استفاده می کند.
جنبه سلسله مراتبی زمانی ایجاد میشود که مستطیلهای (شاخههای) اولیه و بزرگتر با مستطیلهای کوچکتر (شاخههای فرعی) که نمایانگر سطح بعدی در سلسلهمراتب هستند، شکسته میشوند. در مثال های زیر، مرحله 1 کل واحدهای فروخته شده را قبل خرد کردن آن به فروش به تفکیک شهر (مرحله 2) و در نهایت، بر اساس شهر و محصول (مرحله 3) نشان می دهد.
بیایید به مثال دیگری نگاهی بیندازیم.
این نقشه درختی مجموع هزینههای نقل و انتقالات باشگاههای فوتبال پنج لیگ برتر اروپا را به تصویر میکشد. اندازه مستطیل ها ارزش کل بازیکنان خریداری شده را بر حسب پوند نشان می دهد و رنگ برای هر یک از پنج لیگ اعمال می شود.
مرتب سازی
مستطیلهای یک نقشه درختی بر اساس اندازه مرتب شدهاند، از بزرگترین در گوشه بالا سمت چپ شروع میشوند و به سمت کوچکترین در پایین سمت راست پیش میروند. هنگامی که چندین سطح سلسله مراتبی نمایش داده می شود، این ترتیب برای هر یک از مستطیل های تو در تو تکرار می شود.
در این مثال، اولین سطح سلسله مراتب "لیگ" است و بنابراین بزرگترین لیگ (لیگ برتر انگلیس) در گوشه سمت چپ بالا و کوچکترین (لیگ 1 فرانسه) در پایین سمت راست قرار دارد. سطح دوم سلسله مراتب "باشگاه" است. بنابراین، در هر لیگ، باشگاهها با بزرگترین مقدار در سمت چپ بالا (چلسی، یوونتوس، بارسلونا، بایرن مونیخ و پیاسجی) و کوچکترین در پایین سمت راست دستهبندی میشوند.
سایز بندی
مستطیل ها را می توان با استفاده از تعدادی الگوریتم مختلف اندازه و مرتب کرد. ما در این پست به جزئیات این الگوریتمها نمیپردازیم - اغلب، ابزارهای نقشه درختی از پیش تعبیه شده در برنامههای نرمافزاری ما کمی حالت جعبه سیاه دارند - اما Excel و Tableau، در میان همه برنامههای محبوب، از الگوریتم "squuarified" استفاده میکنند. ، که سعی می کند هر مستطیل تا جایی که داده ها و چیدمان کلی اجازه می دهد، شبیه به یک مربع ارائه کند.
توجه به این نکته ضروری است که اندازه هر مستطیل توسط خود داده تعیین می شود و نمی توان از نقشه درختی برای نشان دادن نقاط داده صفر یا با ارزش منفی استفاده کرد.
رنگ
همانطور که در مثال بالا، رنگ را می توان بطور دسته ای برای تاکید بر مرزهای بین مستطیل های سطح بالاتر استفاده کرد. به عنوان جایگزین، رنگ را می توان به صورت نقشه گرمایی برای نشان دادن مقادیر استفاده کرد.
تعامل
به دلیل ماهیت خود، نقشه های درختی برای برچسب زدن مستطیل های کوچکتر در تصویر، چالشی را ایجاد می کنند که منجر به تعدادی بخش بی نام می شود. به همین دلیل، دیدن نقشههای درختی که به صورت تعاملی استفاده میشوند، رایجتر است، جایی که کاربر میتواند برای نمایش آن مقادیر، روی یک بخش کلیک کرده یا ماوس را روی آن نگه دارد و احتمالاً اطلاعات دقیقتری را بدست آورد.
چه زمانی از نقشه درختی استفاده می کنید؟
نقشههای درختی میتوانند در موقعیتهای مختلفی، بسته به دادههای شما، فضای موجود و روابطی که باید با نمودار خود کاوش یا تأکید کنی، مناسب باشند.
می خواهید یک رابطه جزء به کل را بین تعداد زیادی از دسته ها بصری کنید.
در حالی که نمودار دایره ای ممکن است با سه یا کمتر بخش به بهترین وجه کار کند، نقشه درختی با بسیاری از بخش ها به خوبی کار می کند. الگوهای موجود در دادهها راحتتر دیده میشوند و نقشه درختی را انتخاب خوبی برای استفاده در مرحله اکتشاف برای تحلیل کردن میکند. (به زودی نمونه ای از آن را بررسی خواهیم کرد.)
مقایسه دقیق بین دسته ها مهم نیست.
نقشههای درختی یک نمای عالی در سطح بالا از دستهها و زیرمجموعههایی که مشابه یا کاملاً متفاوت به نظر میرسند ارائه میکنند. استفاده موثر از رنگ به این مقایسه ها کمک می کند. ممکن است به دلیل تعداد مستطیلها، اتکا به مقایسه مقادیر بر اساس مساحت، و از دست دادن برچسبهای خوانا، مقداری دقت را از دست بدهید، اما در مرحله اکتشافیِ تجزیه و تحلیل شما، ممکن است یک مصالحه ارزشمند باشد.
باید استفاده بهینه از فضا را در اولویت قرار دهید.
توانایی نمایش هزاران مورد در مقدار کمی از فضای صفحه نمایش از مزایای نقشه درختی است. تنها محدودیت تعداد مستطیل هایی است که می توانند به صورت خوانا برچسب گذاری شوند.
داده های شما سلسله مراتبی است.
به سختی می توانید روشی زیباتر یا کارآمدتر برای تجسم داده ها در سطوح سلسله مراتبی چندگانه نسبت به نقشه درختی پیدا کنید. و کاملاً هم منطقی است، زیرا نیاز به انجام چنین کاری در وهله اول، انگیزه ایجاد آن بود.
با عطف توجه خود به مثال، میتوانیم چند مشاهده سریع انجام دهیم.
• لیگ برتر انگلیس (به رنگ آبی تیره) حدود ⅓ از کل هزینه های این پنج لیگ را نشان می دهد
• فرانسه (نارنجی) و آلمان (خاکستری) به مراتب کمتر از انگلیس، ایتالیا و اسپانیا هزینه کرده اند
• چهار تیم پرهزینه ایتالیا (زرد) حدود 50 درصد از کل هزینه های سری آ را تشکیل می دهند.
• بایرن مونیخ (به سمت راست بالا) حدود نیمی از کل چلسی (در سمت چپ بالا) را صرف کرده است.
ما در اینجا مشاهدات کلی انجام می دهیم، این همان چیزی است که نقشه های درختی به ما اجازه می دهند تا به خوبی انجام دهیم. ما میتوانیم برچسبهایی (جایی که فضا اجازه میدهد) اضافه کنیم تا مقدار هزینه شده را نیز نمایش دهیم.
چالش های استفاده از نقشه درختی چیست؟
ممکن است مخاطبان شما با آنها ناآشنا باشند.
یک مشکل معمولی با انواع نمودارهای جدیدتر مانند نقشه درختی این است که اگرچه از نظر بصری جذاب هستند، ممکن است از ما بخواهند که توضیحی در مورد نحوه خواندن آنها ارائه دهیم. در بسیاری از موارد، یک نوع نمودار دیگر دادهها را بهطور مؤثرتری نشان میدهد، بهویژه اگر بتوانیم دادههایی را که برای اشتراکگذاری انتخاب میکنیم، با دقت جمعبندی یا ویرایش کنیم.
مقایسه دقیق مساحت ها دشوار است.
ما در مقایسههای بصری بر اساس طول و ارتفاع یا موقعیت نقطهها بسیار کارآمد هستیم. در حالی که ما نمی توانیم منطقه و شدت رنگ را دقیقاً ارزیابی کنیم. اگر داده ها تفاوت قابل توجهی نشان ندهند، نقشه درختی را با مستطیل هایی با اندازه های مشابه اما نه یکسان پر می کنیم، این موضوع، مقایسه ها را به ویژه دشوار می کند. همیشه در نظر داشته باشید که آیا نمودار میله ای یا نمودار خطی ممکن است سریعتر به درک مخاطب دست یابد.
پردازش آنها ممکن است طاقت فرسا باشد.
در حالی که توانایی بصری سازی هزاران مورد در سطوح مختلف سلسله مراتبی، یک نقطه قوت نقشه های درختی است، این مقدار بسیار زیاد اطلاعات می تواند برای مخاطبان طاقت فرسا شود. اگر اکثر مستطیلهای شما برچسبگذاری نشدهاند یا سطوحِ مختلف سلسلهمراتب غیرقابل تشخیص هستند، روش دیگری را برای بصری سازی دادهها در نظر بگیرید.
آنها فقط می توانند برای مجموعه داده هایی استفاده شوند که در آنها هر مقدار بزرگتر از صفر است.
مقدار اندازه گیری مستطیل نمی تواند مقدار منفی داشته باشد. این نکته، موارد استفاده بالقوه آن را محدود می کند، برای مثال نمی توانید سود و زیان را با آن به تصویر بکشید.
برخی از این چالشها زمانی آشکار میشوند که سؤالات ظریفتری در مورد مثال از خود میپرسیم.
• کدام لیگ بیشتر هزینه کرده است: آلمان یا فرانسه؟
• آیا شش تیم برتر انگلیس بیشتر از ایتالیا هزینه کرده اند؟
• شش تیم برتر هر لیگ چه نسبتی از خرج می کنند؟
• ناتینگهام فارست چقدر هزینه کرده است؟
خوب، سوال آخر کمی ناعادلانه است. مستطیل ناتینگهام فارست حتی برچسب گذاری نشده است، اما این خود چالشی است که در بالا به آن اشاره شد. توجه داشته باشید که چگونه پاسخ دادن به این سؤالات بسیار دشوارتر است، زیرا به مقایسه دقیق تری نسبت به این نقشه درختی نیاز دارند.
جایگزین های نقشه درختی
در بسیاری از موارد، نقشههای درختی را میتوان با نمودارهای میلهای (برای دادههایی که دارای یک متغیر کمی و یک متغیر طبقهای هستند) یا نمودارهای پراکنده (برای دادههایی با دو متغیر کمی) جایگزین کرد.
بیایید مثال خود را با استفاده از دو نمودار میلهای برای بیان داستان کلی هزینههای بین لیگها و نحوه تعادل بین 6 تیم خرجکننده برتر و بقیه در نظر بگیریم. در حالی که این بینش ها با کاوش در نقشه درختی یافت شدند، مسلماً با استفاده از نوارهای زیر بهتر توضیح داده می شوند.
مانند هر نوع نمودار، مطمئن شوید که نقشه درختی به دلایل درست انتخاب شده است. به این معنا که اطمینان حاصل کنید که تصویر با داستان و دادههای پشتیبان آن مطابقت دارد، و سعی نکنید دادهها را مجبور به انتخاب نموداری کمتر از حد مطلوب کنید یا این نمودار را به دلایل شخصی یا زیباییشناختی انتخاب کنید.
از کجا می توانم درباره نقشه های درختی بیشتر بیاموزم؟
• در مورد جزئیات فنی تحقیقات نقشه درختی از دانشگاه مریلند بخوانید
• نحوه ایجاد نقشه درختی در Microsoft Office را بررسی کنید
• الیزابت ریکس، داستانگوی دادههای SWD، جایگزینی برای نقشههای درختی در این بازآرایی واقعی ارائه میکند.
• نقشه های درختی جغرافیایی، گونه ای ظریف از نقشه درختی کلاسیک را، در این گفتگوی جذاب با عضو انجمن، راب رادبرن در مورد نقشه های درختی جغرافیایی کاوش کنید.