אני אוהב דיאגרמות ון. מי לא אוהב דיאגרמות ון? הנה, דיאגרמת ון, לא?
אז אתם יודעים מה? מסתבר שלא. זו לא ממש דיאגרמת ון. דיאגרמת ון, כך מסתבר, היא רק דיאגרמה שמחברת בין כל העיגולים שמשתתפים בה. אז שני העיגולים הלא נוגעים שם למעלה? לא דיאגרמת ון. דיאגרמה שבה יש עיגולים שלא חותכים עם כל העיגולים האחרים? לא דיאגרמת ון. מה אתם יודעים. אני הופתעתי.
אז מה הם כן, אם הם לא דיאגרמת ון? מסתבר שהם דיאגרמת אוילר (Euler), בעוד דיאגרמות ון באות להראות את כל החיתוכים וההצטלבויות האפשריים בין הקבוצות שמופיעות בתרשים, גם אם הן קבוצות ריקות, כמו הקבוצה של קלפים שחורים שהם גם יהלומים כאן, או של הקלפים השחורים שהם גם קלפים אדומים. או של קלפים שחורים שהם גם קלפים אדומים וגם יהלומים. דיאגרמת אוילר, לעומת זאת, באה להראות רק חיתוכים ויחסים שבאמת קיימים בנתונים שלנו – אם אין חיתוך בין קלפים שחורים ואדומים, אז העיגולים לא יחתכו. אם כל היהלומים הם גם קלפים אדומים, אז הם יהיו מוכלים בתוכם.
יותר מדי ון
אז מה בעצם אני רוצה ממכם, חוץ מלהתקטנן על טקסונומיות מדויקות של אלמנטים אינפוגרפיים? ובכן, כן, אני כאן בשביל להתקטנן על אלמנטים אינפוגרפיים (זוכרים איפה אתם?), אבל מעבר לזה, להגיד לכם שבזכות הגילוי הזה, העברתי הרבה מנאמנותי וחיבתי מדיאגרמות ון לדיאגרמות אוילר – הון של האדם השפוי. למה שפוי? בגלל דיאגרמת הן הזו שרצה לה באינטרנט בימים האחרונים:
עכשיו, זו ללא ספק בדיחה, אם כי אחת מושקעת, אבל שמראה את המגבלות של הפורמט הזה, של דיאגרמות ון. מה שנחמד בדיאגרמה הזו היא שאפשר היה לראות אותה גדלה ומתנפחת מיום ליום. זה התחיל פשוט, עם שלוש קבוצות:
כאן הכל עדיין לגמרי קריא. שלוש קבוצות + שלושה חיתוכים בין שתי קבוצות + חיתוך משולש = שבעה פריטים על הדיאגרמה, ואפשר להבין את הבדיחה. אבל האינטרנט, כידוע, לא יכול לתת לבדיחה טובה לשבת, ומהר מאד קיבלנו גרסה של ארבע:
כאן זה כבר מתחיל להיות לנו כבד וצפוף, כפי שהשינויים בגודל הפונט מראים. כאן כבר יש לנו 13 קבוצות שונות, ונהיה קשה להבין מי בעצם הוא חיתוך עם מי – I know you’re better than this זה של מטיפים, ושל.. רגע, דיג’ייז, ואז כנראה גם של האמא שמורידה סוודר לילד. אבל רגע, לא חסרים לנו חיתוכים בין שודדי בנק ומטיפים (בלבד) ובין אמהות ותקליטנים? אולי. לא יודע. בלאגן שם בפנים. אבל אז נחזור לגרסה של החמש שראינו קודם:
בכנות? אין לי מושג מה קורה שם ואני לא בטוח שיש לי כח להפריד את החוטים הסבוכים של החיתוכים שם. הבדיחה הבסיסית היא במחומש המרכזי המשותף, ברור. אבל כאן אפשר לראות שהמעצב הרגיש צורך להכניס צבעים בשביל להקל על פענוח התרשים. יש שם… 31 אפשרויות? אני לא בטוח. ללא ספק הרבה יותר מאשר בגרסה של ה-4. והצבעים לא לגמרי עובדים, כי מהר מאד השילובים של צבעי הפסטל הופכים לחום אפור ואין לך מושג ממש מה שייך למה.
דיאגרמת ון, בקיצור, נהיית *ממש* לא אפקטיבית בהעברת מידע אם יש לך יותר מארבע קבוצות. ברגע שהאינפוגרפיקה דורשת יותר מאמץ מאשר הנתונים הגולמיים, פספסנו משהו במטרה שלה. זה נכון שיש דרכים לשפר את הקריאות, וזה נכון שבקונטקסטים הנכונים, אתה יכול לצפות שהקוראים שלך יהיו מנוסים ומתורגלים יותר בפענוח התרשים, כמו למשל בתרימים כאלה של חפיפה של מאפיינים גנטיים בקבוצות אוכלוסיה דומות – הבחירה באליפסות במקום עיגולים, הצבעים החזקים וזוויות מקלים על מציאת ההקשר של כל מספר, אבל זה עדיין מורכב ומסובך.
אז אני לא אומר לא להשתמש בדיאגרמות ון. ואני בטח ובטח לא אומר להמנע מבדיחות מבוססות דיאגרמות ון. אני רק אומר שלא למהר דווקא להשתמש בהם בשביל להעביר, באמת, מידע אמיתי בלי לחשוב על הסיטואציות שבהן זה מתאים.
ולסיום, כמובן, האינטרנט לא יודע מתי להפסיק.
דיאגרמת ון של 4 קבוצות זה כל כך מסובך שב-Keep Talking and Nobody Explodes השתמשו בזה במכוון כדי ליצור משהו שקשה לקרוא. (עמוד 13 כאן: http://www.bombmanual.com/manual/1/html/index.html)