אחד הגרפים המדוברים יותר בימים האחרונים, בסביבתי, הוא גרף הטבעת הזה, שהתפרסם בדהמרקר ב-24/03/2020, ומפלח את המיקומים בהם נדבקו חולים בקורונה בהדבקה קהילתית – כלומר, בהדבקה בתוך הארץ, במהלך חיי יום-יום שגרתיים:
אני לא אכנס כרגע לשאלות של בחירת צבעים, או עצם השימוש בגרף טבעת. אני דווקא אתייחס לשאלה של מה לא מופיע בגרף הזה, כי זו שאלה שעלתה ברוב הדיונים שלי סביב הגרף הזה מאז שפורסם.
אז מה לא מופיע בגרף הזה? בניגוד למה שהשימוש בגרף טבעת מרמז – בכך שמדובר בכלל ההדבקויות – מדובר רק בחלק קטן יחסית מסך חולי הקורונה בישראל – כ-35%, ע"פ הכתבה. שאר החולים נדבקו בחו"ל (47% מהחולים) בביתם (5%) או ממקור לא ידוע (13%). למה זה משנה,כי אנשים התרעמו, ובצדק, שיש לנו גרף שמתיימר לתת פילוח של מקומות היבדקות, אבל כשהוא בוחר להתמקד ב-35% מהחולים בלבד, הוא נותן תמונה מוטה של החלק היחסי של מקומות ההידבקות הללו. תוך חמש דקות, יכולתי הרי לייצר את הגרף הזה:

אבל האם באמת הרווחנו כאן משהו? כלומר כן, הטבעת שלי מקיפה יותר נתונים, אבל אז אנחנו חייבים לעצור ולשאול את עצמנו מה בעצם השאלה שאנחנו שואלים, ולמה בכלל אנחנו עושים את האינפוגרפיקה שלנו.
נתונים, בפני עצמם, אינם מעניינים. נתונים לא קיימים בוואקום. כשאנחנו בונים אינפוגרפיקה, אנחנו עושים את זה כי אנחנו רוצים לספר סיפור כלשהו לקוראים שלנו, או כי אנחנו רוצים להוציא תובנות מהנתונים מתוך מטרה מסוימת. והמטרה הזו, והתובנות שאנחנו מחפשים, משפיעים ומכווינים לא רק את סוג האינפוגרפיקה שלנו, אלא גם את הנתונים שאנחנו בוחרים להכניס לתוכה.
אז אם המטרה היא לקבל תמונת מצב מלאה של מקורות ההידבקות, הטבעת שלי ללא ספק תשרת את המטרה טוב יותר. אבל אם המטרה שלנו היא להסתכל על הנתונים של הידבקות בקהילה כדי לקבל תובנות לגבי האפקטיביות של צעדי סגר ובידוד, ולקבל החלטות מושכלות לגבי המשך קיומם, אז הוספתם של 47% החולים בחו"ל לא סתם שלא עוזרים לנו, הם מייצרים רעש רב בגרף ומפריעים להבין איפה במרחב שלנו ישנה בעיה.
אז כן, כתבתי כאן פעמים רבות על הבעיה של קיצוץ בסיס הצירים כטכניקה שמעצימה הבדלים או נותנת לנתון אחד תחושה שהוא עצום, בעוד הוא רק טיפה יותר גדול מאחרים. וגם כאן, אפשר לראות שכשמוסיפים עוד נתונים אז ההבדלים בין בתי כנסת למלונות, נגיד, מרגיש קצת פחות דרמטי. אבל גם קיצוץ מערכת הצירים הוא כלי. כשהוא נעשה בצורה מושכלת ולא בהסתר, כפי שכתבתי כאן, אז הוא כלי אפקטיבי בלהדגיש את מה שאנחנו רוצים להדגיש בסיפור שלנו, ובמסקנות שלנו.





כאן הכל עדיין לגמרי קריא. שלוש קבוצות + שלושה חיתוכים בין שתי קבוצות + חיתוך משולש = שבעה פריטים על הדיאגרמה, ואפשר להבין את הבדיחה. אבל האינטרנט, כידוע, לא יכול לתת לבדיחה טובה לשבת, ומהר מאד קיבלנו גרסה של ארבע:
כאן זה כבר מתחיל להיות לנו כבד וצפוף, כפי שהשינויים בגודל הפונט מראים. כאן כבר יש לנו 13 קבוצות שונות, ונהיה קשה להבין מי בעצם הוא חיתוך עם מי – I know you’re better than this זה של מטיפים, ושל.. רגע, דיג’ייז, ואז כנראה גם של האמא שמורידה סוודר לילד. אבל רגע, לא חסרים לנו חיתוכים בין שודדי בנק ומטיפים (בלבד) ובין אמהות ותקליטנים? אולי. לא יודע. בלאגן שם בפנים. אבל אז נחזור לגרסה של החמש שראינו קודם:




