[הפוסט התפרסם לראשונה ב”מדריך הטרמפיסט לסטטיסטיקה”, הבלוג של טל גלילי]
דף הפייסבוק של ידיעות אחרונות פירסם הודעה עם הגרף שמתחת, ומעליו הטקסט הבא:
התעצבנתם מחשבון החשמל המנופח? כשתקבלו את החשבון הבא תתעצבנו עוד יותר. כתבנו עמיר בן-דוד מדווח כי תעריפי החשמל יעלו בשבוע הבא בעוד 8.9%, ובכך ישלימו זינוק של 24% בתוך שנה. תראו כמה שילמתם אז – וכמה אתם עומדים לשלם עכשיו
אין ספק שכעס זה דבר שמושך תשומת לב של קוראים, ועלייה במחירי החשמל בפירוש עונה על הקריטריון הזה. אבל רגע, האם אתם שמים לב לאיזושהי בעיה בגרף שלמעלה?
מה שאנחנו רואים כאן זה מצב שבו יש גרף שמנסה לתאר את הטקסט הכתוב, מבלי להקפיד על מה שהמספרים אומרים. זאת במקום לוודא שהגרף מייצג את המספרים, ושהטקסט הכתוב מתאר את הגרף. אז איזה בעיות יש בגרף הזה?
נתחיל בגרף העליון שהופיע בעיתון:
1) בציר ה- X (הציר האופקי), המרחק שמופיע בתרשים העמודות, שבין מארס 2011, נובמבר 2011, ואפריל 2012 הוא קבוע (למרות שהמרחק בין התאריך הללו איננו קבוע).
2) בציר ה- Y (הציר האנכי), אנחנו לא רואים את נקודת ה- 0, מה שמקשה לקבל פרופורציה נכונה של מידת העלייה. מהתסכלות בגרף זה עלול להרגיש כאילו העלייה במחיר היא בערך פי 2 מהמחיר שהיה ב- 2010, למרות שזה בפירוש לא המקרה.
גרף שישקף את הנתונים טוב יותר, יהיה הגרף הבא: (אשר נוצר בזריזות באקסל), ציר ה- X מתאר את מספר החודשים שעברו מתחילת 2010:
אומנם הגרף הזה פחות יפה מהגרף שלמעלה (אין בו תקעים נחמדים ועולים), והוא פחות קומפקטי (יש בו הרבה מרווחים ריקים). מאידך, הוא משקף את הנתונים יפה. האם אפשר היה למצוא שילוב סביר בין הגרף בעיתון (שנראה יפה) לגרף שאני יצרתי? אני משער שכן, אבל זה יהיה אתגר.
כעת נעבור לגרף התחתון שהופיע בעיתון.פה מדובר בעיוות ממש דרמטי אשר לא רק שאיננו משקף את המציאות, אלא גם פוגע בטענה שהעיתון מנסה לקדם. מה הבעיה בגרף הזה? הבעיה היא שהוא מספר כאילו העלייה במחירי החשמל בין 2010 ל- 2012 הייתה במגמת עלייה לינארית (קווית, ישרה), כאשר אם אנחנו משרטטים את הנתונים (שוב, באקסל פשוט) בסקאלות המתאימות, אנחנו מגלים סיפור אחר לגמרי:
במילים אחרות, יש מעט קשר בין הגרף שידיעות הציג, לבין המספרים שמופיעים על הגרף. אפשר לראות שהסיפור שהנתונים מספרים הוא של מחיר דומה בשנים 2010 ו- 2011, ואז קפיצה דרמטית ב- 2012.
עוד נקודה (עדינה יותר), היא שהנתונים שמוצגים בכתבה הם חסרי קונטקסט. מה היה הטרנד של החשמל בחמש השנים האחרונות? האם זה הגון להשוות בין המחיר של 2012 במשך 4 חודשים שלו, למול המחיר הממוצע של השנים 2011 ו- 2010? (אולי לא, כי אולי יש הרבה רעש, שונות, במחירי החשמל לאורך השנה). אפשר היה גם לחשוב על לתת הקשר של מחירי החשמל בישראל לתופעות אחרות כמו מחירי החשמל במקומות אחרים בעולם, מחירי הנפט והגז במדינות שמהן אנו מייבאים חומרי גלם, ועוד ועוד. כל אלו סוגיות מורכבות יותר שהיה אפשר לחשוב עליהן בהקשר של הצגת הנתונים הנוגעים לתעריפי החשמל בישראל.
לסיכום: הגרפיקה שידיעות אחרונות הציג היא "יפה", אך לא משקפת היטב את הנתונים. הסיפור שהנתונים מציג הוא מורכב (ובעיני, מעניין) יותר מזה שמציגה הכתבה. ובכל מקרה, הייתי שמח ליותר נתונים כדי לקבל הקשר על מה שקורה כרגע.
עידכונון: עמית בן בסטהציע את המונח (המשובח) "דיסאינפוגרפיקה" בשביל לתאר את התופעה שאנו רואים בפוסט זה. (כמו דיסאינפורמציה, אבל דרך גרפיקה…)
פיספסתי משהו? יש לכם עוד דוגמאות יפות לאינפוגרפיקות "מטעות"? יש לכם מילה טובה לתת? אתם מוזמנים להשאיר תגובה…