העתק-הדבק

בטמקא פרסמו סקר חדש בעקבות הפריימריס בקדימה, לפיו קדימה ולפיד נאבקים ראש בראש על המקומות הרביעי והחמישי בדירוג המפלגות.

מכיוון שאפילו הם יודעים שלסקרים הללו אין משמעות, אוהבים העיתונים לעסוק בספקולציות חסרות שחר. הפעם, למשל, צורף לסקר הזה גם סקר ששאל כיצד יצביעו הבוחרים אם ציפי ליבני תצטרף למפלגתו של לפיד. מסתבר שלפיד יזנק מ-12 ל-15 מנדטים (ולמקום השלישי בדירוג), בעוד שקדימה, העבודה והליכוד יאבדו מנדט אחד כל אחת.

אבל לערוך סקר זה קל. להכין אינפוגרפיקה, לעומת זאת, זה קשה. כנראה. קשה להסביר אחרת את העובדה שהגרפיקה שמציגה את הסקר השני היא פשוט העתק של חמשת העמודות הראשונות מהסקר הראשון, אבל עם מספרים שונים (ותוספת ליבני לעמודה של לפיד). כך לפיד (15 מנדטים) ממוקם במקום החמישי באותו גובה כמו קדימה (11 מנדטים), ונמוך מישראל ביתנו (13 מנדטים). לא ספרתי פיקסלים, אבל אני מוכן להתערב שגם העמודות של הליכוד ושל העבודה לא זעו מילימטר ביחס לעמודות האחרות, חרף אובדן של שלושה-חמישה אחוזים מערכן.

כי באמת, בשביל מה צריך לשנות את הגרף כשמשתנים המספרים? זה לא כאילו שכל מטרתה של האינפוגרפיקה היא שלא נצטרך לעיין באופן מדוקדק בנתונים כדי לקבל את התמונה הכללית…

מחירי החשמל עולים, אבל לא ככה

[הפוסט התפרסם לראשונה ב”מדריך הטרמפיסט לסטטיסטיקה”, הבלוג של טל גלילי]

דף הפייסבוק של ידיעות אחרונות פירסם הודעה עם הגרף שמתחת, ומעליו הטקסט הבא:

התעצבנתם מחשבון החשמל המנופח? כשתקבלו את החשבון הבא תתעצבנו עוד יותר. כתבנו עמיר בן-דוד מדווח כי תעריפי החשמל יעלו בשבוע הבא בעוד 8.9%, ובכך ישלימו זינוק של 24% בתוך שנה. תראו כמה שילמתם אז – וכמה אתם עומדים לשלם עכשיו

אין ספק שכעס זה דבר שמושך תשומת לב של קוראים, ועלייה במחירי החשמל בפירוש עונה על הקריטריון הזה. אבל רגע, האם אתם שמים לב לאיזושהי בעיה בגרף שלמעלה?

מה שאנחנו רואים כאן זה מצב שבו יש גרף שמנסה לתאר את הטקסט הכתוב, מבלי להקפיד על מה שהמספרים אומרים. זאת במקום לוודא שהגרף מייצג את המספרים, ושהטקסט הכתוב מתאר את הגרף. אז איזה בעיות יש בגרף הזה?

נתחיל בגרף העליון שהופיע בעיתון:
1) בציר ה- X (הציר האופקי), המרחק שמופיע בתרשים העמודות, שבין מארס 2011, נובמבר 2011, ואפריל 2012 הוא קבוע (למרות שהמרחק בין התאריך הללו איננו קבוע).
2) בציר ה- Y (הציר האנכי), אנחנו לא רואים את נקודת ה- 0, מה שמקשה לקבל פרופורציה נכונה של מידת העלייה. מהתסכלות בגרף זה עלול להרגיש כאילו העלייה במחיר היא בערך פי 2 מהמחיר שהיה ב- 2010, למרות שזה בפירוש לא המקרה.

גרף שישקף את הנתונים טוב יותר, יהיה הגרף הבא: (אשר נוצר בזריזות באקסל), ציר ה- X מתאר את מספר החודשים שעברו מתחילת 2010:

אומנם הגרף הזה פחות יפה מהגרף שלמעלה (אין בו תקעים נחמדים ועולים), והוא פחות קומפקטי (יש בו הרבה מרווחים ריקים). מאידך, הוא משקף את הנתונים יפה. האם אפשר היה למצוא שילוב סביר בין הגרף בעיתון (שנראה יפה) לגרף שאני יצרתי? אני משער שכן, אבל זה יהיה אתגר.

כעת נעבור לגרף התחתון שהופיע בעיתון.פה מדובר בעיוות ממש דרמטי אשר לא רק שאיננו משקף את המציאות, אלא גם פוגע בטענה שהעיתון מנסה לקדם. מה הבעיה בגרף הזה? הבעיה היא שהוא מספר כאילו העלייה במחירי החשמל בין 2010 ל- 2012 הייתה במגמת עלייה לינארית (קווית, ישרה), כאשר אם אנחנו משרטטים את הנתונים (שוב, באקסל פשוט) בסקאלות המתאימות, אנחנו מגלים סיפור אחר לגמרי:

במילים אחרות, יש מעט קשר בין הגרף שידיעות הציג, לבין המספרים שמופיעים על הגרף. אפשר לראות שהסיפור שהנתונים מספרים הוא של מחיר דומה בשנים 2010 ו- 2011, ואז קפיצה דרמטית ב- 2012.

עוד נקודה (עדינה יותר), היא שהנתונים שמוצגים בכתבה הם חסרי קונטקסט. מה היה הטרנד של החשמל בחמש השנים האחרונות? האם זה הגון להשוות בין המחיר של 2012 במשך 4 חודשים שלו, למול המחיר הממוצע של השנים 2011 ו- 2010? (אולי לא, כי אולי יש הרבה רעש, שונות, במחירי החשמל לאורך השנה). אפשר היה גם לחשוב על לתת הקשר של מחירי החשמל בישראל לתופעות אחרות כמו מחירי החשמל במקומות אחרים בעולם, מחירי הנפט והגז במדינות שמהן אנו מייבאים חומרי גלם, ועוד ועוד. כל אלו סוגיות מורכבות יותר שהיה אפשר לחשוב עליהן בהקשר של הצגת הנתונים הנוגעים לתעריפי החשמל בישראל.

לסיכום: הגרפיקה שידיעות אחרונות הציג היא "יפה", אך לא משקפת היטב את הנתונים. הסיפור שהנתונים מציג הוא מורכב (ובעיני, מעניין) יותר מזה שמציגה הכתבה. ובכל מקרה, הייתי שמח ליותר נתונים כדי לקבל הקשר על מה שקורה כרגע.

עידכונון: עמית בן בסטהציע את המונח (המשובח) "דיסאינפוגרפיקה" בשביל לתאר את התופעה שאנו רואים בפוסט זה. (כמו דיסאינפורמציה, אבל דרך גרפיקה…)

פיספסתי משהו? יש לכם עוד דוגמאות יפות לאינפוגרפיקות "מטעות"? יש לכם מילה טובה לתת? אתם מוזמנים להשאיר תגובה…

מספרים מדברים

הוושינגטון פוסט מביאים לנו אינפוגרפיקה אינטראקטיבית שמנסה, יותר מהכל, לפוצץ קצת את הבלון של האינפוגרפיקות. הם מראים לנו גרף מבהיל של עליית מחירי הדלק ב-90 השנה האחרונות, תחת הכותרת “התפיסה המקובלת”:

image

 

ועם לחיצה על כפתור “המציאות”, מוצג לנו הגרף הזה, שמראה את אותם נתונים, בתוספת הצמדה לאינפלציה. גרף ששם את השינויים קצת יותר בפרופורציה. כן, יש עליה במחירי הדלק. אבל היא לא קיצונית כפי שאפשר להאמין על פי הסקרים והגרפים שמתפרסמים חדשות לבקרים.

image

 

 

המסר הראשי של הפרסום הזה הוא המסר שעומד מאחורי הבלוג הזה כלו: תסתכלו טוב, ותמיד תשאלו שאלות. אני הייתי מאד גאה בעצמי כשעיינתי בגרף הראשון ומיד חיפשתי מידע אם הוא מוצמד לאינפלציה או לא, והחשדות שלי עלו כשראיתי שלא. זה מה שקורה כשחופרים באינפוגרפיקות במשך חודשים. אבל זה ההרגל שכולנו צריכים לפתח – תמיד לנסות להבין מה הגרפים אומרים לנו, ומה הם רק מנסים לגרום לנו לחשוב.

כאן, כמובן, השאלה על ההצמדה לאינפלציה היא לא השאלה היחידה שאפשר לשאול, וגם הגרף השני מביא לנו, כמו תמיד, רק מידע חלקי. “מחירי הדלק לא הגבוהים ביותר שאי פעם היו”, הוא אומר. “הם היו גבוהים לא פחות ב-1920 וב-1980”. זה אולי נכון, אבל אנחנו תמיד נשאל עוד. ב-1920 לחלק קטן יותר באוכלוסיה היה רכב. אולי המחירים היו פחות כואבים, מכיוון שרכב היה נחלתם של אנשים אמידים, חברות ועסקים, או בבעלות משותפת? תמיד צריך לשאול עוד.