Two Wrongs Don’t Make A Right

לפעמים צריך למצוא את הגאווה הלאומית שלנו איפה שאפשר. בחודש יולי האחרון שבר הגרף של ישראל היום שיאים של עיוות ומניפולציה עם שנתות שלא תואמות לקווים של הגרף וירידות שמוצגות כעליות. ועכשיו אנחנו מקבלים גרף דומה גם מרשת פוקס ניוז האמריקאית, שגם היא שמה את האמת – שלא לומר, הדיוק הכמותי – כנר לרגליה:

image

אז מה יש לנו כאן? הטיה אחת בסיסית ופופולרית, והיא קיצוץ מערכת הצירים, שמתחילה מ-8 במקום מ-0, על מנת להדגיש הבדלים קטנים. 0.4% מאוכלוסיית ארה”ב זה אולי מעל מיליון איש, אבל במונחים סטטיסטיים זה לא שינוי מאד גדול.

הבעיה הגדולה יותר, כפי שאתר FlowingData מציג, היא במשחקי הלמעלה-למטה, שבהם ירידה בגרף מוצגת כעליה, או במקרה הזה, כהשארות במקום. האתר כבר עשה את הצעד המתבקש ובנה באקסל את הגרף כמו שהוא אמור להיות, כמובן, אבל מה שהפריע לי כאן זה לא סתם המניפולציה של המספרים, אלא כמה היא עשויה בצורה פשטנית וחובבנית. אם הגרף של ישראל היום היה מלא עומס של פרטים ונקודות וקווים, עם המון בלבול וטעויות וטשטוש, אז הגרף של פוקס הוא, לעומתו, פשוט וישיר. חוץ מנקודת המידע האחרונה, הגרף הוא מדויק ואמין, כמו שאפשר לראות מהקווים הצהובים ששרטטתי למעלה. ה-9.0 הוא 9.0 לאורך כל הגרף, וההפרשים בינו לבין ה-8.8 או ה-9.2 הם שווים והגיוניים. רק ה-8.6 הסופי הוזז בצורה גסה כלפי מעלה. אם כבר עושים הומאז’, לכל הפחות אפשר לעשות אותו בצורה פחות חובבנית!

אבל מה שהפריע לי עוד יותר בגרף הזה הוא איך שתי ההטיות שהצגתי לעיל מתנגשות אחת בשניה, באופן שמראה שמי שהכין את הגרף לא ממש ידע מה הוא עושה. הטיה השניה, השקר הבוטה, נועד לצמצם את ירידת היקף האבטלה בחודש נובמבר, נכון? אבל ההטיה הראשונה עושה בדיוק להפך: קיצוץ מערכת הצירים תמיד תדגיש את ההבדלים בין נקודות המידע. נראה שבפוקס קיצצו את מערכת הצירים, כנראה מתוך שיקולי אסתטיקה בשביל לא להשאיר הרבה שטח מת על הגרף, ואז שמו לב שהם מחמיאים לממשל, במקום לבקר אותו. אני מדמיין בשלב הזה את העורך הזועם פורץ למחלקת הגרפיקה ומנופף בדף המודפס (למה דף מודפס בגרף לתוכנית טלוויזיה? לא יודע. הדמיון שלי מוזר ככה), ודורש מהגרפיקאי לתקן את זה, עכשיו! במצב כזה, יותר פשוט להקפיץ את הנקודה האחרונה למעלה, במקום לחשוב מחדש על איך לבנות את הגרף כדי שיעביר את המסר שרוצים להעביר.

ביום של הפצצה

אנשים רבים וטובים קישרו היום לסקר שהתפרסם במוסף סוף השבוע של ישראל היום, בו נשאלו אזרחים (יהודים דוברי עברית, כן?) על איום הגרעין האיראני, סקר שתוצאותיו התפרסמו בגרף המגוחך הזה:image

יוסי לוי כבר התייחס לבעיה הראשית, הבולטת, הקיצונית והבלתי סבירה של הגרף הזה – העובדה שיש פער עצום בין המספרים לבין הייצוג הגרפי שלהם. ההטיה כאן כל כך בוטה, שיוסי כבר מחכה להתנצלות של מחלקת הגרפיקה שתתפרסם ביום ראשון, ואנשים אחרים צופים שדווקא הגרף כאן נכון, והנתונים המובאים הם המוטעים – פשוט בגלל שטעות כזו גסה, אפילו עם הרקורד האינפוגרפי של ישראל היום, הוא לא סביר בעליל. אי לכך, אין לי שום כוונה להתייחס לחלק הזה של הסקר, ואתמקד בשני אלמנטים אחרים שצרמו לי בעמוד הזה.

הראשון הוא ניסוח השאלה. דובי כבר כתב כאן על כמה קל להטות סקרים, והשאלה שמופיעה בכותרת – אם היא אכן השאלה שהוצגה לנסקרים, היא דוגמא טובה לכך. נתחיל מההנחה המובלעת בשאלה – איראן עובדת על פיתוח נשק גרעיני. היא פשוט קיימת שם כאמת בלתי מעורערת. והנסקרים לא נשאלים על ההשלכות, לדעתם, של “נקיטת צעדים” (איזה צעדים?), אלא מוכוונים לשאלת כן/לא מצומצמת: ימנע נשק גרעיני או לא?

ואם לא ברור מה האג’נדה של הסקר הזה, בא העורך והנחה לגרפיקאי לשלב תמונה שתבהיר את הנושא. תמונה אפוקליפטית של פטריה אטומית, שמשחקת על הפחדים הקמאיים של כולנו. בהנתן התמונה הזו, אפשר היה לנסח את השאלה גם כך: “האם נקיטת צעדים על ידי מדינות המערב תציל את ישראל מחורבן וודאי, או שתכשל במאמציה?”.

מכאן יוצא המסקנה הסופית של העמוד הזה, המסקנה שעוברת באופן אוטומטי אבל תמיד כיף לפרק כדי לראות איך היא נבנית. איראן גרעינית = חורבן. התערבות מערבית = מניעת חורבן. לכן, יש לעודד תקיפה של איראן. מש”ל.

כשהחזקת סרגל היא מעשה מהפכני

עדכון 26/07: התווסף גרף מתוקן, על פי הנתונים, בסוף הפוסט.

לא תכננתי לכתוב שוב פוסט על אינפוגרפיקה כל כך מהר אחרי ההרצאה שהעברתי ב-11:11, אבל ישראל היום סיפק היום דוגמה כל-כך קיצונית, שלא יכולתי להתאפק. ותודה לדפנה על ההפניה, וגם לעין השביעית על הניתוח הראשוני.

israel_hayom_fake_240711

 

כשראיתי את הגרף הזה, התחלתי להכנס לדכאון. לא בגלל שיש כאן גרף עם הטיה ברורה, עם אג’נדה, ועם נכונות להטעות, לשקר ולהסתיר מידע. לא, לזה אנחנו כבר רגילים, ואמורים לצפות לזה. מה שדיכא אותי זו הגסות שבה זה נעשה. חוסר התחכום. העליבות!

בהרצאה ב-11:11, ובבלוג הזה בעבר, ניסיתי להצביע על כמה הטיות ערמומיות שמסתתרות באינפוגרפיקה. משינוי בסיס מערכת הצירים ועד גרפים תלת-ממדיים שמבלבלים את העין. אבל בישראל היום החליטו ללכת על שקרים כל כך בוטים, שכל ילד עם סרגל יכול להראות את העיוות שלהם. בתמונה למטה הוספתי כמה קווים מנחים לניתוח הבולשיט. תלחצו על התמונה להגדלה, ואני אעבור על כמה מהם בפירוט:

israel_hayom_fake - annotated

 

1. במחצית השניה של 2010 הגיע ישראל היום לתפוצה של 37.4%. נתון ראוי ומעניין, אבל אם נמתח קו ישר מהנקודה הזו, נגלה שה-37.4% הזה עובר באמצע קו ה-40%. וזאת בהנחה, כמובן, שה-40% עובר באמצע המשבצת. או אולי בתחתיתה? או בראשה? לא ברור. ברור זה רע, כידוע.

2. אם לא די ש-37.4 שווה ל-40, מסתבר גם שהוא נמצא מעל התפוצה של ידיעות אחרונות ב-2007, בנקודת בה היא עמדה על ה-37.7%. 4, מסתבר, הוא גדול יותר מ-7, ע”פ ישראל היום. איפשהו באמצע התנגשות הקוים של שני העיתונים, אנחנו גם מגלים ש-35.2 גדול יותר מ-36.5, ואם נשאר רק בידיעות אחרונות, נראה ש-34.2 שווה ל-34.9.

3. בין תחילת 2009 לסופה ירדה התפוצה של ישראל היום ב-0.3%. כידוע, אין דרך לייצג ירידה של 0.3% על גרף שלא כוללת עליה. העליה היא בת 6 פיקסלים, ועל פי החישובים שלי (36 פיקסלים לבוקסה בת 5%) מייצגת עליה בת 0.83% בתפוצה.

4. זוכרים את סעיף #1, בו גילינו ש-37.7 שווה ל-40? ובכן, כאן אפשר לראות ש-6.4 קטן מ-5.  אלא אם כן המספרים של כל תיבה לא מתייחסים לאמצע שלה אלא לקו העליון שלה, ואז אנחנו מבינים ש-7.5 שווה ל-10. ושה-37.7 מקודם לא שווה ל-40, אלא הוא גדול ממנו משמעותית?

5. נחזור למעלה, ונגלה את הנתון הסופי, הראשי, המעניין, המובלט. הזה שמקבל בוקסה משלו, אבל משום מה בלי נקודה מפורשת על הגרף. וזה טוב שהוא לא, כי אחרית היינו מאבדים את שארית האמון שלנו באריתמטיקה בסיסית, ומגלים ש-39.3 שווה לכ-44, במתמטיקת אזור-הדמדומים הזו. ואם נוסיף את חישובי הפיקסלים, נגלה שהוא גבוה ב-36 פיקסלים מה-37.7 של ידיעות. כלומר 39.3 – 37.7 = 5.

אבל למה?

שחר מתודעה כוזבת לקח את הנתונים של TGI, כפי שפורסמו בגרף, ועשה את המעשה המתבקש להזין אותם לאקסל, על מנת לייצר גרף אמין יותר:

israel_hayom - real

 

והבעיה שיש לשחר עם הגרף הזה, ואני מסכים איתו לחלוטין, היא למה לעזאזל החליט מישהו שם בישראל היום שצריך לייפות את הגרף הזה באמצעות שקרים והטיות?

הגרף הזה מספר סיפור די חזק בזכות עצמו. הוא מראה עליה מרשימה של יותר מפי שלוש תוך שנים בודדות. הוא מראה את נקודת המהפך כשהעיתון עקף את ידיעות, המכהן בכיפה כבר שנים. הארץ ומעריב גם ככה נראים חבוטים ומובסים בתחתית הגרף. אז למה? למה לקחת הצלחה לגיטימית (גם אם לא נתייחס למהות הנתונים, כפי שעלה בתגובות), ולהפוך אותה להתרברבות פתטית?

ושאלה משפטית לסיום

ועלתה השאלה: מה מעמד האינפוגרפיקה בעת שימוע משפטי? האם יכולה רשות כלשהי לבוא לקנוס את ישראל היום על הצגת נתונים שקריים בפרסום? הרי המספרים ה-“אמיתיים” נמצאים שם, אבל הם מציגים נתונים סותרים מאשר הקווים (ולשם שינוי, מדובר על סותרים בעליל, לא מטעים או מוטים). האם זו עילה לתביעה על חוסר אמת בפרסום, או שתספיק התפתלות נוסח “אנחנו הצגנו את המספרים, זה לא אשמתנו אם מישהו הוטעה ע”י הגרפיקה”?