ביבי פחוס

אין דבר שמוציא מעורכי עיתונים דחף לגרפים יותר מאשר סקרי בחירות וניחושי מנדטים. ושום דבר לא אחר מוציא מעורכי עיתונים דחף כזה להטות תוצאות ולעוות תפיסות. גרף עמודות פשוט מספק כר מרעה עשיר למשחקים כאלה, כמו שכבר ראינו. אבל מעריב (או אתר האינטרנט שלו, nrg) סיפק לנו דוגמה יפה נוספת:

900

הסיפור של הגרף הזה ברור. יאיר לפיד נכנס למערכת הפוליטית וטורף את הקלפים, ופתאום המירוץ נהיה צמוד. קדימה יורדים מהמקום הראשון לשלישי, העבודה מתחזקת, ואפילו הליכוד נכנס כאן למירוץ. אבל האם זה באמת המצב? זה הזמן להכניס את אחד מכלי הבילוש המתוחכמים שבהם אנחנו כאן בשקרים יפים משתמשים לזיהוי תרמיות עדינות וזיופי בחירות. אני מתכוון, כמובן, לתוכנת Paintbrush שמגיעה עם חלונות.

מה העלנו בחכתנו, אם כך? ראינו שבעוד ארבעת העמודות הימניות שומרות על יחס של פחות-או-יותר 10-11 פיקסלים למנדט, העמודה של הליכוד עומד על כ-7 פיקסלים למנדט בלבד. כלומר ההישגים האלקטורליים של הליכוד הומעטו בהמחשה הגרפית, נדחסו ל-207 פיקסלים בלבד. אמנם מספר המנדטים מצוין במפורש, אבל הרבה יותר קל לנו לקלוט מידע השוואתי באופן גרפי מאשר במספרים. בשביל הרי נולדו האינפוגרפיקות מלכתחילה, לא?

כך הגרף היה נראה אם גם הליכוד היה נהנה מ-10.4 פיקסלים מרווחים לכל מנדט, שוב, תודות לכלי העריכה המתקדמים והמקצועיים שלנו (עדיין Paintbrush):

image

נותן תחושה קצת שונה, לא?

כל העניין הזה מצער, כי חוץ מהסיפור של דחיסתו של ביבי, הגרף די אפקטיבי. צבעים ברורים ובולטים, מספרים מסומנים בבירור, ושימוש בקריקטורות מזוהות + שם מפלגה צמוד לכל עמודה כדי שיהיה ברור מי זה מי. ואז מגיעה הדחיסה.

ולפני שיבוא איזה אפולוגיסט ויגיד שהגרף, במתכונתו המדויקת יותר, לא נראה טוב על העמוד עם הרבה שטח לבן מת ולכן היה צריך לדחוס את זה, אני אזכיר שהתפקיד של האינפוגרפיקה היא להעביר מידע, לא למלא שטח מת בעמוד. לדחוס עמודה בשביל קומפוזיציה יפה יותר זה כמו להשמיט את המילה “איראן” מכותרת כמו “איראן: בכיר בתכנית הגרעין חוסל בפיצוץ”. זה היה מונע מהכותרת לגלוש לשורה השניה, שזה דבר רע (כך לימדו אותי), אבל לא ממש לגיטימי, נכון?

המלחמה נגד האינפוגרפיקה

זה תמיד נחמד לדעת שיש אנשים אחרים שחולקים את האובססיות שלך. לפני כשבועיים פירסמה מיגן מקרדל, עורכת בכירה במגזין ה-Atlantic, רשומה ארוכה שכותרתה “לעצור את מגיפת האינפוגרפיקה”, בו היא עושה, ובכן, מה שהבלוג הזה שם לעצמו לעשות: להביא דוגמאות לאינפוגרפיקות מטעות, מוטות ומעוותות ולהסביר איפה נפלה בהם הטעות. אהבתי למשל את הקטע הזה, מתוך אחת האינפוגרפיקות שהיא מביאה:

image

דוגמה קלאסית לנתון מטעה. זה אולי נכון שהסיכוי למות עקב טעות בבית החולים גבוה מהסיכוי למות בהתרסקות מטוס (מדובר כאן על הסיכוי הכולל שתהיה התרסקות, כן? לא הסיכוי לשרוד אם המטוס כבר התרסק). אבל הוא מתעלם לחלוטין מנתון מאד בסיסי, והוא שמי שנמצא בבית חולים, הוא גם ככה חולה ונמצא בסיכון למות. זו בדיוק אופן הצגת הנתונים שאינפוגרפיקות מצטיינות בהן – הבאת נתונים מספריים השוואתיים בלי הקשר, בלי הסבר, בלי הבנה של המשמעות שלהם.

יש למקרדל עוד כמה הפרכות נחמדות שם, אם כי הפוקוס שלה הוא יותר על העלמות מכוונות של נתונים בין הנתונים הגולמיים לבין הייצוג בגרף, ולאו דווקא על ייצוגים גרפיים מטעים, אבל בכל זאת טוב לראות אנשים נוספים בתחביב.

ולסיום, אינפוגרפיקה קטנה של מקרדל:

infogrinfographic.png

מתאם, לא סיבתיות

הקורא איתן הפנה אותנו לאינפוגרפיקה המלבבת הזו ב-Businessweek, שנותנת אילוסטרציה מצוינת להבדל בין קורלציה של שני נתונים לבין קשר סיבתי אמיתי ביניהם, ולכמה קל לבלבל בין השניים עם אינפוגרפיקה:

Two Wrongs Don’t Make A Right

לפעמים צריך למצוא את הגאווה הלאומית שלנו איפה שאפשר. בחודש יולי האחרון שבר הגרף של ישראל היום שיאים של עיוות ומניפולציה עם שנתות שלא תואמות לקווים של הגרף וירידות שמוצגות כעליות. ועכשיו אנחנו מקבלים גרף דומה גם מרשת פוקס ניוז האמריקאית, שגם היא שמה את האמת – שלא לומר, הדיוק הכמותי – כנר לרגליה:

image

אז מה יש לנו כאן? הטיה אחת בסיסית ופופולרית, והיא קיצוץ מערכת הצירים, שמתחילה מ-8 במקום מ-0, על מנת להדגיש הבדלים קטנים. 0.4% מאוכלוסיית ארה”ב זה אולי מעל מיליון איש, אבל במונחים סטטיסטיים זה לא שינוי מאד גדול.

הבעיה הגדולה יותר, כפי שאתר FlowingData מציג, היא במשחקי הלמעלה-למטה, שבהם ירידה בגרף מוצגת כעליה, או במקרה הזה, כהשארות במקום. האתר כבר עשה את הצעד המתבקש ובנה באקסל את הגרף כמו שהוא אמור להיות, כמובן, אבל מה שהפריע לי כאן זה לא סתם המניפולציה של המספרים, אלא כמה היא עשויה בצורה פשטנית וחובבנית. אם הגרף של ישראל היום היה מלא עומס של פרטים ונקודות וקווים, עם המון בלבול וטעויות וטשטוש, אז הגרף של פוקס הוא, לעומתו, פשוט וישיר. חוץ מנקודת המידע האחרונה, הגרף הוא מדויק ואמין, כמו שאפשר לראות מהקווים הצהובים ששרטטתי למעלה. ה-9.0 הוא 9.0 לאורך כל הגרף, וההפרשים בינו לבין ה-8.8 או ה-9.2 הם שווים והגיוניים. רק ה-8.6 הסופי הוזז בצורה גסה כלפי מעלה. אם כבר עושים הומאז’, לכל הפחות אפשר לעשות אותו בצורה פחות חובבנית!

אבל מה שהפריע לי עוד יותר בגרף הזה הוא איך שתי ההטיות שהצגתי לעיל מתנגשות אחת בשניה, באופן שמראה שמי שהכין את הגרף לא ממש ידע מה הוא עושה. הטיה השניה, השקר הבוטה, נועד לצמצם את ירידת היקף האבטלה בחודש נובמבר, נכון? אבל ההטיה הראשונה עושה בדיוק להפך: קיצוץ מערכת הצירים תמיד תדגיש את ההבדלים בין נקודות המידע. נראה שבפוקס קיצצו את מערכת הצירים, כנראה מתוך שיקולי אסתטיקה בשביל לא להשאיר הרבה שטח מת על הגרף, ואז שמו לב שהם מחמיאים לממשל, במקום לבקר אותו. אני מדמיין בשלב הזה את העורך הזועם פורץ למחלקת הגרפיקה ומנופף בדף המודפס (למה דף מודפס בגרף לתוכנית טלוויזיה? לא יודע. הדמיון שלי מוזר ככה), ודורש מהגרפיקאי לתקן את זה, עכשיו! במצב כזה, יותר פשוט להקפיץ את הנקודה האחרונה למעלה, במקום לחשוב מחדש על איך לבנות את הגרף כדי שיעביר את המסר שרוצים להעביר.

אילוסטרציה, לא אינפוגרפיקה

הפופולריות של האינפוגרפיקה בתקשורת היא, כידוע, הצדקת הקיום של הבלוג הזה. ההתעקשות לתקוע גרפים עקומים ומבלבלים בכתבות היא לחם חוקינו. אבל הפופולריות הזו מגיעה לשיאים שגם לי נראים מגוחכים, ועם הכתבה הזו, הבנתי מה מפריע לי במקרים רבים. הכתבה, בפני עצמה, מעניינת וחשובה. אבל בניגוד למה שהכותרת והמאמר טוענים, לא מדובר באינפוגרפיקה כלל.

image

הכתבה מכילה סדרה של טיפים והנחיות לייעול החיפוש בגוגל ושיפור התוצאות, בין אם במנוע החיפוש הכללי או במנוע החיפוש האקדמי, Google Scholar. הטיפים ברובם טובים, חוץ מהחלק מהאחרון, שלא רק שמכיל טיפים שלא קשורים לגוגל (איך לחפש בתוך העמוד, איך לשמור תמונה מסך, שניהם מותאמים למשתמשי מק שגולשים בספארי בלבד). אבל אין כאן נתונים שמוצגים בצורה גרפית. יש פשוט רשימה של טיפים שמלווים באילוסטרציות, שמבהירות ומבארות את ההסבר.

עכשיו, אפשר להתווכח, אולי, על ההגדרה של אינפוגרפיקה. אפשר להגיד שכל שימוש בגרפיקה להעברת מידע היא אינפוגרפיקה. אני חושב שהגדרה כזו היא רחבה מדי, ומרוב כוללניות מעקרת את המונח ממשמעות. נאמר, אם כך, אינפוגרפיקה היא דרך להעביר נתונים – נתונים טבלאיים, נתונים מספריים, נתונים סטטיסטים או נתונים אחרים – בעוד שימושים גרפיים אחרים שמלווים או מחליפים טקסט הם אילוסטרציות.

ביום של הפצצה

אנשים רבים וטובים קישרו היום לסקר שהתפרסם במוסף סוף השבוע של ישראל היום, בו נשאלו אזרחים (יהודים דוברי עברית, כן?) על איום הגרעין האיראני, סקר שתוצאותיו התפרסמו בגרף המגוחך הזה:image

יוסי לוי כבר התייחס לבעיה הראשית, הבולטת, הקיצונית והבלתי סבירה של הגרף הזה – העובדה שיש פער עצום בין המספרים לבין הייצוג הגרפי שלהם. ההטיה כאן כל כך בוטה, שיוסי כבר מחכה להתנצלות של מחלקת הגרפיקה שתתפרסם ביום ראשון, ואנשים אחרים צופים שדווקא הגרף כאן נכון, והנתונים המובאים הם המוטעים – פשוט בגלל שטעות כזו גסה, אפילו עם הרקורד האינפוגרפי של ישראל היום, הוא לא סביר בעליל. אי לכך, אין לי שום כוונה להתייחס לחלק הזה של הסקר, ואתמקד בשני אלמנטים אחרים שצרמו לי בעמוד הזה.

הראשון הוא ניסוח השאלה. דובי כבר כתב כאן על כמה קל להטות סקרים, והשאלה שמופיעה בכותרת – אם היא אכן השאלה שהוצגה לנסקרים, היא דוגמא טובה לכך. נתחיל מההנחה המובלעת בשאלה – איראן עובדת על פיתוח נשק גרעיני. היא פשוט קיימת שם כאמת בלתי מעורערת. והנסקרים לא נשאלים על ההשלכות, לדעתם, של “נקיטת צעדים” (איזה צעדים?), אלא מוכוונים לשאלת כן/לא מצומצמת: ימנע נשק גרעיני או לא?

ואם לא ברור מה האג’נדה של הסקר הזה, בא העורך והנחה לגרפיקאי לשלב תמונה שתבהיר את הנושא. תמונה אפוקליפטית של פטריה אטומית, שמשחקת על הפחדים הקמאיים של כולנו. בהנתן התמונה הזו, אפשר היה לנסח את השאלה גם כך: “האם נקיטת צעדים על ידי מדינות המערב תציל את ישראל מחורבן וודאי, או שתכשל במאמציה?”.

מכאן יוצא המסקנה הסופית של העמוד הזה, המסקנה שעוברת באופן אוטומטי אבל תמיד כיף לפרק כדי לראות איך היא נבנית. איראן גרעינית = חורבן. התערבות מערבית = מניעת חורבן. לכן, יש לעודד תקיפה של איראן. מש”ל.

מספרים עשרוניים, דיוק מדומה ואמונה בממסד המדעי

דרך דובי, שוב, הגעתי לפוסטר הזה:

animalresearch

אני רוצה להבהיר, כאן ועכשיו, שאין לי שום כוונה להכנס כאן לדיון סביב ניסויים בבעלי חיים. להרבה אנשים יש הרבה דעות והרבה טיעונים טובים לכאן או לכאן, אבל זה לא המקום. כאן אנחנו מדברים על גרפים ודרכים שונות להציג נתונים – כולל הפוסטר הזה, בלי קשר להשלכות המוסריות של הנושא שלו. מי שרוצה לדון בנושא הזה, מוזמן לפתיל (הארוך, ארוך) הזה באייל הקורא. תגובות בנושא כאן – ימחקו.

אבל מה כן הפריע לי בפוסטר הזה? יכול להיות שניסויים בבעלי חיים אכן האריכו את החיים לתושבי העולם המערבי המודרני. יכול להיות שאפילו האריכו משמעותית. אבל אין שום דבר לדעת – לא לי, לא ל-Foundation for Biomedical Research ולא למשרד הבריאות האמריקאי שמובא כאן כסמכות – לדעת בדיוק בכמה. יש פשוט יותר מדי משתנים. אם אכן נרשמה עליה בתוחלת החיים, האם אנחנו יכולים להיות בטוחים שזה בגלל הניסויים בבעלי חיים? האם אנחנו יודעים מה תוחלת החיים היתה בלי הניסויים הללו? האם אנחנו לא מבלבלים כאן בין קורלציה לבין סיבתיות, כלומר מהעובדה שהיו ניסויים בבעלי חיים ותוחלת החיים אכן עלתה, אנחנו מסיקים שהאחד נגזר מהשני.cigarette-doc-one-small

הפוסטר הזה לא עונה על כל השאלות הללו שהעלתי. הוא אפילו לא מנסה. הוא עושה כאן שימוש, במקום, בטכניקה רטורית בעייתית: הוא נותן מספר מדויק, אפילו עם ספרה אחרי הנקודה העשרונית. הטקטיקה הזו משלבת שתי מניפולציות רטוריות נפוצות: בעיקר פניה לסמכות, עקב ההרגל בחברה המערבית לקבל באופן כמעט אוטומטי טענות של הממסד המדעי, בשילוב עם וריאציה של הוכחה באמצעות עודף מילוליות, שבה הבאת נתון מדויק, בעיקר בהקשר מדעי, בא לטשטש את האמיתות – או הרלבנטיות – של הטענה.

יש כאן מצב אירוני, שבו כמה שהטענה פחות ניתנת להוכחה, היא נתפסת כיותר משכנעת. טענה בסגנון “ניסויים האריכו את תוחלת החיים בעשרות שנים” היתה נתפסת כמשכנעת פחות, כי היא נראית כאילו היא מתבססת על הערכות גסות, למרות שיותר אנשים היו מסכימים שהיא נכונה. אבל 23.5 שנה – טוב, זה כבר ספציפי מדי בשביל שמישהו פשוט ימציא את המספר הזה, לא?

אז כל פעם שאנחנו נתקלים בטיעון שמתבסס על מספר מדויק, כולל אחוזים, שברים ומספרים עשרוניים, אנחנו צריכים להתגבר על האינסטינקט הזה, לתת בו אמון. מספרים, כידוע, משקרים. בניסויים בבעלי חיים, בעישון, ואפילו ביוגורט.

yogurt_percentages

מטא-אינפוגרפיקה ואופנות חולפות

דובי מצא היום את האינפוגרפיקה הזו, שמציגה כמה מסגנונות האינפוגרפיקה הפופולריים יותר באינטרנט בתקופה האחרונה:

(התמונה פורסמה ע”י smoy@Flickr, ברשיון CC-BY-NC-ND)

מעבר לעובדה שזו אסופה מוצלחת של קלישאות אינפוגרפיקה, הרשימה הזו מזכירה גם משהו נוסף: גם באינפוגרפיקות, כמו בכל דבר אחר, יש אופנות וטרנדים. מספיק שמישהו יצר סגנון גרף חדש שהיה מוצלח ופופולרי, הוא הופץ בצורה ויראלית וזכה לשבחים, ואז כל מעצב גרפי בשקל ועורך של עיתון-רשת החליט שגם הוא חייב כזה, ואנשים התחילו לאנוס מידע לתוך התבניות הויזואליות הפופולריות, בניגוד לאלו שמתאימות אליו.

זה נכון לא רק לצורות המידע, אלא גם למאפיינים אחרים, כמו פאלטת הצבעים שבשימוש (כחול ואפור! כחול כהה בקונטרסט עם כחול בהיר על רקע אפור! אפור על אפור!), הפונט של האינפוגרפיקה (Univers, או פונט סאנס-סריף דחוס וגבוה אחר), או אפילו הנושא של האינפוגרפיקה (רשתות חברתיות!).

כמו כל דבר, אנחנו צריכים עם כל אינפוגרפיקה לשאול את עצמנו “למה המעצבים בחרו בגרף הזה, או בעיצוב הזה, בשביל להעביר את הנקודה שלהם”. ולא לפחד לענות לשאלה הזו בתשובה “סתם, ככה”.

הפחד הוא קוטל הבינה

הקורא גלעד דיאמנט הפנה אותי לכתבה הזו בטמקא על מנגנון הפחד בבני אדם, כתבה המכילה את עיבוד התמונה הבא:

הפעלת נתיבי הפחד במוח (איור: ynet, shutterstock)

כמו גלעד, גם אני לא מומחה באנטומיה, אבל עדיין די ברור לי שלא היתה כאן כוונה לטעון שהאבונים הללו במוח ממוקמים איפה שהם נמצאים על התמונה. מדובר פשוט בעורך שכתב “מוח” ב-Shutterstock, מאגר תמונות אילוסטרציה מסחרי, ואז שלח את התמונה לגרפיקאי שיוסיף לו את מסלול הפחד במוח מתוך טקסט הכתבה, בלי לחשוב על כך שהוא מרמז כאן, כביכול, על מיקומים אנטומיים בלתי סבירים.

עוד משהו שהתפספס לו, לדעתי, זו העובדה שהשרטוט מעביר את התחושה שהפחד נכנס דרך התלמוס, אבל יוצא דרך ההיפותלמוס. עוד תוצר לוואי מצער של הצמדת החיצים סביב העוגן החזותי של המוח האנושי. וזה גרם לי להזכר בחולית, ובפראפראזה הבאה על הלחש נגד הפחד של בנות גשרית, ועם התנצלות מראש לפרנק הרברט:

אל לי לפחוד. הפחד הוא קוטל הבינה. הפחד הוא המוות הקטן המביא כיליון מוחלט. אעמוד בפני פחדי. אניח לו לחלוף דרך התלמוס. וכאשר יחלוף על-פני ההיפוקמפוס, אפנה את עיני רוחי ואראה את נתיב ואת האמיגדלה. במקום שעבר הפחד לא יהיה דבר. רק ההיפותלמוס יוותר.

איך שגלגל מסתובב לו: מזג האוויר וסחרחורות

image

תלחצו על התמונה כאן למעלה כדי לראות אותה בגודל מלא. לחצתם? יופי. עכשיו תנסו להבין מה בדיוק קורה שם. מה המשמעות של עיגולי הטמפרטורה הקבועים בגודלם, של נקודות המשקעים. חפשו את החיצים שאמורים לסמל רוח. מצאתם? לא נורא, זה יגיע בסיבוב. סיבוב? אה, כן. דמיינו גם שבעוד שורת הערים נשארת במקום, שאר הגלגל, פסי הרקע האפורים, מסתובב לו עם כיוון השעון ללא הפסקה, כשכל פלח מייצג חודש בשנה והחיצים של הרוח, אם יש כאלה, הם באפור בהיר על רקע האפור הבהיר של הגלגל.

מבולבלים? בצדק. את האינפוגרפיקה הזו, גלגל מזג האוויר של Endlundart, גיליתי דרך קישורים של אנשים, שכינו אותו “משגע”, “יפהפה” ו-“מרהיב”, בעוד הם מוסיפים ש-“אנחנו יושבים כבר כמה דקות ומנסים להבין איך לקרוא אותו”, כאלו זה רק מאפיין אסתטי נוסף של הקונסטרוקציה.

גם הטקסט שמלווה את האינפוגרפיקה לא ממש עוזר, ולפעמים רק מבלבל יותר. “הערים מסודרות משמאל לימין ע”פ הטמפרטורה הממוצעת השנתית הגבוהה ביותר”. כשטמפרטורות יחסיות באותה עיר בין חודש לחודש מיוצגות ע”י העיגול הכתום, אבל לא ע”י גודלו חס וחלילה, אלא על ידי השקיפות שלו. כן, העיגולים הקטנטנים הללו נהיים שקופים יותר בחודשים קרים, ופחות בחודשים חמים. וכל זה יחסית לממוצע של אותה עיר, כמובן. עיגול שקוף בניו דלהי הוא עדיין חם יותר, יש להניח, מעיגול כתום עז בדבלין.

ואז עוד יש לנו את הנקודה הכחולה של כמות המשקעים, שברוב המוחלט של הערים היא כל כך קטנה שאי אפשר בכלל להבדיל בין “מעט משקעים” (= נקודה קטנטה) לבין “ממש מעט משקעים” (= נקודה זעירה). “אף עיר ברשימה לא גשומה כמו לאגוס", כתוב בטקסט המלווה, ואני תוהה איך הם הגיעו למסקנה הזו. בתמונת המסך שהבאתי, בין מרץ לאפריל, לאגוס יבשה וסינגפור היא הרטובה ביותר.

יכול להיות שאפשר לקבל את המידע הזה ע”י צפיה בכל נתוני המשקעים בכל החודשים כדי לקבל תמונה כוללת, אם כי השימוש באנימציה מונע מאיתנו לקבל, במבט, תמונת-על על כל הנתונים. יכול להיות שאפשר להגיע למסקנות השוואתיות על מידת הרוח בשיקגו, “the windy city”, לעומת ערים אחרות. יכול להיות. אבל האינפוגרפיקה הזו עושה כל מה שבידיה כדי להפריע לנו להבין את המידע הזה.

יש לציין שיוצר הגלגל מגדיר אותו כ-“פרוייקט אמנותי” ולא אינפוגרפיקה, והוא יותר נסיון רעיוני של משחק במידע, בדומה ל-DOW Piano, פרוייקט קודם שלו בו נתוני המסחר בבורסה מתורגמים למוזיקה (ואף מילה על דאגלס אדאמס שחשב על זה ראשון) הבעיה עם זה היא שהוא מציב רף אסתטי לאינפוגרפיקות שאח”כ עורכים (וקוראים) דורשים גם מאינפוגרפיקות משמעותיות, בלי התחשבות ביעילות.