פינת האינפוגרפיקה: שימוש מרהיב בטכנולוגיה

קבלו פוסט קצר, שמראה שהמדור יודע גם לפרגן כשצריך. ה-BBC מציגים סרטון אינפוגרפיקה מלבב שמראה את השינויים לאורך 200 השנה האחרונות בהכנסה הגולמית לנפש ובתוחלת החיים הממוצעת בלידה של רוב מדינות העולם. אפשר להעביר ביקורת על תוכן האינפוגרפיקה – בעיקר בנושא שחוזר שוב ושוב לגבי תוחלת חיים ממוצעת, שמתעלמת מהעובדה שתמותת תינוקות וילודה היא גבוהה יחסית, ומושכת את הממוצע למטה, כך שמי שהגיע לגיל 15, יש לו סיכוי גבוה מאד לעבור בהרבה את הממוצע. בעיה דומה, שמוזכרת גם בסרטון עצמו, מדברת גם על ממוצעים בתוך מדינות, שמושכים גם הם מדינות שונות לעבר המרכז. גם אפשר להתייחס לאופטימיות הבלתי סבירה של המנחה, שאתה לא יכול שלא להרגיש שבאה למרק על מצפון אירופאי מדושן הנתקל בפערים חברתיים עצומים. אבל היום באתי להתמקד יותר בפרזנטציה, ופחות בתוכן.

 

מה יש לנו כאן? ציר דו-ממדי של שני גופים בלתי תלויים, ציר שלישי, של גודל האוכלוסיה, שמיוצג בגודל המעגל, במקום בציר שלישי מרחבי, מה שהופך אותו לקריא הרבה יותר מאשר אם היו מנסים למקם את הנקודה על מרחב תלת-ממדי מגושם. וציר רביעי, ציר הזמן, שהוא זה שהופך את הסרטון לנחמד כל-כך. המנחה מציג את ההשפעה של אירועים כמו מגפות ומלחמות, אבל אני חושב שהחלק המדהים ביותר קורה בדקה ה-2:58, ב-1958, כשמדיניות הזינוק הגדול קדימה של מאו מחסלת עשרות מיליונים בסין, ואז הזינוק חזרה מיד לאחר מכן.

מה שמבאס באינפוגרפיקה הזו היא שעדיין לא קל מספיק להפיק דבר כזה בקלות בבית. לא אקסל ולא גוגל דוקס, מבדיקה מהירה, נותנים לנו כלים נוחים לייצר גרפים סטטיים כאלה1, וזה עוד לפני שהכנסנו את אלמנט הזמן לעסק. וחבל.

  1. כן, ניסיתי את ה-Bubble Chart של אקסל. הוא פשוט עובד קקה []

פינת האינפוגרפיקה: אולי, בעצם, לא?

אינפוגרפיקה היא כלי מאד פופולרי, בשנים האחרונות, להקל על הקורא המסכן ולהגן עליו מהטקסט המאיים. העלייה של האינפוגרפיקה, לטוב ולרע, היא הסיבה שיש הצדקה לפינה הזו כאן. אבל לפעמים יש אינפוגרפיקות שפשוט מדהימות אותי. לא כי הם מרשימות במיוחד, וגם לא כי הן מטופשות או מטעות במיוחד. פשוט כי אלה אינפוגרפיקות שאין הצדקה לקיומן. אינפוגרפיקות שלא תורמות שום דבר מעבר למספרים שעומדים בבסיסן. אני לא הראשון שיצא כנגד האינפוגרפיקות המיותרות, כמובן, אבל היום נתקלתי בעוד אחת שעצבנה אותי: הסטטיסטיקות של פייסבוק.

הדבר הראשון שקפץ לי לעיניים, בתחילת התרשים, הוא זה:

FacebookStats1

מה יש לנו כאן? את הנתון היבש מהאתר של פייסבוק, ושני איורים. הראשון מסביר לנו, כנראה, ש-“משתמש” זה הדבר הזה עם הראש והשיער, למקרה שהתבלבלנו. השני הוא פשוט בלון דיבור קטן, משוכפל 130 פעם. כן, נפלאות הקופי-פייסט לעזרתנו! אם קשה לנו עם הקונצפט האבסטרקטי של “130”, אז פשוט נספור ריבועים כחולים קטנים עד שנבין! למידה דרך הרגליים, או במקרה הזה דרך העיניים. Wax on, wax off.  אין כאן שום אלמנט של השוואה ויזואלית, אז כל הגרפיקה הזו מיותרת לחלוטין.

מה הלאה?

FacebookStats2

כאן כבר יש טיפה יותר מידע – ההשוואה המספרית בין פייסבוק ומייספייס זוכה להבדלי גודל פרופורציונאליים. יפה. אבל חוץ מהבחירה השרירותית בחצאי-עיגול, שמקשים על ההבנה של הפרופורציות בין השניים, גם ההחלטה לסמל את מייספייס בצבע שחור על אפור, והחלוקה הפנימית של פייסבוק בין שני גוונים דומים של תכלת, דורשת מאיתנו לקרב את הראש למסך ולכווץ את העיניים בנסיון להבין מה לעזאזל אנחנו רואים.

עוד?

FacebookStats3
החלק החביב עלי. המשתמש הממוצע יוצר 90 פיסות תוכן בחודש, ומקושר ל-80 עמודים. הא! הנה מקום להשוואה! נשים את עיגול ה-80 בתוך ה-90, ונקבל הבהרה גרפית וברורה ש-80 אכן קטן מ-90, אבל רחוק מלהיות שווה לא. בלי ציניות, זו אכן הדגמה גרפית ראויה. אבל אבוי, מה הם משווים כאן? שתי פיסות מידע חסרות כל קשר אחת לשניה, שמצאו את עצמן צמודות זו לזו רק כי הן מופיעות זו אחר זו באתר פייסבוק, או בגלל שהמספרים שלהם קרובים אחד לשני, ברמה האינטואיטיבית. אבל אין לזה שום משמעות! אין כאן שום תובנה שהאינפוגרפיקה מעבירה. משתמשים רושמים יותר סטטוסים מאשר שהם מצטרפים לקבוצות? אז מה? אינפוגרפיקה לשם האינפוגרפיקה, בלי שום מטרה.

רוצים עוד? בטח שרוצים.

FacebookStats4

מפה. מפה זה מגניב. בואו ניקח את המידע הגאוגרפי ונציב אותו על מפה. אפשר לעשות יופי של ייצוגים גרפיים על מפות, כמו מפות חום  או פיזורים גיאוגרפיים. אבל זה לא מה שיש לנו כאן. יש לנו את אותה טבלת מספרים של פייסבוק, אבל עם חצים שמצביעים על המדינות הרלבנטיות. כ”כ קל היה לצבוע את המדינות באדום/צהוב/ירוק/אפור על פי הריכוז, או הכמות, וככה לקבל מידע גיאוגרפי ויזואלי על הפריסה והפופולריות. אבל לא, יש לנו כאן רק כלי עזר לאנשים שלא יודעים איפה נמצאת ספרד, כנראה בגלל שהמעצב של האינפוגרפיקה לא רצה להרוס את המוטיב הכחול-אפור היקר שלו עם צבעים אינפורמטיביים.

ולסיום, נקודה אחת חיובית:

FacebookStats5

כאן הגרף בעצם משרת  את העברת המידע: לקבל אמת מידה ויזואלית פרופורציונאלית של “אוכלוסיית” פייסבוק לעומת מדינות בעולם. השימוש בנאלי, אמנם, ודי מטעה – אין למשתמשי פייסבוק שום שיוך או הזדהות לאומית עם האתר, אחרי הכל, והם חופפים לאוכלוסיות במדינות האחרות – אבל לפחות יש כאן שימוש בכלי האינפוגרפיקה בשביל להעביר מידע. לפחות זה.

פינת האינפוגרפיקה: סקס מבלבל

הרבה אקשן רץ היום בבלוגוספירה ובאתרי חדשות הטכנולוגיה. OKCupid, אתר ההיכרויות לחנונים, התחיל לפני כמה זמן לפרסם פוסטים מעניינים עם נתונים סטטיסטיים מעניינים על המשתמשים שלהם, וכל מי שאוהב לקחת מידע סטטיסטי ולהוציא ממנו מסקנות אופרטיביות לחיים מיד התחיל להתלהב. אבל העדכון האחרון לגמרי שיגע כתבי טכנולוגיה ואת העורכים שלהם, עד כדי פספוס מלא.

בעדכון האחרון, OKCupid עשו מחקר השוואתי בין איכות הצילום והמצלמה של המנוי באתר, לבין הפופולריות והנחשקות של אותו מנוי. בנוסף למידע סטטיסטי מופרך יותר (“מצלמות פנאסוניק = סקסי, מצלמות קודאק = לא סקסי”) או פחות (“תמונות עם פלאש גורמות לדירוג יופי נמוך יותר”), עלתה מהמחקר שלהם מסקנה לגבי משתמשי סמארטפונים. בואו נעשה את זה בצורה של תרגיל מודרך:

SexAndSmartPhones

* Picture is © OKCupid.

 

מה אנחנו רואים כאן? על פניו, ועל פי הכותרת, יש כאן גרף של פעילות מינית של בעלי סמארטפונים. המספרים מאד מובהקים: משתמשי אנדרואיד: 6! משתמשי אייפון: 11! המסקנה? משתמשי אייפון מקיימים פי שתיים יחסי מין! כותרת! סקס מוכר!

הרבה בלוגים טכנולוגיים ואתרי חדשות פרסמו את הסיפור הזה. זה לא משנה ש-OKCupid רצו רק לעודד אנשים להצטלם באופן יותר אטרקטיבי, והתובנה על הסמארטפונים היתה משנית. לעורכים היתה כותרת – “משתמשי אייפון מזיינים יותר”. אבל משום מה אף אחד לא עבר את הכותרת של הגרף והסתכל מה בעצם כתוב שם.

המספרים עצמם כבר אמורים להיות חשודים. פעילות מינית לגברים עם אנדרואיד: 6. אבל שש מה? מה יחידות המידה? את התשובה אפשר לראות בצד שמאל של הגרף – “מס’ ממוצע של פרטנרים מיניים עד גיל 30”. אין כאן שום קורלציה לפעילות מינית – אם לאדם היו 10 פרטנרים מיניים עד שנת 2007, ויובש מיני מוחלט מאז שקנה את האייפון – הוא עדיין יחזק את הטענה המופרכת שמשתמשי האייפון פעילים יותר. אם משתמש אנדרואיד מקיים יחסי מין באופן יום-יומי עם חמש נשים שונות, הוא עדיין יוריד את הממוצע, ואת התפיסה של הפעילות המינית של המכשיר שלו.

אם כבר יש משהו שאפשר ללמוד מהגרף, הוא על הרגלי המונוגמיה של אנשים, אבל גם שם לא הייתי ממהר להוציא כותרות בנוסח “אייפון זנותי, אנדרואיד חסוד”. הנתונים הסטטיסטיים האלה מתעלמים מעשרים אלף גורמים חיצוניים, כמו המדינות בעולם שבהם נמכרים אייפונים ו/או אנדרואידים, וכו’, והמטענים התרבותיים שלהם. אנחנו לא יודעים אם מדובר ב-10 פרטנרים חד פעמיים או 10 מערכות יחסים ארוכות טווח. אנחנו לא יודעים כלום. חוץ משלושה דברים: את הנתונים המספריים היבשים שאנחנו רואים שם בגרף. את העובדה ש-OKCupid עצמם, בין אם בטעות או בשביל לגרור צפיות, נתנו לנתונים כותרת מטעה. ושעורכים וכתבים ברחבי העולם, עם כמה יוצאי דופן ראויים לציון, יוותרו לחלוטין על הבנה של טקסט, שלא לומר על הבנה של אינפוגרפיקה שאמורה למנוע בלבולים, כדי לתקוע כותרת סנסציונית וחסרת משמעות. אבל זה כבר לא ממש מפתיע, נכון?

פינת האינפוגרפיקה: עמודות וסדרי גודל

שלום קוראים יקרים, שוב אני בפינת האינפוגרפיקה המטעה, והפעם שבנו לעסוק בכלכליסט. אני אציין רק שאני מתמקד בכלכליסט לא כי הם חוטאים במיוחד בתחום הזה, אלא כי בתוקף תפקידי ככתב ועורך שם אני פשוט נחשף למקרים רבים יותר של חטאי-אינפוגרפיקה מצידם.

calcalistGraph

הבעיה כאן פשוטה מאד. חוץ מאשר הטעות הגסה בכותרת המשנה (מדובר במיליארדים, לא במיליונים), גרף עמודות מסתמך על הנחה בסיסית שהיחס בגדלים בין העמודות הוא יחס ישר. לאורך העמודות הראשונות, בשנת 2004-2007 למשל, אפשר לראות שהבדלים קטנים במספרים מתבטאים בהבדלים קטנים בגרף. אם ניקח את 2004 כאמת מידה, אז העמודה בגובה 96 פיקסלים מייצגת 1.23 מיליארד שקל, כלומר 11.6 מיליון שקל לפיקסל. העמודה השניה, בגובה 79 פיקסלים על 1.14 מיליארד שקל, מייצגת 14.6 מיליון שקל לפיקסל. לא אחיד, אבל ההבדל לא עצום.

אבל אז אנחנו מגיעים ל-2009 והקפיצה הגדולה. 1.69 מיליארד על 188 פיקסל הם 6.2 מיליון שקל לפיקסל, חצי מהסטנדרט שנקבע בהתחלה. 2011, לעומת זאת, מייצגת 30 מיליון שקל לפיקסל- 900 מיליון ש”ח על 30 פיקסלים בלבד.

המטרה כאן ברורה. בשביל להעביר ביקורת על קיצוץ תקציבי המדען הראשי, העיתון מנסה להדגיש את הצמצום. אבל יש כאן ניצול לרעה של גרף העמודות האובייקטיבי-לכאורה, אבל שבא להציג ירידה של 46% בתקציב באמצעות ירידה גרפית של 84% כמעט פי שתיים משיעור הירידה האמיתי.

פינת האינפוגרפיקה: ספרים דיגיטליים

היססתי בהתחלה עם הפוסט הזה, לא הייתי בטוח שהוא לגמרי מוצדק. לא מתוך לויאליות למערכת כלשהי, אלא כי החטא כאן הרבה פחות מובהק מאשר במקרים אחרים. אבל בכל זאת, אינפוגרפיקה מטעה היא אינפוגרפיקה מטעה.

בכתבה הזו של עומר כביר בכלכליסט (גילוי נאות וכו’: אני עובד עם עומר בדסק הטכנולוגי של כלכליסט, אבל לא הייתי מעורב בשום צורה בכתבה הזו) שולבה אינפוגרפיקה לגבי היקף מכירות ספרים דיגיטליים מתוך סך הספרים שנמכרו בארה”ב:

כל הזכויות שמורות לכלכליסט. התמונה מובאת לצורכי ביקורת
ebook_infographics

הגרף לא משקר ישירות, ואפילו לא חוטא למטרה שלו, שהיא להדגיש את הגידול המרשים בהיקף המכירות של הספרים הדיגיטליים. אבל הוא מציב שני נתונים שונים אחד ליד השני, והעיצוב הגראפי מוביל לבלבול:

הגרף עצמו לא מייצג אחוזים, אלא נתון ישיר – מכירות, במליוני דולרים. הבעיה היא שהנתון מוצג כגרף אופקי, ולא אנכי, והוא תחום בתוך ספר לבן, מה שיוצר את הרושם שסוף הספר הוא הסוף, כלומר המקסימום האפשרי לנתון הזה. התחושה הזו לא הייתה ממש מפריעה אם לא היה את הנתון השני שמוצמד משמאל, שהוא השיעור של הספרים הדיגיטליים מכלל מכירות הספרים. ביחד, הגרף יוצר את הרושם שב-2009 היקף הספרים הדיגיטליים היה כ-90% משוק הספרים בכלל, כי הוא מגיע כמעט עד הדופן הימנית של התרשים. בגרף כזה מאד קל לרפרף על המספרים ולהסתכל על הגרפיקה, וכאן זה נראה שהעמודות של הגרף מייצגות את המספר משמאל.

זה כמובן לא המצב. ב-2009 מכירות הספרים הדיגיטליים היו רק 3.3%. והנתון הרי רשום שם, שחור על גבי צהוב, וכל קריאה קפדנית תראה את זה. אבל כל המטרה של אינפוגרפיקה היא לתמצת נתונים באופן גראפי כך שלא נצטרך קריאה קפדנית, אלא שתעביר את המסר, את הטרנד הכללי, באופן מיידי. וההצבה הזו של שני הנתונים כחלק מאותו תרשים משדרת תחושה שהספרים הדיגיטליים מהווים נתח נכבד משוק הספרים. בכתבה שדנה בשליטתה המממשת ובאה של גוגל בשוק הספרים הדיגיטליים, התחושה הזו תורמת, כמובן, למסר של הכתבה. רק חבל שהיא משתמשת כאן באינפוגרפיקה דמגוגית, במכוון או שלא במכוון, כדי לתמוך במסר. אני חושב שהוא חזק מספיק בפני עצמו.