פינת האינפוגרפיקה: סקס מבלבל

הרבה אקשן רץ היום בבלוגוספירה ובאתרי חדשות הטכנולוגיה. OKCupid, אתר ההיכרויות לחנונים, התחיל לפני כמה זמן לפרסם פוסטים מעניינים עם נתונים סטטיסטיים מעניינים על המשתמשים שלהם, וכל מי שאוהב לקחת מידע סטטיסטי ולהוציא ממנו מסקנות אופרטיביות לחיים מיד התחיל להתלהב. אבל העדכון האחרון לגמרי שיגע כתבי טכנולוגיה ואת העורכים שלהם, עד כדי פספוס מלא.

בעדכון האחרון, OKCupid עשו מחקר השוואתי בין איכות הצילום והמצלמה של המנוי באתר, לבין הפופולריות והנחשקות של אותו מנוי. בנוסף למידע סטטיסטי מופרך יותר (“מצלמות פנאסוניק = סקסי, מצלמות קודאק = לא סקסי”) או פחות (“תמונות עם פלאש גורמות לדירוג יופי נמוך יותר”), עלתה מהמחקר שלהם מסקנה לגבי משתמשי סמארטפונים. בואו נעשה את זה בצורה של תרגיל מודרך:

SexAndSmartPhones

* Picture is © OKCupid.

 

מה אנחנו רואים כאן? על פניו, ועל פי הכותרת, יש כאן גרף של פעילות מינית של בעלי סמארטפונים. המספרים מאד מובהקים: משתמשי אנדרואיד: 6! משתמשי אייפון: 11! המסקנה? משתמשי אייפון מקיימים פי שתיים יחסי מין! כותרת! סקס מוכר!

הרבה בלוגים טכנולוגיים ואתרי חדשות פרסמו את הסיפור הזה. זה לא משנה ש-OKCupid רצו רק לעודד אנשים להצטלם באופן יותר אטרקטיבי, והתובנה על הסמארטפונים היתה משנית. לעורכים היתה כותרת – “משתמשי אייפון מזיינים יותר”. אבל משום מה אף אחד לא עבר את הכותרת של הגרף והסתכל מה בעצם כתוב שם.

המספרים עצמם כבר אמורים להיות חשודים. פעילות מינית לגברים עם אנדרואיד: 6. אבל שש מה? מה יחידות המידה? את התשובה אפשר לראות בצד שמאל של הגרף – “מס’ ממוצע של פרטנרים מיניים עד גיל 30”. אין כאן שום קורלציה לפעילות מינית – אם לאדם היו 10 פרטנרים מיניים עד שנת 2007, ויובש מיני מוחלט מאז שקנה את האייפון – הוא עדיין יחזק את הטענה המופרכת שמשתמשי האייפון פעילים יותר. אם משתמש אנדרואיד מקיים יחסי מין באופן יום-יומי עם חמש נשים שונות, הוא עדיין יוריד את הממוצע, ואת התפיסה של הפעילות המינית של המכשיר שלו.

אם כבר יש משהו שאפשר ללמוד מהגרף, הוא על הרגלי המונוגמיה של אנשים, אבל גם שם לא הייתי ממהר להוציא כותרות בנוסח “אייפון זנותי, אנדרואיד חסוד”. הנתונים הסטטיסטיים האלה מתעלמים מעשרים אלף גורמים חיצוניים, כמו המדינות בעולם שבהם נמכרים אייפונים ו/או אנדרואידים, וכו’, והמטענים התרבותיים שלהם. אנחנו לא יודעים אם מדובר ב-10 פרטנרים חד פעמיים או 10 מערכות יחסים ארוכות טווח. אנחנו לא יודעים כלום. חוץ משלושה דברים: את הנתונים המספריים היבשים שאנחנו רואים שם בגרף. את העובדה ש-OKCupid עצמם, בין אם בטעות או בשביל לגרור צפיות, נתנו לנתונים כותרת מטעה. ושעורכים וכתבים ברחבי העולם, עם כמה יוצאי דופן ראויים לציון, יוותרו לחלוטין על הבנה של טקסט, שלא לומר על הבנה של אינפוגרפיקה שאמורה למנוע בלבולים, כדי לתקוע כותרת סנסציונית וחסרת משמעות. אבל זה כבר לא ממש מפתיע, נכון?

פינת האינפוגרפיקה: עמודות וסדרי גודל

שלום קוראים יקרים, שוב אני בפינת האינפוגרפיקה המטעה, והפעם שבנו לעסוק בכלכליסט. אני אציין רק שאני מתמקד בכלכליסט לא כי הם חוטאים במיוחד בתחום הזה, אלא כי בתוקף תפקידי ככתב ועורך שם אני פשוט נחשף למקרים רבים יותר של חטאי-אינפוגרפיקה מצידם.

calcalistGraph

הבעיה כאן פשוטה מאד. חוץ מאשר הטעות הגסה בכותרת המשנה (מדובר במיליארדים, לא במיליונים), גרף עמודות מסתמך על הנחה בסיסית שהיחס בגדלים בין העמודות הוא יחס ישר. לאורך העמודות הראשונות, בשנת 2004-2007 למשל, אפשר לראות שהבדלים קטנים במספרים מתבטאים בהבדלים קטנים בגרף. אם ניקח את 2004 כאמת מידה, אז העמודה בגובה 96 פיקסלים מייצגת 1.23 מיליארד שקל, כלומר 11.6 מיליון שקל לפיקסל. העמודה השניה, בגובה 79 פיקסלים על 1.14 מיליארד שקל, מייצגת 14.6 מיליון שקל לפיקסל. לא אחיד, אבל ההבדל לא עצום.

אבל אז אנחנו מגיעים ל-2009 והקפיצה הגדולה. 1.69 מיליארד על 188 פיקסל הם 6.2 מיליון שקל לפיקסל, חצי מהסטנדרט שנקבע בהתחלה. 2011, לעומת זאת, מייצגת 30 מיליון שקל לפיקסל- 900 מיליון ש”ח על 30 פיקסלים בלבד.

המטרה כאן ברורה. בשביל להעביר ביקורת על קיצוץ תקציבי המדען הראשי, העיתון מנסה להדגיש את הצמצום. אבל יש כאן ניצול לרעה של גרף העמודות האובייקטיבי-לכאורה, אבל שבא להציג ירידה של 46% בתקציב באמצעות ירידה גרפית של 84% כמעט פי שתיים משיעור הירידה האמיתי.

פינת האינפוגרפיקה: ספרים דיגיטליים

היססתי בהתחלה עם הפוסט הזה, לא הייתי בטוח שהוא לגמרי מוצדק. לא מתוך לויאליות למערכת כלשהי, אלא כי החטא כאן הרבה פחות מובהק מאשר במקרים אחרים. אבל בכל זאת, אינפוגרפיקה מטעה היא אינפוגרפיקה מטעה.

בכתבה הזו של עומר כביר בכלכליסט (גילוי נאות וכו’: אני עובד עם עומר בדסק הטכנולוגי של כלכליסט, אבל לא הייתי מעורב בשום צורה בכתבה הזו) שולבה אינפוגרפיקה לגבי היקף מכירות ספרים דיגיטליים מתוך סך הספרים שנמכרו בארה”ב:

כל הזכויות שמורות לכלכליסט. התמונה מובאת לצורכי ביקורת
ebook_infographics

הגרף לא משקר ישירות, ואפילו לא חוטא למטרה שלו, שהיא להדגיש את הגידול המרשים בהיקף המכירות של הספרים הדיגיטליים. אבל הוא מציב שני נתונים שונים אחד ליד השני, והעיצוב הגראפי מוביל לבלבול:

הגרף עצמו לא מייצג אחוזים, אלא נתון ישיר – מכירות, במליוני דולרים. הבעיה היא שהנתון מוצג כגרף אופקי, ולא אנכי, והוא תחום בתוך ספר לבן, מה שיוצר את הרושם שסוף הספר הוא הסוף, כלומר המקסימום האפשרי לנתון הזה. התחושה הזו לא הייתה ממש מפריעה אם לא היה את הנתון השני שמוצמד משמאל, שהוא השיעור של הספרים הדיגיטליים מכלל מכירות הספרים. ביחד, הגרף יוצר את הרושם שב-2009 היקף הספרים הדיגיטליים היה כ-90% משוק הספרים בכלל, כי הוא מגיע כמעט עד הדופן הימנית של התרשים. בגרף כזה מאד קל לרפרף על המספרים ולהסתכל על הגרפיקה, וכאן זה נראה שהעמודות של הגרף מייצגות את המספר משמאל.

זה כמובן לא המצב. ב-2009 מכירות הספרים הדיגיטליים היו רק 3.3%. והנתון הרי רשום שם, שחור על גבי צהוב, וכל קריאה קפדנית תראה את זה. אבל כל המטרה של אינפוגרפיקה היא לתמצת נתונים באופן גראפי כך שלא נצטרך קריאה קפדנית, אלא שתעביר את המסר, את הטרנד הכללי, באופן מיידי. וההצבה הזו של שני הנתונים כחלק מאותו תרשים משדרת תחושה שהספרים הדיגיטליים מהווים נתח נכבד משוק הספרים. בכתבה שדנה בשליטתה המממשת ובאה של גוגל בשוק הספרים הדיגיטליים, התחושה הזו תורמת, כמובן, למסר של הכתבה. רק חבל שהיא משתמשת כאן באינפוגרפיקה דמגוגית, במכוון או שלא במכוון, כדי לתמוך במסר. אני חושב שהוא חזק מספיק בפני עצמו.