העתק-הדבק

בטמקא פרסמו סקר חדש בעקבות הפריימריס בקדימה, לפיו קדימה ולפיד נאבקים ראש בראש על המקומות הרביעי והחמישי בדירוג המפלגות.

מכיוון שאפילו הם יודעים שלסקרים הללו אין משמעות, אוהבים העיתונים לעסוק בספקולציות חסרות שחר. הפעם, למשל, צורף לסקר הזה גם סקר ששאל כיצד יצביעו הבוחרים אם ציפי ליבני תצטרף למפלגתו של לפיד. מסתבר שלפיד יזנק מ-12 ל-15 מנדטים (ולמקום השלישי בדירוג), בעוד שקדימה, העבודה והליכוד יאבדו מנדט אחד כל אחת.

אבל לערוך סקר זה קל. להכין אינפוגרפיקה, לעומת זאת, זה קשה. כנראה. קשה להסביר אחרת את העובדה שהגרפיקה שמציגה את הסקר השני היא פשוט העתק של חמשת העמודות הראשונות מהסקר הראשון, אבל עם מספרים שונים (ותוספת ליבני לעמודה של לפיד). כך לפיד (15 מנדטים) ממוקם במקום החמישי באותו גובה כמו קדימה (11 מנדטים), ונמוך מישראל ביתנו (13 מנדטים). לא ספרתי פיקסלים, אבל אני מוכן להתערב שגם העמודות של הליכוד ושל העבודה לא זעו מילימטר ביחס לעמודות האחרות, חרף אובדן של שלושה-חמישה אחוזים מערכן.

כי באמת, בשביל מה צריך לשנות את הגרף כשמשתנים המספרים? זה לא כאילו שכל מטרתה של האינפוגרפיקה היא שלא נצטרך לעיין באופן מדוקדק בנתונים כדי לקבל את התמונה הכללית…

מה משווים?

מטרתה של האינפוגרפיקה היא לקחת מספר גדול של נתונים ולהציג אותם באופן שמאפשר לקורא לתפוס את המסר העיקרי של המספרים הללו בקלות ובלי להתעמק יותר מדי. כשהמספרים מוצגים במלואם, הם בדרך-כלל על תקן "קריאה נוספת" למעוניינים להעמיק.

המטרה הפשוטה הזו נעלמה מעיניהם של מעצבי האינפוגרפיקה הזו, שהופיעה בגליון מעריב מיום שני, החמישי בספטמבר:

כותרת האיור מציגה שאלה פשוטה: האם העדר התחרותיות במשק הביא לעליית מחירים? הטענה המובלעת בכתבה היא שחברות שמחזיקות במונופול או כמעט-מונופול על השוק מעלות את המחירים בקצב גבוה יותר מחברות שמחזיקות בנתח קטן יותר מהשוק.

לצורך העניין, נניח שחמשת הנתונים שמביא הגרף מספיקים כדי להציג מגמה, ולא נדרוש השוואה גם למחירי מוצרים שמשווקים על-ידי חברות שאינן אוחזות בנתח שוק משמעותי, או שאינן מהוות חלק מתעשייה שהמחירים בה מוכתבים על-ידי גוף כמעט-מונופולי.

מדוע מוצגים הנתונים כפי שהם מוצגים? ההשוואה העיקרית שמוצגת לנו כאן היא בגרף העמודות. העמודות משקפות מחיר אבסולוטי בשקלים של מוצרים שונים. אבל ממש לא מעניין אותנו להשוות בין מחיר של שקית במבה לבין קופסא של קורנפלקס. אין להשוואה הזו כל ערך לגבי הטענה הנטענת. ההשוואה שמעניינת אותנו מתמקדת בשני נתונים: אחוז העליה במחיר בין 2008 ל-2011, ונתח השוק של החברה שאת מחירי מוצריה בדקנו. שני הנתונים הללו אינם מוצגים בצורה השוואתית, אלא בצורת מספרים בלבד (נתח השוק מוצג גם בסדרה של תרשימי עוגה שמונחים זה לצד זה – פרקטיקה מאוד לא נוחה להשוואה: תרשים עוגה נוח להשוואה בין חלקי העוגה השונים, אבל לא קל לנו להשוות בין שני תרשימי עוגה שמונחים אחד ליד השני). כדי להוסיף חטא על פשע, אחוז השינוי מוצג מיד מעל לעמודות המחיר האבסולוטי, כך שלא רק שאין קשר בין מיקום המספר לבין יחסו למספרים האחרים, אלא שיש קשר משתמע מטעה ביניהם, משום שהמספר הנמוך ביותר (חמישה אחוזים) מוקם הכי גבוה בגרף.

איך היה צריך להראות הגרף הזה? ראשית, ההגיון מכתיב קיומו של ציר X שהוא, לכל הפחות, סודר. משמע: ככל שהחברה ממוקמת ימינה יותר על הגרף, כך נתח השוק שלה גדול יותר (או להפך, אם מתעקשים, זה לא קריטי). החברות, אם כן, היו צריכות להיות מסודרות כך: אסם-נסטלה (53.2), תלמה-יוניליבר (58.1), שטראוס-עילית (83.9), החברה המרכזית (86.1), ותנובה (94.8). מתחת לכותרות הללו היה צריך לסדר את אחוזי השינוי בגרף קו, מ-11 אחוזים ועד 35%. הקו לא היה עולה באופן עקבי למעלה, אבל המגמה הייתה ברורה (אם ציר ה-X היה יחסי באמת, אפשר היה לזהות כיצד שני החמישימים ושני השמונימים מקובצים ביחד, פחות או יותר, אבל זו כבר באמת דרישה גבוהה מדי). אם רוצים להוסיף קצת צבע ועניין לגרף קו משעמם, אפשר להלביש את גרף העמודות מתחת לקו ולתת גם השוואה אבסולוטית בין המחירים (למרות שנראה לי עדיף פשוט לשים תמונה של המוצרים השונים, אבל מה אני מבין בגרפיקה).

אבל רגע, אם מחליטים להחזיר את העמודות, כדאי לקנות קודם סרגל. בחינה מדוקדקת של הגרף מעלה שאין באמת קשר בין ציר ה-Y שמשמש כל אחד מצמדי העמודות. הדוגמא הכי ברורה נראית בהשוואה בין עמודת 2011 של במבה (4.8), שעוברת קצת מעל השנת הראשונה, לבין עמודת 2008 של קוקה-קולה (5.9) או קפה טורקי (6.1), שתיהן מעט מתחת או בדיוק על אותה השנת. גם בין צמדי עמודות יש אי התאמות שאפשר לראות גם בעין בלתי מזויינת (בניגוד לאבנר, אני לא אטריח את עצמי לספור פיקסלים) – למשל, בעמודות של תנובה, בעמודה הכחולה כל שנת שווה בסביבות ה-4.5 לפי הערכתי, אבל למרות שההפרש בין שתי העמודות עומד על יותר משנת אחת, ההפרש בין המספרים עומד על 3.7 בלבד.

לסיכום: אינפוגרפיקה שהאלמנט הגרפי המרכזי שלה הוא (א) שגוי, (ב) בלתי רלוונטי בעליל, ואילו המספרים החשובים להעברת המסר שמובע בכותרת האיור אינם זוכים להבלטה השוואתית. כל זה מעלה את השאלה – בשביל מה האינפוגרפיקה הזו שם? האם העורך אמר לגרפיקאי להרים לו משהו שנראה מדעי ועם הרבה צבעים? האם במערכת מעריב יש מישהו שאחראי על אינפוגרפיקות באופן ספציפי, וגם מבין את מטרת הז'אנר, או שכל בוגר בצלאל רעב ללחם יכול למלא את התפקיד הזה? אני מבין שמצב העיתונות בישראל בקאנטים, אבל אולי כדאי בכל זאת לשקול מחדש.

למה לא הפסקת להכות את אשתך?

חשוב לדעת איך להציג נתונים, אבל גם הצגת הנתונים הכי אמינה וכנה לא תעזור אם הנתונים עצמם חסרי כל ערך. לכן, לפעמים צריך לרדת רמה אחת מתחת לאופן הצגת הנתונים ולחשוב כיצד הם הושגו. או, במילים אקדמיות יותר, לנתח את המתודולוגיה של איסוף הנתונים. לפעמים זה גובל בבלתי אפשרי – למשל, כשידיעה בעיתון מספקת את הנתונים בלי שום מידע על אופן איסופם או אפילו נתונים בסיסיים כמו מספר הנשאלים בסקר. לפעמים המידע קיים, אבל לקורא הממוצע קשה להעריך עד כמה המתודולוגיה מבוססת בגלל אי הכרות עם התחום. קשה למי שלא מכיר את המחקר בתחום, למשל, לזהות מתי שאלות נשאלו באופן שייתן עדיפות לתשובות מסויימות על פני אחרות. למעשה, גם לסוקרים הדבר לא בא בטבעיות, והכללים לניסוח סקרים נבנו על פני שנים רבות של מחקר בו זוהו, לאט לאט, כל ההטיות הבלתי מכוונות שהוכנסו לסקרים לאורך ההיסטוריה של התחום. אבל היום כל סוקר אמור להכיר את הכללים הללו, ולפחות מעמיד פנים שהוא נוהג על-פיהם. לעיתים נדירות אפשר למצוא ידיעה שכותביה, למעשה, משתינים מהמקפצה.

ניסוח סקר זו אומנות שזכתה כבר ללא מעט ביקורת וסאטירה, אולי המוצלחת שבהן באותה סצינה בלתי נשכחת של הסדרה "כן, אדוני השר". אבל בדרך כלל סקרים מגמתיים עד כדי כך מצליחים להסתיר זאת פשוט על ידי הסתרת השאלות הבעייתיות ופרסום רק של התוצאות המעניינות את יוצרי הסקר. והנה, לאחרונה התפרסם בוואלה סקר בעריכת "המכון לאחריות אזרחית" במרכז ללימודים אקדמיים.1 על פי הסקר, "על השאלה 'מה הסיבה שבגללה לא השתתפת בהפגנות?', השיבו 60.6% מהנשאלים כי הסיבה לכך הייתה טכנית בלבד כמו מחלה, היעדרות מהארץ, התחייבות קודמת או עבודה". שימו לב: מדובר על 60.6% מכלל הנשאלים, משום שכל הנשאלים נשאלו מה הסיבה שבגללה לא השתתפו בהפגנות. הנה כי כן, לא דוד סוקר התקשר לנשאלים, אלא דודה פולניה שתבעה בעלבון "למה לא רואים אתכם אף פעם?!". מניסוח הדברים אפשר אפילו לחשוב שלא טרחו לשאול את הנשאלים אם אכן השתתפו בהפגנות או לא. אבל גם אם נניח שאכן קודם וידאו שהנשאל לא היה בהפגנה לפני שהטיחו בו שאלות מאשימות, הרי שברור לחלוטין שבשום שלב לא נשאל המשיב האם הוא בכלל תומך במחאה. במקום זאת "אני לא תומך במחאה" היא אחת הסיבות לאי הגעה להפגנה. כלומר, הנחת המוצא של הסוקרים היא שכולם תומכים.

דמיינו לעצמכם שאתם אזרח או אזרחית שלא אכפת להם מהמחאה. זה לא שאתם מתנגדים, אבל כל העניין פשוט לא מעניין אתכם ואתם מעדיפים לצפות בתוכניות ריאליטי ולא לחשוב על בעיות של אחרים. לפתע מצלצל הטלפון, ובצד השני מישהו בעל קול רשמי שואל בטון מאשים "למה לא הגעתם להפגנה?!". בלי שתרגישו בכלל מתעורר בתוככם מנגנון פסיכולוגי שמכונה "רצייה חברתית" – אתם יודעים שהצד השני (והחברה ככללה) רוצה לשמוע שאתם רציתם להיות בהפגנה. הדרך הטובה ביותר לצאת מהסיטואציה הזו היא בדיוק אותו דבר שתעשו אם איזה מכר יזמין אתכם לחתונה של הבן שלו שבאמת לא מעניין לכם את האחוריים: תמציאו תירוץ. התירוץ לא יהיה "לא בא לי להפריש כמה מאות שקלים עכשיו למתנת חתונה למישהו שאני בקושי מכיר", אלא יותר "אני מצטער, אבל בדיוק יש לי טיפול שורש באותו יום". או, במילים אחרות, סיבה טכנית. היי! בדיוק הסיבה ש-60.6% מהנשאלים נתנו!

אותם 60.6% הם כנראה אנשים שהיו עונים "לא יודע/אין תשובה" על השאלה "האם את/ה תומך/ת במחאת האוהלים?", או, לכל הפחות, אם הם היו עונים (בגלל אותה רצייה חברתית) שהם כן תומכים במחאה, הם היו עונים "לא יודע/אין תשובה" לשאלה "מדוע את/ה תומך/ת במחאת האוהלים?". עבור חלק מהאנשים הללו שבאמת ובתמים תומכים במידה כלשהי במחאה, התשובה האמיתית לשאלה למה הם לא השתתפו בהפגנה היא שלא מספיק אכפת להם. אבל את זה אף אחד לא יגיד לדודה הפולניה שמתקשרת לשאול בטון נעלב למה לא באנו לארוחת החג.

האם אפשר להתמודד עם רצייה חברתית? כן. סוקרים פיתחו שיטות לשכנע אנשים להודות בהעדפות שנחשבות לא פופולאריות (גם אם הן מאוד נפוצות). שיטה בסיסית אחת היא לתת למשיב תחושה שהתשובה הבעייתית היא לגיטימית ונפוצה: "אזרחים רבים שתומכים בדרישות המוחים בעקרון לא השתתפו בהפגנה משום שהם חשבו שהיא לא מספיק חשובה. האם את/ה חושב/ת שהשתתפות בהפגנה במסגרת המחאה היא חשובה או לא חשובה?" (בתנאים מסוימים כדאי גם לכלול אפשרות נייטרלית). אותם משיבים שענו שהם תומכים במחאה ברמה כלשהי, וחושבים שהשתתפות בהפגנה היא חשובה, רק אותם ראוי לשאול, אם כן, מדוע לא השתתפו במחאה. אבל בלי הפילוח המקדים הזה, רוב התשובות שנקבל תהיינה תירוצים, ולתוצאות הסקר לא תהיה שום משמעות. אלא אם המטרה שלנו היא לגרום למוחים לאשליה ש-60.6% מהציבור (למעלה מארבעה מיליון איש) היו מצטרפים להפגנה אם רק במקרה לא היו צריכים להכניס את האוטו למוסך באותו יום….

  1. המרכז ללימודים אקדמיים זה שם נפלא. זה כמו "בית החולים לריפוי מחלות" או "בית הספר ללמידת דברים", או אולי "הכלא לאסירים". אפרופו, ביקור באתר הבית של המרכז (ששם המתחם שלו הוא ראשי התיבות של השם העברי באותיות לטיניות – MLA) מזמן את המבקר "לבדוק את התאמתך לתואר ראשון/שני ב-60 שניות בשאלון אונליין(!)", מה שמראה כנראה שהם מיישמים את המתודולוגיה הזו במגוון תחומים. []