לא כל הנוצץ זהב הוא

פורסם בתאריך 12 במרץ 2014 על ידי אבנר שחר קשתן

כשלומדים מתמטיקה בביה”ס, אנחנו מתרגלים שאם הגענו בסוף התרגיל למספר עגול ויפה, כנראה שפתרנו אותו נכון – התוצאה העגולה היא סוג של ספרת ביקורת, שמראה לנו שהתהליך היה נכון. אבל ברגע שיוצאים משיעורי המתמטיקה בחטיבת הביניים, אנחנו רואים שבעולם האמיתי המספרים אף פעם לא כ”כ עגולים. ואפילו הייתי אומר(תוך שאני מסתכן בלחטוא בדיוק במה שהזהרתי ממנו) שכשהמספרים עגולים מדי, או שהגרף יושב לו יותר מדי טוב על הקונצפט שלו, אז אולי משהו כאן לא בסדר, ואולי מישהו עיגל כאן פינות, ועיסה קצת את הנתונים כדי שיצאו יפים.

כל זה לא בא להגיד שסדרת הכרזות של המגזין הפורטוגלי Grande Reportagem אינה מוצלחת (ותודה לגלעד ברזילי על הקישור). המגזין לקח דגלים של 8 מדינות בעולם, ושל האיחוד האירופי, ובנה סביבם אינפוגרפיקות. בזו של ארה”ב, כאן למעלה, האדום מסמל אנשים התומכים במלחמה בעירק, הלבן אנשים המתנגדים לה, והכחול – אנשים שאינם יודעים היכן עירק נמצאת.

בדגל של קולומביה, הצבעים מסמלים את היקף היצוא של בננות (אדום), קפה (כחול) וקוקאין – הצהוב, שהוגדל בערכו היחסי.

אז מצד אחד הכרזות הן אפקטיביות. הבחירה בדגלים כבסיס האינפוגרפיקה היא מאד אפקטיבית בלהדגיש שכאן יש נסיון לגעת במהות של אותן מדינות, בסוגיות הליבה שמגדירות את המדינה, לפחות כפי שהן נתפסות ע”י הציבור בפורטוגל. הטקסטים שמלווים את הכרזות (או לפחות התרגומים שמצאתי) מבטיחים שהנתונים אומתו מול גופים כמו האו”ם ואמנסטי, ו~~בדגל קולומביה, לפחות, ברור לעין שנעשה מאמץ להכניס את הנתונים לתוך הדגל, ולא סתם לזרוק שליש-שליש-שליש~~ (לא, מסתבר שככה זה במקור בדגל קולומביה. כמה מוזר) ויתכן שהגרפיקאי אפילו דאג בפרטי פרטים ליחסי הצבעים בדגל.

אבל מצד שני, קשה להתייחס לאינפוגרפיקות הללו כמביאות נתונים מדויקים. חלוקת הצבעים בפסים על דגל ארה”ב, למשל, מונעת כל דרך לעין האנושית להבין מה בעצם היחס בין הצבעים. בנוסף, העובדה שהפורמט האינפוגרפי הוכתב ע”י הדגל מגדיר לנו מראש איזה נתונים אנחנו יכולים להעביר. בדגל האיחוד האירופי, למשל, שם יש הבדל קיצוני בין הכחול לבין הצהוב, המעצב היה צריך לחפש איזה מסר להעביר ע”י חיפוש נתונים שיתאימו לגרפיקה שלו, מה שקצת שם את עניין ה-“סוגיות מהותיות” בספק.

בסופו של דבר, מדובר בגימיק חביב ביותר, שתופס את העין ומשתמש בעובדה הזו, ללא בושה, כדי להעביר מידע אנקדוטלי. ואין שום דבר רע בזה.

“האינפוגרפיקה”, הוא אומר, “גדולה, באמת גדולה. פשוט לא תאמין עד כמה ענקית, עצומה ומהממת היא”

פורסם בתאריך 10 במרץ 2014 על ידי אבנר שחר קשתן

תפקידה של האינפוגרפיקה, כמו שאמרנו כאן בבלוג פעמים רבות, היא להעביר בצורה גרפית – במכה חזותית אינטנסיבית – את מה שמילים או מספרים לא יכולים להעביר, או לפחות יעבירו בצורה חלשה יותר.

אחד הדברים האלה שמילים לא מצליחות להעביר הוא את גודלו העצום, האימתני, הבלתי ניתן לתפיסה של החלל. כבר כתב על זה דאגלס אדמס, שידע לשלוט במילים יותר מרוב הסופרים שאני מכיר:

"החלל," [אומר מדריך הטרמפיסט לגלקסיה], "גדול, באמת גדול. פשוט לא תאמין עד כמה ענק, עצום ומהמם הוא. כלומר, אולי תחשוב שדרך ארוכה היא ממורד הרחוב עד לבית המרקחת, אבל אין זה ולא כלום לעומת החלל. שמע…" וכן הלאה. […] “אך לשם ההגינות, יש לציין, כי משהועמד לפניך גודלם העצום המוחלט של המרחקים בין הכוכבים, כשלו מוחות טובים יותר מהאחראים להקדמה של המדריך.”

מכיוון שהגודל הזה, המרחבים הבלתי נתפסים של החלל לא מועברים ממש ע”י מילים, אפילו מילים של דאגלס אדמס, אז האינפוגרפיקה באה לעזרתנו. ובצירוף מקרים נדיר, נתקלתי ביומיים האחרונים בשתי אינפוגרפיקות אינטראקטיביות שונות שמנסות לעשות את אותו הדבר בצורות שונות – והתוצאות בהתאם.

דחיסת קנה המידה

האינפוגרפיקה הראשונה נמצאת באתר ה-BBC, כחלק ממדור ה-BBC Future, ונקראת Space Race, או How Big Is Space. האינפוגרפיקה מאפשרת לנו לעבור (באופן לינארי) דרך נקודות ציון בחלל, החל מהאטמוספירה של כדור הארץ ועד לקצה מערכת השמש.

ככלי לימודי, היא מאד מעניינת. למרות הבחירה הלא לגמרי ברורה לי שבה אנחנו יורדים למטה במורד העמוד ככל שאנחנו מתרחקים מכדור הארץ, היא מכילה המון נקודות ציון, בין אם נקודות טבעיות (המרחק מכוכבי לכת אחרים או תופעות קוסמולוגיות), מלאכותיות (מיקומם של לווינים או של ה-Voyager Probe) או נקודות ציון היסטוריות, כמו הגובה אליו הגיע האדם הראשון בחלל.

הבעיה הראשית שלי עם האינפוגרפיקה הזו היא שקנה המידה שהיא מציגה משתנה כל הזמן, בשביל להכיל את המרחקים ההולכים וגדלים בין נקודות הציון. אם בתחילת התהליך פיקסל אחד במסך מייצג מטר, אז תוך כמה גלילות זה קופץ למאה מטר, לקילומטר, וכן הלאה, עד שבשלב מסוים כל פיקסל מייצג מיליון ק”מ. זו אולי בחירה הגיונית אם המטרה שלנו היא להציג מה יש בחלל, אבל היא קצת מפספסת את הנקודה של להראות כמה החלל גדול. כי השינוי הלוגריתמי הזה מייצר מיצג שווא שבו המרחק בין כדור הארץ לירח (כ-10 לחיצות על page down, אצלי) הוא פחות או יותר כמו המרחק מהירח לשמש (גם כן כעשר לחיצות). כלומר בשביל להכניס עוד פריטי מידע, הוא ממסמס את הגודל הבלתי סביר של מערכת השמש.

גדול זה משעמם

האינפוגרפיקה השניה, לעומת זאת, באה במטרה המפורשת להראות את החלל כמו שהוא. היא נקראת “מה אם הירח היה בגודל של פיקסל אחד”, ובהתאם, היא קובעת קנה מידה אחיד – פיקסל אחד מייצג את היקפו של הירח (כ-3500 ק”מ) – וכל מערכת השמש מוצגת בקנה המידה הזה.

התוצאה היא, כפי שמתואר בכותרת המשנה של האינפוגרפיקה “מודל מדויק באופן טרחני של מערכת השמש”. האינפוגרפיקה מאפשרת לגלול הצידה החל מהשמש והלאה, ומדגימה באופן מדויק עד כדי כאב עד כמה החלל הוא ג-ד-ו-ל. גדול, וריק.

כמה גדול? לוקח לי, על המחשב הנוכחי, כ-25 קליקים על ה-scrollbar התחתון עד שאני מגיע לכדור הארץ. כדי להגיע לצדק לוקח לי 110 קליקים. רוב הזמן מועבר בלראות מסך שחור עם ציון קטן של מרחק, ומדי פעם הערות על הריקנות. על המסך הנוכחי שלי (מסך 24 אינץ’ ברזולוציה של 1900×1200), מערכת השמש גדולה פי 886 מרוחב המסך כולו. כשבדקתי את זה על הטלפון שלי (מסך 5 אינץ’, ברזולוציה של 1900×1080), הוא טען שיקח לי מעל 5,000 דפדופים להגיע אל הקצה. נשברתי איפשהו באזור נפטון.

אז האינפוגרפיקה הזו ללא ספק מעבירה פחות מידע מאשר הקודמת. אין לה גשושות בחלל או לוויינים או אפילו אסטרואידים – כשפיקסל אחד הוא בגודל הירח, כל הדברים האלה קטנים מדי מכדי להכנס לתמונה. אבל כשאתה מדפדף הצידה, עמוד אחרי עמוד, קילומטר אחרי קילומטר, אתה בהחלט מצליח להבין קצת יותר את סדרי הגודל המטורפים של החלל, וכמה הוא ריק, לגמרי ריק.

הערות לסיום

האינפוגרפיקות הללו עדיין לא ממש מצליחות להעביר לנו את קנה המידה הפסיכי של החלל. אבל השניה נותנת איזשהו הדגמה של זה. הראשונה, לעומת זאת, קצת מפספסת את המטרה – אבל מצליחה מאד יפה להעביר מטרה אחרת.

ובנושא דומה, אני ממליץ על “על כתפי גמדים”, שהוא פודקאסט משחקי-התפקידים של ערן אבירם ואורי ליפשיץ, שם שודר לפני כמה שבועות פרק המוקדש לחלל (לכבוד שבוע החלל). גם אם אתם לא חובבי משחקי תפקידים יכול להיות מעניין להקשיב לפרק, שמתמקד בדיוק באספקט הזה של הגודל של החלל, ואיך הוא יכול (וצריך) להשפיע על סוגי הסיפורים שאפשר לספר על החלל.

פעימות

פורסם בתאריך 17 בפברואר 2014 על ידי אבנר שחר קשתן

אני לא ארחיב הרבה בנוגע ל-xkcd של היום. אני רק אגיד שראנדל מונרו, בנוסף להיותו כותב קומיקס נהדר, גם משקיע המון מחשבה בנושא של אינפוגרפיקה – לא רק שימוש בסיסי בגרפים, אלא לחשוב איך להשתמש ולהרחיב את המדיום שלו, הקומיקס האינטרנטי, כדי להעביר מידע. במקרה הזה, באופן ממש פועם.

אינפוגרפיקה ברִיק

פורסם בתאריך 26 בינואר 2014 על ידי אבנר שחר קשתן

נדב פרץ-וויסווידובסקי קישור אלי את התמונה הבאה, שהגיעה ~~מפוסט ממומן~~ פרסומת של HOT בפייסבוק.

כפי שאמר נדב:

"תראו! יש כאן עמודה אדומה גבוהה ועמודה כחולה נמוכה! ההוכחה הניצחת שאנחנו אכן יותר טובים!"

ואכן, יש לנו כאן מראית עין של גרף אבל בלי נתונים, בלי שנתות, בלי מספרים, ואפילו בלי הסבר של מה הגרף הזה כביכול מתיימר לתאר. יתכן שבהקשר של הפרסומת המקורית היה גם טקסט שנתן הסבר, אבל זה הלך לאיבוד מהר מאד, וכל מה שנשארנו איתו הוא אדום גבוה, וכחול נמוך. ובאופן מפתיע, מדובר בכחול כללי – לא בכחול הבהיר של Yes, המתחרה הראשית של HOT בתחום הטלוויזיה, ואולי, רק אולי, בצבע של הלוגו של בזק, המתחרה של HOT בתחום הטלפוניה.

אבל מה שיותר מעניין הוא שגרף כזה, בלי שום מידע או נתונים, פשוט מזמין אנשים אחרים לצקת לתוכו תוכן סרקסטי חלופי. “זמני המתנה לשירות”, הציע עידו קינן בפתיל הפייסבוק המקורי. “אחוזי נטישה”, הציע אביב לוי.

כשאתה לא אומר שום דבר, אל תתפלא ששמים לך מילים בפה.

ביט אחד של אינפורמציה

פורסם בתאריך 8 בינואר 2014 על ידי אבנר שחר קשתן

קצת רקע למי שפחות שוחה בטרמינולוגיה של תקשורת דיגיטלית ומחשוב: ביט (או bit, או סיבית, במקור Binary Digit, או ספרה בינארית) היא יחידת האינפורמציה הקטנה ביותר במחשב. היא מייצגת נתון בינארי אחד – או 0, או 1. אם יש לי נתון בודד שאני רוצה לאחסן או לייצג, כמו אם הפוסט הזה פורסם או לא פורסם, אבל לייצג אותו עם ביט אחד. או 0, או 1. ברגע שנרצה לייצג מידע מורכב קצת יותר (נגיד, רק השעה שבה הפוסט פורסם) אנחנו נצטרך, כמובן, הרבה יותר מביט אחד.

למה אני מספר לכם את זה? בגלל אינפוגרפיקה בויינט אותה שלח לי נדב פרץ-וייסוידובסקי, שמצליחה להציג כל כך הרבה, אבל להגיד כל כך מעט.

זה החלק הראשון שלה: (צילום: shutterstock)

בהתחלה הגרף הזה רק קצת צרם לי. לא סתם שהעמודות של 2000 ו-2012 לא פרופורציונליות בשום צורה למידע שמוצג ליד הגף – היחס בין העמודה האדומה לכחולה הוא בערך 1:1.4, בעוד היחס בין הנתונים הוא בערך 1:1.1. אבל אם זה לא מספיק, הגרף הוא גם הפוך – העמודה הקטנה יותר, של 2000, מייצגת מס’ גדול יותר של רופאים ואחיות. אז למה העמודה הכחולה גדולה יותר? לא ברור.

אבל אז דפדפתי במורד העמוד, ועיני חשכו עוד יותר (או, ליתר דיוק, אדמו וכחלו):

(צילום: אבישג שאר-ישוב, shutterstock)

כאן סדר העמודות התחלף, והכחול הארוך מייצג את שנת 2000, בעוד האדום הקצר את 2012. זה נראה טיפה יותר הגיוני – העמודה הקטנה יותר מייצגת מספרים קטנים יותר – ואפשר אולי להתלונן על חוסר האחידות בצבע, אבל יש כאן משהו הרבה יותר בסיסי ויותר עקרוני, שאני בטוח שקפץ גם לעיניכם כשראיתם את הגרף הזה:
כל העמודות הן באותו באורך.
כל העמודות הן באותו האורך, ולא משנה מה הנתון שאליו הן מוצמדות. כל העמודות הן באותו האורך, ולא משנה מה היחס בין הנתונים או היחס בין העמודות. כל העמודות הן באותו האורך.

בהמשך העמוד, עוד גרף. הפעם של דברים שהשתנו לטובה, או לפחות גדלו, בין 2000 ל-2012:

(צילום: shutterstock)

ושוב, אותן עמודות, מסודרות הפעם הפוך. הצבעים שוב השתנו, בשביל לוודא שלא תהיה להם שום משמעות. אדום כבר לא מייצג את 2000 או את 2012, אלא את העמודה הקטנה יותר תמיד – אבל מכיוון שהציר בין אדום וכחול לא מקושר אצלנו אינטואיטיבית עם “גבוה ונמוך” או אפילו עם “טוב ורע”, הבדלת הצבעים הזו חסרת משמעות אינפורמטיבית.

ההגדרה של אינפוגרפיקה היא לקחת נתונים ולייצג אותם בצורה גרפית. הנחת היסוד היא שיש קשר כלשהו בין הנתון לבין הגרפיקה. אבל כאן העמודות (והאם אפשר בכלל לקרוא להן עמודות? זה פשוט בלוק של צבע רקע ליד השנים) לא מביאות לנו סדרי גודל, או יחסים, או השוואה של ממש. העמודות שלנו כאן מבטאות רק פריט מידע אחד: האם הנתון בשנת 2000 הוא גדול או קטן יותר – מספרית, אבסולוטית – מאשר זה שבשנת 2012. זה הכל. פריט מידע אחד, בודד, ובינארי. ביט אחד של אינפורמציה.

אינפוגרפיקה היא כלי חזק ביותר. היא יכולה לדחוס מסר לתוך פיקסלים ספורים, להכניס מידע של מחקר שלם לתוך גרף אחד. אבל כל הכח הזה, הקילובייטים של קובץ התמונה בעמוד, העבודה של הגרפיקאים – כל זה בשביל להעביר ביט אחד, יחיד, בודד של אינפורמציה.

ובגרף הראשון – אפילו את זה הם לא מעבירים נכון.

גרף השנה: פיטר ת’יל וההצטלבות

פורסם בתאריך 6 בינואר 2014 על ידי אבנר שחר קשתן

הקורא רותם אבלס הפנה אותי לכתבה הזו בוושינגטון פוסט, בה הם ביקשו ממגוון דמויות בולטות בסצנת העסקים, הטכנולוגיה, התקשורת ובכלל לבחור את גרף השנה שלהם. חלק מהגרפים מרתקים. חלק מהם קצת ברורים מאליהם. וחלק מעוררים את הדחף שלי לכתוב כאן בבלוג. נתחיל היום בגרף שבחר פיטר ת’יל – יזם, משקיע, אחד ממקימי PayPal והמשקיע החיצוני הראשון בפייסבוק (שאפילו הופיע בסרט הרשת החברתית). ת’יל בחר את הגרף המוזר הבא:

Screen Shot 2013-12-30 at 9.31.48 PM

עכשיו, מה יש לנו כאן? הצלבה של שני נתונים לאורך זמן, הראשון הוא החובות של סטודנטים מתקופת הלימודים שלהם – בארה”ב נהוגה שיטה של student loans, בהם סטודנטים לווים את הכסף ללימודיהם האקדמיים, ומתחילים להחזיר את הכסף רק לאחר סיום הלימודים. הבעיה היא שתואר אקדמי כבר לא מבטיח לך תעסוקה והכנסה כמו פעם, כשהשיטה נחנכה, ואנשים רבים מושכים את החובות הללו לשנים רבות. הטענה של ת’יל, כך הגרף ירצה שנאמין, היא שבעוד החובות של הסטודנטים הולכים ועולים, המשכורת החציונית של בוגר תואר ראשון רק הולכת ויורדת, ומערכת ההשכלה הגבוהה רק מייצרת חובות, לא מייצרת הכנסות ויצרנות. נכון? נכון.

אבל הגרף, כפי שיכולתם לנחש מכך שהוא מופיע כאן בבלוג, מבולבל באופן די חסר תוחלת. נתחיל מזה שיש לנו שני גרפים שונים בתכלית על אותה מערכת צירים. הוא נותן אשליה שב-2003 עוד המצב היה טוב, וההכנסה היתה גבוהה יותר מהחוב, אבל ב-2004 התהפכו היוצרות. אבל אין באמת שום קשר בין שני הקווים הללו.אפשר היה לבנות את הגרף האדום כך שציר ה-Y שלו מתחיל מ-40 אלף דולר (נגיד) ומסתיים ב-100 אלף דולר, ופתאום הקו האדום כבר לא משיק בכלל לכחול:

כלומר האשליה שהיתה הצטלבות, כאילו היתה נקודת מפנה ב-2004, היא מוטעית לחלוטין, ונובעת מבחירה של טווח הערכים בציר ה-Y של אחד הגרפים.

אבל נקודה גדולה עוד יותר היא העובדה ששני הנתונים הללו, שמוצלבים באופן כה יפה, בכלל לא מדברים על אותו הדבר. הגרף האדום, המשכורת החציונית, מדברת על משכורת של אדם אחד, בוגר תואר ראשון. הקו הכחול, לעומת זאת, לא מדבר על החובות של אותו אדם חציוני. אלא אם הסטודנט החציוני חייב 900 מיליארד דולר, אזי מדובר כאן בסך כל חובות הסטודנטים בבת אחת. שוב, הגרף מנסה לרמז שהחובות הולכים ונצברים, אבל אין כאן שום נתון על זה. כל מה שאנחנו רואים זה שיש יותר חובות, אבל היינו רואים בדיוק את אותה העליה בסף החובות גם אם היינו במצב שכל החובות מוחזרים תוך שנה מסיום הלימודים, אבל היקף הסטודנטים גדל. אם האוניברסיטאות והמכללות מתרחבות, כמובן שבכל זמן נתון יהיו יותר סטודנטים עם יותר חוב. אולי הטענה שתי’ל טוען היא נכונה, אבל הנתונים שלו – והגרף שלו – לא מבססים את זה.

שאלת המניע

כשאנחנו מנסים להבין אינפוגרפיקה, בדיוק כמו כל טקסט אחר, אנחנו חייבים תמיד לשאול את עצמנו מי כתב אותה, מי תכנן אותה, ומה המניע שלו. במקרה של האינפוגרפיקה הזו, מי שמכיר קצת את ת’יל ואת דעותיו לא יופתע ממש.

נושא ההשכלה הגבוהה בארה”ב הוא אחד הנושאים שת’יל חוזר אליהם שוב ושוב. ב-2011 הוא אמר שהבועה האמיתית בארה”ב היא לא האינטרנט וחברות הסטארטאפ (ומעולם לא היתה) אלא ההשכלה הגבוהה, שמבטיחה רבות, מוערכת-יתר, אבל לא מספקת את הערך שהיא מתיימרת לתת. ת’יל גם פתח את קרן ת’יל, שמעניקה לכ-20 צעירים מתחת לגיל 20 מלגה בגובה 100 אלף דולר – בתנאי שהם לא ילכו לאוניברסיטה (או יפרשו, אם כבר התחילו), אלא במקום זה ילכו להקים חברות או סטארטאפים, יעסקו במחקר מדעי (מחוץ לכותלי האוניברסיטאות) או בתנועות חברתיות כלשהן – להשפיע על העולם, אבל רק לא באקדמיה.

לאור הדעות המאוד מבוססות של ת’יל בנושא (שמחזיק, אגב, בתואר ראשון בפילוסופיה ותואר שני במשפטים מסטאנפורד: עובדה שיכולה או להציג אותו כצבוע, או לתת לו את ההיכרות האישית עם המערכת שעל פיה ביסס את דעותיו), המסר של האינפוגרפיקה אינו מפתיע. מה שמפתיע הוא שת’יל, שברור שאינו אדם טיפש, בחר לייצג אותו באינפוגרפיקה כ”כ חלשה שלא מעבירה את הנקודה. ולא ברור למה הוושינגטון פוסט, אחד העיתונים המוערכים יותר בארה”ב, בחר לפרסם את הגרף הזה בלי טיפת ביקורת, בלי רקע על ת’יל ודעותיו על השכלה גבוהה מעבר לקישור קטן בתחתית הכתבה.

לפעמים הטיה היא רק הדגשה

פורסם בתאריך 5 בינואר 2014 על ידי אבנר שחר קשתן

דובי קננגיסר, מיקירי (וכותבי) הבלוג, נתקל היום בכתבה (ישנה, אמנם) בויינט, והזדעק על הגרף שצורף אליה. ובצדק:

הגרף הזה סובל מלא מעט מהבעיות שכבר דיברנו עליהן בעבר כאן בבלוג: קיצוץ בסיס הצירים כדי ליצור הדגשה של הבדלים, ולא סדר גודל אמין. הטעיות בוטות במיקום על מערכת הצירים – אחוז ההצבעה ב-1949 שעומד על 79%, נמצא נמוך יותר על הגרף מאשר ה-77% ב-1996. קפיצות לא פרופורציונאליות בין נקודות מידע שונות, גם בציר ה-Y (המרחק בין 83% ל-85% גדול ביותר מפי שתיים מהמרחק בין 82% ל-83%) וגם בציר ה-X (הציר לא מתקדם באופן רציף, אלא בקפיצות של בין שנתיים לארבע שנים).

אבל מה שמעניין, לדעתי, הוא הדיון שהתפתח בעמוד הפייסבוק של דובי סביב הגרף הזה, שבו הבחינו המשתתפים ברוב הבעיות שבגרף. הגדיל לעשות אחיעד גבריאל לוי והזין את הנתונים לאקסל כדי לצייר גרף עמודות אמין יותר, שזו הטכניקה המומלצת של הבלוג הזה כשהנתונים לא מסתדרים באינפוגרפיקה – מיד אחרי ספירת פיקסלים, כמובן.

הטיה כהטיה, הטיה כהדגשה

אבל חשוב מכך, אני חושב שבדיון עלתה אחת הנקודות החשובות בדיון על אינפוגרפיקה, והיא לשאול מתי הטיה היא הטיה, ומתי היא בחירה לגיטימית שמשרתת את הצגת האינפורמציה?

בתחילת הפוסט קישרתי לגרף שהוצג בערוץ Fox News שמקצץ את מערכת הצירים בגרף אבטלה בארה”ב כדי להפוך תנודה קלה לשינוי משמעותי. שם, לדעתי, יש מניפולציה ברורה והטיה מכוונת. אבל במקרים רבים יכולה להיות הצדקה לגיטימית לקיצוץ מערכת הצירים כשהדיון שהאינפוגרפיקה באה לשרת הוא סביב השינויים, לא סביב סדרי הגודל. אם אני אומר במפורש “בהינתן שלא היו שינויים עצומים בין נקודת המידע שלי, אבל מעניין אותי להסתכל על התנודות אז בואו נעשה zoom in”, זה לגיטימי לחלוטין להתמקד רק בחלק מהגרף. אבל כאן עובד קו עדין מאד בין אותו zoom in שממקד את הדיון, לבין צמצום השיח בצורה שמעלימה נתונים חשובים, או (גרוע מכך), מרמזת על נתונים שלא באמת נמצאים שם, כמו אותו גרף של Fox News.

איך מבדילים בין הדגשה לגיטימית לבין הטיה מניפולטיבית? לא תמיד יש הוכחות ברורות, אבל אחת הדרכים היעילות היא לדבר מפורשות על היעדים שלך. אם לגרף תתלווה פסקת הסבר בה יאמר כי “בגרף הזה בחרנו להתחיל את מערכת הצירים מ-18% כי הדגש שלנו הוא על התנודות”, אז שיתפנו את הקוראים בהחלטות שלנו, הנכחנו את השינויים שעשינו לגרף, וצמצמנו את המניפולטיביות שלו.

כל אינפוגרפיקה תמיד מנסה להעביר מסר, לא רק נתונים יבשים. תמיד יש מידע שמישהו בחר כן לכלול או לא לכלול, כן להדגיש או לא להדגיש. ולא צריך להתבייש זה – אחרי המסר הזה הוא הסיבה שאנחנו בכלל כותבים. אבל ככל שכותבי האינפוגרפיקה יהיו שקופים במניעים ובמטרות שלהם, כך האמינות שלהם תגדל. וככל שאנחנו נדע לקרוא אינפוגרפיקות, כך נוכל לדרוש מהכותבים שלהן את השקיפות הזו.

הצירים הנבחרים

באופן דומה גם הנושא השני שנידון בפתיל אצל דובי יכול להתפרש כהטיה או כבחירה לגיטימית. ציר ה-X, שכאמור מתקדם בקפיצות של מערכות בחירות ולא של שנים, יכול להתפרש כמה דרכים. דובי רואה בזה בחירה לגיטימית – שכן לא ניתן לצייר גרף רציף על אירועים דיסקרטיים שמתרחשים אחת לשנתיים עד ארבע שנים. נמרוד אבישר, מולו, גורס שהעלמת המרחקים האמיתיים בין הנקודות על הגרף מעלימה מידע, שכן תלילות הגרף בין הנקודות גם הוא מידע, והוא הולך לאיבוד – או, גרוע יותר, מציג מיצג שווא – כשאנחנו לא מייצגים את ציר ה-X כראוי.

שתי הגישות תקפות, אבל אנחנו חוזרים לשאלה של מה השאלה שהגרף מנסה להגיד, והאם לשאלת הזמן יש תפקיד כאן או לא. אם הוא לא רלבנטי, כפי שדובי מאמין, אז מוטב היה שהגרף היה מייצג את ציר ה-X לא בשנים, אלא במערכות בחירות (הכנסת השנייה, העשירית, וכו’), כי זו יחידת המידה שנבחרה לייצג את השינוי. אבל אם כבר בחרו לייצג בשנים, כנראה ראוי גם היה לרווח אותם בהתאם. הבחירה לא צריכה להיות בחירה אסטתית – יש משמעות לגרף שמוגדר ע”פ מערכות בחירות (אשר מתייחס, כנראה, למערכת הבחירות כיחידת ההתקדמות הרלבנטית ביחס של ערביי ישראל לבחירות), לבין גרף שמוגדר ע”פ שנים, שכנראה ינסה לטעון ששינויים רציפים לאורך העשורים, גם כשאינם קשורים ישירות למערכת הבחירות, הוא המדד הרלבנטי.

בכל מקרה אני מאד מרוצה מהדיון אצל דובי. לא במעט מכיוון שהם עשו כבר בשבילי את רוב העבודה, אבל גם כי הוא מציג כמה נקודות גישה שונות לקריאה, פרשנות וביקורת על אינפוגרפיקה. וכמה שיש יותר מזה, יותר טוב.

בלבול מאדום לשחור

פורסם בתאריך 15 בדצמבר 2013 על ידי אבנר שחר קשתן

אריאל בן-חורש שלח לי את הפוסטר הבא, שפורסם בעמוד הפייסבוק של מפלגת מרצ:
(התמונה נחתכה כדי להעביר רק את המסר. לחיצה תשלח אתכם לתמונה המלאה)

מדובר על משאל שנערך בקרב 120 חברי הכנסת לגבי תמיכתם ב”שוויון זכויות מלא לקהילת הלהט”ב, כולל הכרה רשמית בזוגות חד-מיניים” (ניסוח מעורפל מאד, כמובן, אם הוא לא מגדיר מה זה “הכרה”). אבל לא על זה יצא קצפי.

הסקר משתמש בשפת צבעים מאד ברורה. כחול, אדום, ומעט אפור. אני אמנם הייתי אולי בוחר בירוק במקום בכחול (מה עוד שזה הצבע של מרצ), אבל עדיין המסר שהפוסטר מעביר הוא מאד ברור. מעט כחול, בעיקר בתחתית הרשימה (ובהערה מוסגרת, לא לגמרי ברור מה הסדר בהן מסודרים הח”כים. אפשר לראות את זה כ-“מהקואליציה לאופוזיציה”, אם ש”ס לא היו בחלק העליון). הרבה מאד אדום, בעיקר למעלה, איפה שביבי וליברמן נמצאים. מעט אפורים שמעמדם לא לגמרי ברור. אבל המסר מועבר – רוב הציבור תומך, אבל רוב הנציגים הנבחרים לא. האומנם? בואו נתמקד במקרא של הפוסטר:

רגע, אדום כאן זה לא “מתנגד”? אז בעצם מכל הסקר הזה, יש רק ארבעה חברי כנסת שענו בבירור לשלילה על זכויות הלהט”בים (המעורפלות, כאמור)? זה מסר קצת שונה ממה שהפוסטר מתיימר לשדר. אז נכון, יש להניח שחברי הכנסת של ש”ס יתנגדו לזכויות ללה”טבים, לאור התבטאויותיהם בעבר. אבל האם זה נכון גם לאראל מרגלית מהעבודה, למאיר שטרית מהתנועה או לחנין זועבי מבל”ד? אי אפשר לדעת, כי הפוסטר משלב את “סירב לענות” עם “לא השיב”. בעצם, הפוסטר הזה לקח את הנתון של “אין נתון” והפך אותו לנתון הבולט והמרכזי. במקום לעמת את התומכים עם המתנגדים, או מעמת את התומכים עם קטגוריית ברירת המחדל של הנמנעים, הפוליטיקאים-שמסרבים-לענות, הלא-איכפתיים והלא-נמצאים-בלשכה-שלהם.

ולא סתם זה, בחירת הצבעים כאן, האדום, היא בחירה מאד מודעת של לסמן את אותה קטגוריית ברירת המחדל באדום, צבע של התנגדות, של ניגוד על הכחול. בעוד המתנגדים האמיתיים קיבלו אפור, אמנם כהה, אבל עדיין אפור של נייטרליות או של חוסר-מידע.

לסיכום, מרצ עשו כאן מעשה אינפוגרפי מניפולטיבי, שאפשר היה להפוך אותו בקלילות ע”י החלפת הצבעים בין המתנגדים לבלתי-משיבים – אבל זה, כמובן, לא היה מעביר את המסר הרצוי, שהוא זה שמרצ היא המפלגה היחידה שהתבטאה באופן עקבי בעד זכויות הלה”טבים.

עדכון: הסקר פורסם גם באתר הארץ, אבל אני שמח לראות ששם סכימת הצבעים שפויה יותר (אם כי עדיין אפורה ומאיימת) והאדום והאפור הוחלפו. אני לא יודע מה המקור של הפוסטר ומה בא קודם, אבל אני שמח שבהארץ, לפחות, המצב קצת פחות מניפוליטיבי. למי שלא יכול או מעוניין לשלם לעיתון על המאמר, הנה דוגמה (ותודה לאור ברקת על העדכון):

עדכון 2: העלילה ממשיכה להסתבך, כשהמגיב "אחד שמרפרש" מוסר שאתר הארץ הוא זה שאחראי לסכימת הצבעים המקורית, שנלקחה מאוחר יותר ע"י עמוד הפייסבוק של מרצ. הארץ עדכנו בהמשך את הצבעים, בעוד מרצ עדיין עם הצבעים המקוריים, ואני לא בטוח שפייסבוק יאפשר להם בכלל להחליף את התמונה בלי לאבד את הסטטוס (ו-300 הלייקים ו-50 השיתופים, בשעה זו)

ממוצעים מרודדים בניו יורק וקליפורניה

פורסם בתאריך 3 בדצמבר 2013 על ידי אבנר שחר קשתן

הנה האינפוגרפיקה התורנית שאני רואה בשעות האחרונות מכל מיני מקומות, כשהנושא הפעם הוא היחס בין שכר הדירה הממוצע למשכורת המינימום, גרף שהוכן ע”י ה-National Low Income Housing Coalition, גוף חוץ-ממשלתי שפועל למען דיור בר השגה:

התרשים עצמו עשוי בסדר גמור, עם בחירת צבעים סבירה שנשארת על אותו ספקטרום אבל עדיין מעבירה את ההבדלים. הוא סובל מאותה בעיה שכל אינפוגרפיקת מפה סובלת ממנה כשמדברים על ארה”ב – שמדינות הצפון-מזרח כ”כ קטנות וסבוכות אחת בשניה, בעיקר אזור ניו אינגלנד, כך שאנחנו מאבדים את המפה וזה הופך להיות פשוט רשימה של ערכים צפים באוקיינוס האטלנטי, אבל אין מה לעשות, ובסופו של דבר יש מעט שהאינפוגרפיקה יכולה לעשות לגיאוגרפיה.

אבל הבעיה הראשית של המפה הזו היא דווקא לא בעיות התצוגה שלה, אלא העובדה שזו אינפוגרפיקה פשוטה, יעילה ואפקטיבית. היא מעבירה את המסר שלה, שהוא שבמדינות רבות, בעיקר לאורך החופים, כמעט בלתי אפשרי לשכור דירה בלי לעבור 80, 100 ואפילו 136 שעות בשבוע(!) אם אתה מרוויח שכר מינימום. הבעיה כאן היא לא בהעברת המסר, אלא איך הבחירה באינפוגרפיקה הזו מרדדת ומשטחת את המסר.

קחו לדוגמה את אותה פינה קטנה בצפון מזרח:

מדינת ניו יורק היא בין המקומות היקרים לגור בהם, על פי המפה. אבל אני הוספתי את הנקודה האדומה הזו שמסמנת את העיר ניו יורק, התפוח הגדול עצמו. די ברור שדירה במנהטן תהיה יקרה יותר מאשר בקווינז, שבתורה יקרה יותר מאשר מקומות רחוקים יותר. קליפורניה יקרה מאד, אבל הדגש הוא על סן פרנסיסקו, על עמק הסיליקון – לא על עיירות לאורך הגבול עם נבאדה או ב-Death Valley. בין פלורידה לאלבמה יש הפרש גדול ביוקר המחייה, אבל ככל הנראה לא יהיה מאד יקר לגור בצפון פלורידה, באזור ה-panhandle, ליד הגבול עם אלבמה. ועוד לא דיברנו על ההבדל בין לגור בלאס וגאס ללגור בכל מקום אחר בנבאדה.

כל מה שיש לנו כאן זה ממוצע, ממוצע שמסמן את ניו ג’רזי כיקרה, ואת אוהיו כזולה. את ניו מקסיקו המדברית כזולה, ואת נבאדה המדברית לא פחות כיקרה. וזה לא שהנתונים הללו לא נכונים – הם כנראה כן (אם כי לא בדקתי, אבל לא זו המטרה שלי כרגע). אלא שאם המטרה שלהם היא להגיד “אם אתה מרוויח שכר מינימום, לא תוכל לגור בקליפורניה אלא אם אתה משפחה של שני מפרנסים שעובדים מעל 65 שעות בשבוע” היא פשוט לא נכונה. זה שהיא נכונה בממוצע לא אומר שהיא נכונה במקרה הפרטי. בפאלו אלטו, בלב עמק הסיליקון, שכר הדירה הממוצע לדירת Two Bedroom הוא 3500 דולר (437 שעות עבודה בשכר מינימום, או כ-110 שעות בשבוע), אבל בבייקרספילד שכר הדירה הממוצע הוא 830 דולר, קצת יותר מ-100 שעות עבודה בחודש, או 25 שעות בשבוע שהולכות לשכר דירה. בייקרספילד היא לא חור נידח (350 אלף תושבים, הרבה מקומות עבודה), אבל אפשר לחיות שם גם עם משכורת מינימום ועדיין שישאר לך כסף לנשום. סקרמנטו היא בירת קליפורניה, עיר בת 2.5 מיליון תושבים, שעה נסיעה מסן פרנסיסקו, ועדיין שכר הדירה הממוצע שם הוא כ-900 דולר לחודש.

אבל כמובן, גם על הנתונים שלי אפשר להפנות את אותה ביקורת. “900 דולר לחודש זה בטח דירה רק באזורים מסוימים בסקרמנטו, לא בעיר כולה!”. וזה נכון. אין לי ספק שיש דירות פאר ויש דירות של עוני, גם בתוך העיר עצמה. אבל בשלב מסוים זה כבר לא משנה. אם אתה גר בסקרמנטו, לא משנה איפה, אתה יכול להגיע לכל מקום בסקרמנטו לצורכי עבודה, לימודים או בילויים. זה כבר לא חסם למגורים בעיר הזו, ובטח שלא במדינה כולה, כפי שהגרף המקורי מציג.

זה לא שאין בעיות אמיתיות של עוני, של קושי למצוא קורת גג. אבל הבעיות הללו הן נקודתיות יותר, ולהסתכל על הממוצע של מדינה שלמה מטשטש ומרדד אותה למדד כללי, שאולי שימושי לכלכלנים ואנשים ממשל, אבל לא בהכרח למה שהאנשים שמשתפים את המפה בפייסבוק חושבים.

שקרים יפים, מפורקים

פורסם בתאריך 6 בנובמבר 2013 על ידי אבנר שחר קשתן

זאק ווינר, הכותב והמאייר של קומיקס הרשת המשובח Saturday Morning Breakfast Cereal, נתן היום דקונסטרוקציה נהדרת של הרעות החולות של אינפוגרפיקות, בדיוק הדברים שעליהם אנחנו כותבים (או לא כותבים, כן?) כאן בבלוג.

אני לא אכניס לכאן את כל הסטריפ, גם כי הוא גדול וגם כי מגיע לווינר שאני אשלח את הטראפיק אליו, ולא אשאיר אותו כאן, אבל אקדים רק ואגיד שכל אחת ואחת משש הנקודות שלו מדויקות, ועלו כאן בבלוג לא פעם – החל מנתונים נכונים אבל שלא באמת אומרים משהו, בחירה במקורות מוטים או לא אמינים, והחביב עלי מכל – בחירה בצורת הגרף הלא מתאימה, כמו עוגה כשהיינו יכולים להשתמש בעמודות, גרף טבעת כמעט בכל הזדמנות אפשרית, או גרפים שאין להם שום משמעות בכלל: