ה-9.9% החסרים

אחד הנושאים הכי חמים בפוליטיקה העולמית בשנים האחרונות הוא סוגית ה-1% – או במילים אחרות, סוגיית פערי ההכנסה בין השכבות העליונות לשאר האוכלוסיה. הסוגיה הזו היא חשובה, אולי מהחשובות יותר בכלכלה והחברה של ימינו, אבל היא הולידה, לצערי, משפחה של גרפים בעייתיים שמציגים אותה.

הנה גרף שהתפרסם בעיתון ה-Economist לפני כחודשיים, שמציג תמונה היסטורית על פערי הכנסה בחברה האמריקאית:

image

אין לי בעיה עם הפרזנטציה של הגרף (שהיא גם אינטראקטיבית, והגרף הצבעוני למעלה נותן חתך של כל העשירונים באותו עשור), אלא עםם הנתונים שנבחרו להצגה בגרף התחתון: יש כאן בחירה של שני נתונים קיצוניים שלא מכסים את כל טווח הערכים – יש גרף של ה-0.1% העליונים, ושל ה-90% התחתונים. מה קרה ל-9.9% הנותרים? למה הם לא בגרף?

הם לא בגרף, אני מנחש, כי אם הם היו בגרף, הוא לא היה כל-כף יפה וסימטרי. מה היה קורה אם הוא היה מעמת את ה-0.1% עם ה-99.9% הנותרים? אז כנראה שהגרף הכחול, התחתון, היה שומר על פער נאה מעל החום. ומה אם היינו מעמתים את ה-90% עם ה-10% שמעליו? אז כבר מההתחלה החום היה נשאר הרחק מעל הכחול. ולמה 90%? למה לא 80%? אם העלמנו 9.9%, אפשר באותה מידה להעלים 19.9%, לא?

ומה אם הינו מציירים ארבעה קווים על הגרף, כמו ארבעת הצבעים שמעל? שמחלקים באופן מעריכי ל-90%, 9%, 0.9% ו-0.1%? אז היינו מקבלים יותר בלאגן, ואולי יותר תנודתיות , ולא היתה לנו את תנועת המלקחיים היפה הזו שמספרת את הסיפור שרוצים לספר, על אלפיון עליון עשיר שנהיה עשיר עוד יותר, ותשע עשירונים תחתונים שנהיים עניים יותר ויותר. וזה סיפור שלדעתי נכון לספר וחשוב לספר, אבל אולי כדאי, במקום לטפוח לקוראים על הראש ולהגיד “הנה סיפור יפה, לעסתי אותו בשביל שאתם לא תצטרכו”, אפשר היה להציג גם את הנתונים שלא מסתדרים הכי יפה, ולהאמין שהסיפור שלך חזק מספיק גם בלי להעלים נתונים.

ותוספת: הנה גרף נוסף, שקישרתי אליו כאן לא מזמן, עם בדיוק אותה בעיה – 90 + 0.1 ≠ 100

להבין דרך האצבעות

יש לי חיבה לא מוסברת לאינפוגרפיקות אורך. הכוונה שלי כאן היא לאינפוגרפיקות שלא מנסות לדחוס את המידע לגרף או שרטוט קטן ומדויק. במקום, הן מנסות לקחת דברים גדולים – עצומים, בלתי נתפסים בגודלם – ולהעביר חלק מהתחושה הזו של הגודל בכך שהם מכריחים אותנו לגלול למטה, ולמטה, ולמטה, כך שאפילו אם העיניים שלנו לא יכולות לתפוס סדרי גודל כאלה, אז לפחות העייפות באצבעות תעשה את העבודה.

הבאתי לפני כמה שבועות דוגמה טובה לאינפוגרפיקה כזו, שמתארת את הגודל של מערכת השמש., אבל הנה עוד אחת, מהוושינגטון פוסט, שמתארת את הקשיים במציאת שאריות המטוס המלזי בעזרת הדגמת העומק המטורף של קרקעית האוקיינוס.

image

האינפוגרפיקה (שמשתרעת על 16191 פיקסלים) שומרת, ככל שאני מצליח לראות, על יחס אחיד של המרחקים (של 1:1 פיקסל לרגל), ולא בחרו בקיצורי דרך, אלא מאפשרים להמשיך ולגלול דרך מסכים ריקים.

אני אוהב את האינפוגרפיקות הללו כי הן אפקטיביות. כשאנחנו רואים סתם השוואת גדלים אז אנחנו מקבלים, אמנם, תחושה של ההבדלים היחסיים בין דברים, אבל כשאנחנו גוללים ששה-עשר אלף פיקסלים למטה, זה מעביר את זה בצורה הרבה יותר פיזית, דרך הידיים.

קחו למשל את האינפוגרפיקה הזו, של מרחקים במערכת השמש. היא לא מתקרבת אפילו לשתי האינפוגרפיקות בפוסט שקישרתי אליו קודם:

בסופו של דבר ויזואליות זה חשוב וזה אפקטיבי. אבל לפעמים צריך לשלוח אנשים לעבוד.

“האינפוגרפיקה”, הוא אומר, “גדולה, באמת גדולה. פשוט לא תאמין עד כמה ענקית, עצומה ומהממת היא”

תפקידה של האינפוגרפיקה, כמו שאמרנו כאן בבלוג פעמים רבות, היא להעביר בצורה גרפית – במכה חזותית אינטנסיבית – את מה שמילים או מספרים לא יכולים להעביר, או לפחות יעבירו בצורה חלשה יותר.

אחד הדברים האלה שמילים לא מצליחות להעביר הוא את גודלו העצום, האימתני, הבלתי ניתן לתפיסה של החלל. כבר כתב על זה דאגלס אדמס, שידע לשלוט במילים יותר מרוב הסופרים שאני מכיר:

"החלל," [אומר מדריך הטרמפיסט לגלקסיה], "גדול, באמת גדול. פשוט לא תאמין עד כמה ענק, עצום ומהמם הוא. כלומר, אולי תחשוב שדרך ארוכה היא ממורד הרחוב עד לבית המרקחת, אבל אין זה ולא כלום לעומת החלל. שמע…" וכן הלאה. […] “אך לשם ההגינות, יש לציין, כי משהועמד לפניך גודלם העצום המוחלט של המרחקים בין הכוכבים, כשלו מוחות טובים יותר מהאחראים להקדמה של המדריך.”

מכיוון שהגודל הזה, המרחבים הבלתי נתפסים של החלל לא מועברים ממש ע”י מילים, אפילו מילים של דאגלס אדמס, אז האינפוגרפיקה באה לעזרתנו. ובצירוף מקרים נדיר, נתקלתי ביומיים האחרונים בשתי אינפוגרפיקות אינטראקטיביות שונות שמנסות לעשות את אותו הדבר בצורות שונות – והתוצאות בהתאם.

דחיסת קנה המידה

האינפוגרפיקה הראשונה נמצאת באתר ה-BBC, כחלק ממדור ה-BBC Future, ונקראת Space Race, או How Big Is Space. האינפוגרפיקה מאפשרת לנו לעבור (באופן לינארי) דרך נקודות ציון בחלל, החל מהאטמוספירה של כדור הארץ ועד לקצה מערכת השמש.

SpaceRace

ככלי לימודי, היא מאד מעניינת. למרות הבחירה הלא לגמרי ברורה לי שבה אנחנו יורדים למטה במורד העמוד ככל שאנחנו מתרחקים מכדור הארץ, היא מכילה המון נקודות ציון, בין אם נקודות טבעיות (המרחק מכוכבי לכת אחרים או תופעות קוסמולוגיות), מלאכותיות (מיקומם של לווינים או של ה-Voyager Probe) או נקודות ציון היסטוריות, כמו הגובה אליו הגיע האדם הראשון בחלל.

הבעיה הראשית שלי עם האינפוגרפיקה הזו היא שקנה המידה שהיא מציגה משתנה כל הזמן, בשביל להכיל את המרחקים ההולכים וגדלים בין נקודות הציון. אם בתחילת התהליך פיקסל אחד במסך מייצג מטר, אז תוך כמה גלילות זה קופץ למאה מטר, לקילומטר, וכן הלאה, עד שבשלב מסוים כל פיקסל מייצג מיליון ק”מ. זו אולי בחירה הגיונית אם המטרה שלנו היא להציג מה יש בחלל, אבל היא קצת מפספסת את הנקודה של להראות כמה החלל גדול. כי השינוי הלוגריתמי הזה מייצר מיצג שווא שבו המרחק בין כדור הארץ לירח (כ-10 לחיצות על page down, אצלי) הוא פחות או יותר כמו המרחק מהירח לשמש (גם כן כעשר לחיצות). כלומר בשביל להכניס עוד פריטי מידע, הוא ממסמס את הגודל הבלתי סביר של מערכת השמש.

גדול זה משעמם

האינפוגרפיקה השניה, לעומת זאת, באה במטרה המפורשת להראות את החלל כמו שהוא. היא נקראת “מה אם הירח היה בגודל של פיקסל אחד”, ובהתאם, היא קובעת קנה מידה אחיד – פיקסל אחד מייצג את היקפו של הירח (כ-3500 ק”מ) – וכל מערכת השמש מוצגת בקנה המידה הזה.

MoonPixel

התוצאה היא, כפי שמתואר בכותרת המשנה של האינפוגרפיקה “מודל מדויק באופן טרחני של מערכת השמש”. האינפוגרפיקה מאפשרת לגלול הצידה החל מהשמש והלאה, ומדגימה באופן מדויק עד כדי כאב עד כמה החלל הוא ג-ד-ו-ל. גדול, וריק.

כמה גדול? לוקח לי, על המחשב הנוכחי, כ-25 קליקים על ה-scrollbar התחתון עד שאני מגיע לכדור הארץ. כדי להגיע לצדק לוקח לי 110 קליקים. רוב הזמן מועבר בלראות מסך שחור עם ציון קטן של מרחק, ומדי פעם הערות על הריקנות. על המסך הנוכחי שלי (מסך 24 אינץ’ ברזולוציה של 1900×1200), מערכת השמש גדולה פי 886 מרוחב המסך כולו. כשבדקתי את זה על הטלפון שלי (מסך 5 אינץ’, ברזולוציה של 1900×1080), הוא טען שיקח לי מעל 5,000 דפדופים להגיע אל הקצה. נשברתי איפשהו באזור נפטון.

אז האינפוגרפיקה הזו ללא ספק מעבירה פחות מידע מאשר הקודמת. אין לה גשושות בחלל או לוויינים או אפילו אסטרואידים – כשפיקסל אחד הוא בגודל הירח, כל הדברים האלה קטנים מדי מכדי להכנס לתמונה. אבל כשאתה מדפדף הצידה, עמוד אחרי עמוד, קילומטר אחרי קילומטר, אתה בהחלט מצליח להבין קצת יותר את סדרי הגודל המטורפים של החלל, וכמה הוא ריק, לגמרי ריק.

הערות לסיום

האינפוגרפיקות הללו עדיין לא ממש מצליחות להעביר לנו את קנה המידה הפסיכי של החלל. אבל השניה נותנת איזשהו הדגמה של זה. הראשונה, לעומת זאת, קצת מפספסת את המטרה – אבל מצליחה מאד יפה להעביר מטרה אחרת.

ובנושא דומה, אני ממליץ על “על כתפי גמדים”, שהוא פודקאסט משחקי-התפקידים של ערן אבירם ואורי ליפשיץ, שם שודר לפני כמה שבועות פרק המוקדש לחלל (לכבוד שבוע החלל). גם אם אתם לא חובבי משחקי תפקידים יכול להיות מעניין להקשיב לפרק, שמתמקד בדיוק באספקט הזה של הגודל של החלל, ואיך הוא יכול (וצריך) להשפיע על סוגי הסיפורים שאפשר לספר על החלל.

לפעמים הטיה היא רק הדגשה

דובי קננגיסר, מיקירי (וכותבי) הבלוג, נתקל היום בכתבה (ישנה, אמנם) בויינט, והזדעק על הגרף שצורף אליה. ובצדק:

arab_hazbaa

הגרף הזה סובל מלא מעט מהבעיות שכבר דיברנו עליהן בעבר כאן בבלוג: קיצוץ בסיס הצירים כדי ליצור הדגשה של הבדלים, ולא סדר גודל אמין. הטעיות בוטות במיקום על מערכת הצירים – אחוז ההצבעה ב-1949 שעומד על 79%, נמצא נמוך יותר על הגרף מאשר ה-77% ב-1996. קפיצות לא פרופורציונאליות בין נקודות מידע שונות, גם בציר ה-Y (המרחק בין 83% ל-85% גדול ביותר מפי שתיים מהמרחק בין 82% ל-83%) וגם בציר ה-X (הציר לא מתקדם באופן רציף, אלא בקפיצות של בין שנתיים לארבע שנים).

אבל מה שמעניין, לדעתי, הוא הדיון שהתפתח בעמוד הפייסבוק של דובי סביב הגרף הזה, שבו הבחינו המשתתפים ברוב הבעיות שבגרף. הגדיל לעשות אחיעד גבריאל לוי והזין את הנתונים לאקסל כדי לצייר גרף עמודות אמין יותר, שזו הטכניקה המומלצת של הבלוג הזה כשהנתונים לא מסתדרים באינפוגרפיקה – מיד אחרי ספירת פיקסלים, כמובן.

הטיה כהטיה, הטיה כהדגשה

אבל חשוב מכך, אני חושב שבדיון עלתה אחת הנקודות החשובות בדיון על אינפוגרפיקה, והיא לשאול מתי הטיה היא הטיה, ומתי היא בחירה לגיטימית שמשרתת את הצגת האינפורמציה?

בתחילת הפוסט קישרתי לגרף שהוצג בערוץ Fox News שמקצץ את מערכת הצירים בגרף אבטלה בארה”ב כדי להפוך תנודה קלה לשינוי משמעותי. שם, לדעתי, יש מניפולציה ברורה והטיה מכוונת. אבל במקרים רבים יכולה להיות הצדקה לגיטימית לקיצוץ מערכת הצירים כשהדיון שהאינפוגרפיקה באה לשרת הוא סביב השינויים, לא סביב סדרי הגודל. אם אני אומר במפורש “בהינתן שלא היו שינויים עצומים בין נקודת המידע שלי, אבל מעניין אותי להסתכל על התנודות אז בואו נעשה zoom in”, זה לגיטימי לחלוטין להתמקד רק בחלק מהגרף. אבל כאן עובד קו עדין מאד בין אותו zoom in שממקד את הדיון, לבין צמצום השיח בצורה שמעלימה נתונים חשובים, או (גרוע מכך), מרמזת על נתונים שלא באמת נמצאים שם, כמו אותו גרף של Fox News.

איך מבדילים בין הדגשה לגיטימית לבין הטיה מניפולטיבית? לא תמיד יש הוכחות ברורות, אבל אחת הדרכים היעילות היא לדבר מפורשות על היעדים שלך. אם לגרף תתלווה פסקת הסבר בה יאמר כי “בגרף הזה בחרנו להתחיל את מערכת הצירים מ-18% כי הדגש שלנו הוא על התנודות”, אז שיתפנו את הקוראים בהחלטות שלנו, הנכחנו את השינויים שעשינו לגרף, וצמצמנו את המניפולטיביות שלו.

כל אינפוגרפיקה תמיד מנסה להעביר מסר, לא רק נתונים יבשים. תמיד יש מידע שמישהו בחר כן לכלול או לא לכלול, כן להדגיש או לא להדגיש. ולא צריך להתבייש זה – אחרי המסר הזה הוא הסיבה שאנחנו בכלל כותבים. אבל ככל שכותבי האינפוגרפיקה יהיו שקופים במניעים ובמטרות שלהם, כך האמינות שלהם תגדל. וככל שאנחנו נדע לקרוא אינפוגרפיקות, כך נוכל לדרוש מהכותבים שלהן את השקיפות הזו.

הצירים הנבחרים

באופן דומה גם הנושא השני שנידון בפתיל אצל דובי יכול להתפרש כהטיה או כבחירה לגיטימית. ציר ה-X, שכאמור מתקדם בקפיצות של מערכות בחירות ולא של שנים, יכול להתפרש כמה דרכים. דובי רואה בזה בחירה לגיטימית – שכן לא ניתן לצייר גרף רציף על אירועים דיסקרטיים שמתרחשים אחת לשנתיים עד ארבע שנים. נמרוד אבישר, מולו, גורס שהעלמת המרחקים האמיתיים בין הנקודות על הגרף מעלימה מידע, שכן תלילות הגרף בין הנקודות גם הוא מידע, והוא הולך לאיבוד – או, גרוע יותר, מציג מיצג שווא – כשאנחנו לא מייצגים את ציר ה-X כראוי.

שתי הגישות תקפות, אבל אנחנו חוזרים לשאלה של מה השאלה שהגרף מנסה להגיד, והאם לשאלת הזמן יש תפקיד כאן או לא. אם הוא לא רלבנטי, כפי שדובי מאמין, אז מוטב היה שהגרף היה מייצג את ציר ה-X לא בשנים, אלא במערכות בחירות (הכנסת השנייה, העשירית, וכו’), כי זו יחידת המידה שנבחרה לייצג את השינוי. אבל אם כבר בחרו לייצג בשנים, כנראה ראוי גם היה לרווח אותם בהתאם. הבחירה לא צריכה להיות בחירה אסטתית – יש משמעות לגרף שמוגדר ע”פ מערכות בחירות (אשר מתייחס, כנראה, למערכת הבחירות כיחידת ההתקדמות הרלבנטית ביחס של ערביי ישראל לבחירות), לבין גרף שמוגדר ע”פ שנים, שכנראה ינסה לטעון ששינויים רציפים לאורך העשורים, גם כשאינם קשורים ישירות למערכת הבחירות, הוא המדד הרלבנטי.

בכל מקרה אני מאד מרוצה מהדיון אצל דובי. לא במעט מכיוון שהם עשו כבר בשבילי את רוב העבודה, אבל גם כי הוא מציג כמה נקודות גישה שונות לקריאה, פרשנות וביקורת על אינפוגרפיקה. וכמה שיש יותר מזה, יותר טוב.

ביבי פחוס

אין דבר שמוציא מעורכי עיתונים דחף לגרפים יותר מאשר סקרי בחירות וניחושי מנדטים. ושום דבר לא אחר מוציא מעורכי עיתונים דחף כזה להטות תוצאות ולעוות תפיסות. גרף עמודות פשוט מספק כר מרעה עשיר למשחקים כאלה, כמו שכבר ראינו. אבל מעריב (או אתר האינטרנט שלו, nrg) סיפק לנו דוגמה יפה נוספת:

900

הסיפור של הגרף הזה ברור. יאיר לפיד נכנס למערכת הפוליטית וטורף את הקלפים, ופתאום המירוץ נהיה צמוד. קדימה יורדים מהמקום הראשון לשלישי, העבודה מתחזקת, ואפילו הליכוד נכנס כאן למירוץ. אבל האם זה באמת המצב? זה הזמן להכניס את אחד מכלי הבילוש המתוחכמים שבהם אנחנו כאן בשקרים יפים משתמשים לזיהוי תרמיות עדינות וזיופי בחירות. אני מתכוון, כמובן, לתוכנת Paintbrush שמגיעה עם חלונות.

מה העלנו בחכתנו, אם כך? ראינו שבעוד ארבעת העמודות הימניות שומרות על יחס של פחות-או-יותר 10-11 פיקסלים למנדט, העמודה של הליכוד עומד על כ-7 פיקסלים למנדט בלבד. כלומר ההישגים האלקטורליים של הליכוד הומעטו בהמחשה הגרפית, נדחסו ל-207 פיקסלים בלבד. אמנם מספר המנדטים מצוין במפורש, אבל הרבה יותר קל לנו לקלוט מידע השוואתי באופן גרפי מאשר במספרים. בשביל הרי נולדו האינפוגרפיקות מלכתחילה, לא?

כך הגרף היה נראה אם גם הליכוד היה נהנה מ-10.4 פיקסלים מרווחים לכל מנדט, שוב, תודות לכלי העריכה המתקדמים והמקצועיים שלנו (עדיין Paintbrush):

image

נותן תחושה קצת שונה, לא?

כל העניין הזה מצער, כי חוץ מהסיפור של דחיסתו של ביבי, הגרף די אפקטיבי. צבעים ברורים ובולטים, מספרים מסומנים בבירור, ושימוש בקריקטורות מזוהות + שם מפלגה צמוד לכל עמודה כדי שיהיה ברור מי זה מי. ואז מגיעה הדחיסה.

ולפני שיבוא איזה אפולוגיסט ויגיד שהגרף, במתכונתו המדויקת יותר, לא נראה טוב על העמוד עם הרבה שטח לבן מת ולכן היה צריך לדחוס את זה, אני אזכיר שהתפקיד של האינפוגרפיקה היא להעביר מידע, לא למלא שטח מת בעמוד. לדחוס עמודה בשביל קומפוזיציה יפה יותר זה כמו להשמיט את המילה “איראן” מכותרת כמו “איראן: בכיר בתכנית הגרעין חוסל בפיצוץ”. זה היה מונע מהכותרת לגלוש לשורה השניה, שזה דבר רע (כך לימדו אותי), אבל לא ממש לגיטימי, נכון?