העליה של הירידה

דונלד טראמפ, נשיא ארצות הברית בכבודו ובעצמו, פרסם את הגרף הזה לפני כמה ימים בחשבון הטוויטר שלו, עם הכותרת הצנועה, יחסית לטראמפ – "העליה בתעסוקה ממשיכה!". ועל פניו נראה שגרף אכן מראה עליה מרשימה בתעסוקה – 7.5 מיליון מועסקים חדשים לעומת שנת 2019! אמנם היתה ירידה בתחילה 2020, מה שברור, אבל עברנו את המשבר ויצאנו מנצחים!

מה, לא?

מה שאנחנו רואים כאן זה לא, כפי שאולי אפשר לחשוב בטעות, רמת האבטלה בארה"ב בשנתיים האחרונות (או, איך שהאמריקאים אוהבים לקרוא לזה, "יצירת מקומות עבודה"), אלא מראה את השינויים ביצירת מקומות עבודה בתקופה הזו, כלומר זו הנגזרת של הגרף האמיתי של סך המועסקים בתקופה הזו (ותודה ל-@eyal6699 על הניסוח המדויק)

כלומר, אם לאורך 2018 ו-2019 לא היו שינויים במספר המועסקים במשק (מה שנראה לי מוזר, אבל נעזוב את זה כרגע), אז אנחנו רואים בתחילת 2020 ירידה של עד 22.5 מיליון מקומות עבודה (כלומר, 22.5 מיליון מובטלים חדשים), ואז, באמצע השנה, עליה של 9 מיליון מקומות עבודה. אבל בניגוד לאינטואיציה, אנחנו לא נמצאים במקום גבוה יותר, אבסולוטית, משהיינו לפני הירידה של 2020 – אנחנו פשוט מראים שאחרי ירידה של 22.5 היתה עליה של 9, כלומר אנחנו עדיין במינוס 13.5 מיליון מקומות עבודה יחסית לנקודת ההתחלה שלנו.

רציתי לקפוץ לאקסל ולהכין גרף עם הנתונים האבסולוטיים, אותם רציתי לקחת מהאתר של Haver Analytics שמאוזכרים בגרף המקורי. אבל לשמחתי, האתר שלהם (שנראה כאילו עוצב לאחרונה ב-1998) כבר הכיל את הגרף הזה בעצמו:

large image

תמונה קצת שונה, נכון? ומאותם נתונים בדיוק. היא מראה התאוששות, אבל עדיין רחוק מלחזור למצב לפני פרוץ הקורונה. אבל עם הגרף של הנגזרת, הכל נראה הרבה יותר ורוד.

דיווחים מלטביה, ארץ נשות הענק

דורי, ידיד הבלוג מימים ימימה, הפנה את תשומת ליבנו לתרשים הזה שמסתובב לו באינטרנט כבר כמה שנים, שסובל מכמה בעיות די גדולות, אפילו מעבר לבחירה הקצת בנאלית לעצב גרף שקשור לנשים כשכולו בצבע ורוד.

Image may contain: text that says '5'7" 5'6" 5'5" Average Female Height per country 5'4" 5'3" 5'2" 5'1" 5'0" Latvia Australia Scotland Peru South Africa India'

הבעיה הראשונה שהגרף סובל ממנה הוא חביבנו הקבוע, קיצוץ בסיס מערכת הצירים. למי שעוד לא נתקל, הכוונה כאן היא שציר ה-Y לא מתחיל מ-0, אלא בעצם מגובה 5 פיט (שזה 1.52 מ'). משם והלאה המרחקים קבועים, אבל זה אומר שה"עמודה" השמאלית, שמייצגת גובה של 1.65 מ', גבוהה יותר מפי 4 מהעמודה הימנית, למרות שההפרש בין 1.52 מ' ל-1.65 מ' הוא פחות מ-10%. זה יוצר הקצנה של הפערים כשמתמקדים רק בראש מערכת הצירים.

אבל זה, בפני עצמו, לא כזה נורא. זה פשוט הסיפור של הגרף, להדגיש את ההבדלים בין מדינות שונות, וצריך גם לזכור שבחוויה האישית, הפרש של 13 ס"מ הוא מאד משמעותי. אבל כאן נכנסת הבעיה השניה של הגרף, שיחד עם הראשונה, מייצרת את הצרימה הויזואלית.

הבעיה השניה היא בחירה להחליף את העמודות הפשוטות בעמודות שמעוצבות כמו הסמליל הגנרי ל-"אישה". והבעיה עם זה היא שהסמליל הוא פרופורציונלי בין שני הממדים שלו. כלומר, כל שינוי בגובה, מחייב גם שינוי ברוחב בשביל לשמור על הפרופורציות. וזה אומר שכשאנחנו קובעים את גובה העמודה השמאלית כפי 4 מהגובה של הימנית, אנחנו גם מגדילים את הרוחב פי ארבע. ה-"עמודה" הלאטבית לא סתם גבוהה פי 4 מההודית, היא גם רחבה פי 4, ולכן גדולה, פרופורציונלית, פי 16 (וזה להפרש גובה ממוצע של כ-8%, כן?)

מעבר לזה שזה מעמיס ויזואלית על הגרף עם נשים ענקיות, זה מכניס כאן הטיה שאני אוהב ושאין לי שם טוב בשבילה, שבה כמות הפיקסלים שבה פריט מיוצג משפיע על הגודל הנתפס של הפריט, גם אם הפיקסלים הללו לא רלבנטיים לנתונים. ראינו את זה בפוסט האחרון, כשתרשים עוגה הגדיל גם את הגובה של הפלח בנוסף לשטח שלו, וגם בפוסט שלפניו על העוגה התלת-ממדית, וההטיה שהיא מייצרת בתפיסה החזותית שלנו. יותר פיקסלים, יותר חשיבות, גם אם הנתונים לא תומכים בזה.

ולסיום, דוגמה לאיך הגרף היה יכול להראות בלי הבחירה הזו. זו גם הזדמנות טובה איך הגרף יכול להראות כשמורידים את קיצוץ בסיס מערכת הצירים ולראות עד כמה הוא… לא מועיל, לא מעביר מידע ולא מספר סיפור:

וגם אותו הגרף כשאנחנו כן תוחמים את התצוגה לטווח הממוקד בין 1.50 ל-1.70, ומקבלים סיפור אחר, אולי מעניין יותר, אולי מוקצן יותר, אבל פחות מבלבל ויזואלית מאותן נשים ענקיות.