מאיזה ציר נתעלם היום? ציר ה-Y

לא כל יום אני יכול להגיד שנתקלתי בשני גרפים שונים שהוציאו ממני תגובה פיזית לא רצונית ומלמול של "מה לעזאזל?!". אבל אתמול בהחלט היה יום כזה, בזכות הגרפים ששלחו לי הדס ושי (תודה, הדס ושי!), גרפים שמראים באמת עד כמה נמוך אפשר לרדת עם התעלמות מוחלטת – או, אולי, מכוונת – מאחד המרכיבים הבסיסיים בכל גרף, והוא מערכת הצירים. בפוסט הזה נתמקד בגרף הראשון שמתעלם באלגנטיות מציר ה-Y, ובמקביל יתפרסם פוסט נוסף על התעלמות מציר ה-X.

לפוסט השני: מאיזה ציר נתעלם היום? ציר ה-X.

הגרף הזה פורסם ב-Ynet, בתוך כתבה ארוכה על בצלאל סמוטריץ', שר התחבורה היוצא, ופועלו במשרד. הכתבה לוותה באינפוגרפיקה הזו, אם אפשר לקרוא לה ככה, ואני בטוח שתוכלו בקלות להבין מה הבעיה איתה:

הרמז הראשון שעומדת להיות בעיה היא שבניגוד לציר ה-X (השנים), לא מסומן ציר Y על הגרף. אבל זה לא נורא, נכון? הרבה פעמים ציר ה-Y הוא implicit וקל להבין אותו מהנתונים. מה… רגע. מה קורה פה? אנחנו מתחילים ב-415, אבל אז יורדים ל-433. אולי ציר ה-Y יורד, משום מה? לא, זה לא הגיוני, כי אחרי שעלינו חזרה ל-346 (שנמצא בין 415 ל-433 מבחינת הגובה), אנחנו עולים ל-375. כלומר אין שום קשר בין העליות והירידות של הגרף לבין הנתונים שמוצגים בו. המספר הגבוה ביותר הוא 433, אבל הוא בערך האמצעי מבחינת הגובה בגרף. הנקודה הנמוכה ביותר, זו של 382, היא בין הגבוהות ביותר מבחינת הנתון. מה קורה כאן?

אז פניתי לחברי הטוב אקסל (או, לשם הדיוק, חברי הטוב החדש Google Sheets, פשוט בגלל שהמחשב החדש שלי מריץ לינוקס ואין לי אופיס), וזה מה שהנתונים יצרו לי:

גרף שטוח בהרבה, פחות דרמטי, ועם עליות וירידות במקומות הנכונים(!). זה גרף הרבה פחות מעניין, אפילו אם היינו מקצצים את בסיס ציר ה-Y. אבל המשכתי לתהות מה היה יכול לגרום ל-ynet לפרסם את הגרף הזה. אבל אז, אחרי קצת משחקים עם הפרמטרים של הגרף, הגעתי למשהו מעניין:

היי, מה זה פה? יש כאן את הצורה של הגרף של ynet, פחות או יותר! אולי הגרף כן הגיע מהנתונים, למרות הכל? מה קורה פה?

אז מה שקרה הוא שאני הגדרתי לגרף שציר ה-Y לא יהיה לינארי, אלא לוגריתמי. כלומר שבמקום להראות שינויים פשוטים במס' המתים בתאונות דרכים, הפכו אותו לגרף שמראה שינויים בקצב העליה או הירידה בתמותה. הבעיה היא שבניגוד לגרף הידבקות בקורונה, שאליו קישרתי כאן בתחילת הפיסקה, אין הגיון בגרף לוגריתמי אם אין לנו רצון להציג איך הקצב משתנה. זה חשוב כדי לעקוב אחרי התפשטות של מגיפה. פחות בשביל נתון עם תנודות קטנות יחסית ולא מצטברות, כמו תאונות דרכים.

אבל זה רק מסביר איך אפשר להגיע מהנתונים לצורה הזו של הגרף. איך זה מסביר את הירידות במקום העליות? ובכן, ככל הנראה מה שקרה הוא שבגרף של ויינט פשוט קיצצו, באגביות, נתונים שלא התאימו להם, והזיזו נתונים אחרים למקום שלהם בגרף. נקודת ההתחלה של ויינט? הגבוהה ביותר בגרף? היא מתאימה דווקא ל-datapoint השני, זה של 2008, שבו באמת היה את מס' ההרוגים הגבוה ביותר (ושבגרף שלי משום מה קוצץ בשולי הגרף, אבל לא נורא, עדיין מובן). אבל כנראה שהעורך היה מעוניין בגרף שמתחיל הכי גבוה שלו ומשם יורד, בין אם על מנת להעביר מסר מסוים, או כי זה נראה טוב יותר. בכל מקרה, זה גרם לכל הגרף לזוז הצידה על ציר ה-X, ולכל הנתונים להיות מפוספסים לחלוטין. אבל אם אנחנו מניחים שיש עוד נקודה מצד שמאל שבה מתחילים הנתונים, פתאום הכל יותר הגיוני. העליה מ-346 ל-375 היא מה שבגרף כתוב מ-433 ל-346. ואז יש לנו ירידה מתונה יותר ל-382 (הגיוני!), צניחה ל-290 – הכל פתאום מסתדר הרבה יותר טוב.

ומה לגבי ynet? אני לא יודע אם השינוי הזה נעשה בכוונה או בטעות, מתוך מטרה להטעות או חוסר הבנה של הכלי. מה שאני יודע הוא ש-24 שעות אחרי שראיתי את הגרף, הוא כבר לא נמצא בכתבה. הוא לא הוחלף בגרף טוב יותר. הוא פשוט כבר לא שם.

מאיזה ציר נתעלם היום? ציר ה-X

לא כל יום אני יכול להגיד שנתקלתי בשני גרפים שונים שהוציאו ממני תגובה פיזית לא רצונית ומלמול של "מה לעזאזל?!". אבל אתמול בהחלט היה יום כזה, בזכות הגרפים ששלחו לי הדס ושי (תודה, הדס ושי!), גרפים שמראים באמת עד כמה נמוך אפשר לרדת עם התעלמות מוחלטת – או, אולי, מכוונת – מאחד המרכיבים הבסיסיים בכל גרף, והוא מערכת הצירים. בפוסט הזה נתמקד בגרף הראשון שמתעלם באלגנטיות מציר ה-X, ובמקביל יתפרסם פוסט נוסף על התעלמות מציר ה-Y.

לפוסט השני: מאיזה ציר נתעלם היום? ציר ה-Y.

עדכון: משרדו של מושל ג'ורג'יה, דרך מנהלת התקשורת שלו קנדיס ברוס, פרסם התנצלות על הגרף שבמידה מסוימת גרועה כמו הטעות עצמה, או לכל הפחות מעידה על כך שלא היתה כאן טעות, אלא הטיה מכוונת שפשוט התפוצצה להם בפרצוף. האם זה יגרום להם, ולאחרים, להמנע בכך בעתיד? לא הייתי שם על זה כסף.

הגרף הזה פורסם באתר של משרד בריאות הציבור של מדינה ג'ורג'יה שבארצות הברית, ובא להציג… משהו שנוגע להיקף ההידבקויות בקורונה במחוזות השונים במדינה:

מה אנחנו רואים כאן, במבט ראשון? גרף די פשוט, ישיר מאד, שמסודר על ציר X של זמן וציר Y שפוי לגמרי, ללא קיצוץ מערכת הצירים. והוא מספר סיפור – כי זה הרי מה שאינפוגרפיקה עושה, לא? – סיפור ברור, ובריא, ויפה של החלמה וצמצום המגיפה.

רגע. האם זה באמת מה שכתוב שם? התעמקות קצרה בתוויות של ציר ה-X מראה לנו סיפור אחר. אחר לגמרי. ושאין שום דרך להצדיק אותו כטעות – בניגוד לכל הגיון אינפוגרפי או אחר, ציר ה-X לא מסודר לפני סדר כרונולוגי. כן, זה נכון. גרף שמציג נתונים על ציר זמן, אבל לא מסודר ע"פ ציר הזמן.

כתמיד, חשוב לחזור לשאלה הבסיסית – למה? למה הציגו לנו ככה את הנתונים? איך קרה שגרף כזה… קרה? וכאן יש כמה אפשרויות. הראשונה היא רשלנות בסיסית – אם הנתונים הוזנו, מראש, בטבלת האקסל (או google sheets, בסדר) שלא בסדר כרונולוגי, ואז הגרף נוצר אוטומטית מהנתונים כפי שהם, אז אולי היה מתקבל תוצר כזה. אולי. אבל זה עוד היה צריך לעבור דרך עיניים של גרפיקאי, של עורך תוכן. מישהו היה אמור לשים לב.

אפשרות נוספת היא פוליטית יותר. ג'ורג'יה היא אחת המדינות הבולטות בסיקור של מאבקי הקורונה בארה"ב, בין השאר בגלל ההתעקשות של הממשל הרפובליקני לחזור לפעילות כלכלית מלאה למרות אזהרות על הגברות ההידבקויות. בהקשר הזה, אפשר להסתכל על הגרף הזה כניסיון להראות מגמת שיפור מדהימה – ממצב של המון נדבקים, הגענו למצב של כמעט כלום. ניצחון! יש trend line ברור של התקדמות!

ישבתי חמש דקות עם MSPaint בשביל לסדר מחדש את העמודות בגרף, וקיבלתי משהו מוזר. הסיפור שהוא מספר הרבה פחות מובהק – אין כאן קו יורד ברור, אלא התחלה שקטה, זינוק, ירידה, ואז עליה מחדש (גל שני?) ואחריו ירידה.

אותם נתונים בדיוק, רק מסודרים ע"פ סדר כרונולוגי. אבל מה שמוזר לי הוא שהימים האחרונים בגרף הם עדיין מאד נמוכים (והם גם היו במיקום הנכון שלהם בגרף המקורי), מה שאומר שעדיין אפשר להסתכל על הגרף כסיפור הצלחה – אבל לא מובהק כמו שהיה קודם. בטח ובטח כשמדובר על שינויים לא קטנים בהפרש של שבועיים בלבד, מה שיכול להוריד את הביטחון של האזרחים בסיפור שמספרים לו.

וזה עוד לפני שדיברנו על התיאור של הגרף, שמתיימר להציג "מס' המקרים לאורך זמן", אבל גם "מס' מקרי המוות והאישפוזים". איפה כל אלה נכנסים לגרף? מה בעצם אומר המספר שאנחנו רואים? ובכן, זה סיפור אחר, ויסופר בפעם אחרת (או שלא).

עדכוני משרד הבריאות, חלק א': התאמת הכותרת לגרף, הגרף לקהל

בחודשים האחרונים, משרד הבריאות מצא את עצמו במרכז תשומת הלב התקשורתית, ובין השאר, מצא את עצמו אחראי על אינפוגרפיקות עם תפוצה חסרת תקדים ברשתות החברתיות, כשלחץ הקורונה שולח את כולם להתעמק בכל גרף הידבקויות או תוחלת הכפלת נדבקים. אבל בשבועות הראשונים, היכולות של המשרד בתחום של תקשורת ציבורית, ובפרט באינגפוגרפיקה, היתה… מוגבלת. בסיסית. בעייתית.

אבל אני שמח שאחרי חודש וקצת של עבודה, התוצרים של המשרד נהיו הרבה יותר מוצלחים ומלוטשים, בלי הבעיות שהיו בהתחלה של כיווני טקסט הפוכים, הסברים שחרגו מהמסגרות ופונטים בלתי קריאים, ועכשיו אפשר לדבר עליהם עניינית יותר, על האספקטים האינפוגרפיים של העדכונים שלהם. יש לי כמה דברים להגיד עליהם, אבל בשביל לשמור על מסרים חדים יותר, אני אקדיש פוסט נפרד לכל אחד.

בפוסט הזה אני אתמקד בגרף שבמרכז העדכון הזה, גרף הקו שכותרתו "קצב ההכפלה של מאומתים":

מה הכותרת אומרת לנו? שיש לנו גרף של קצב. קצב זה המהירות שבו משהו מחזורי קורה, וקצב גבוה – בין אם במוזיקה, בתקשורת נתונים, בקצב לב – הוא כשמשהו קורה מהר, נכון? זו הקריאה שלי, ואני חושב שהיא סבירה לרוב מי שיקרא את הגרף הזה.

אבל זה לא מה שהגרף בעצם מראה. הנתון המספרי הבסיסי שמוצג כאן הוא מספר הימים הדרושים כדי שמס' החולים המאומתים יכפיל את עצמו. כלומר, בנקודת ההתחלה של הגרף הערך הוא 29, כלומר מס' החולים יכפיל את עצמו בערך כל חודש. אבל בנקודה שבה לקחתי את התמונה הוא עומד על 719 – כלומר שיקח כמעט שנתיים להכפיל את כמות החולים. זה נתון חיובי בהרבה מה-29 שהיינו בו לפני חודש, אבל בגלל הכותרת, הקריאה הראשונית שלי של הגרף היא שקצב ההכפלה עולה – כלומר, יש חוסר הלימה בין הכותרת לבין מה שהגרף באמת אומר.

אני אעשה רגע הפסקה לאמירה כללית יותר, שאולי צריכה לקבל פוסט משלה והצמדה לראשית הבלוג: הרושם הראשוני מכל גרף או אינפוגרפיקה הוא קריטי. בטח ובטח כשמדובר באינפוגרפיקות בעיתון או בפרסומים לקהל הרחב. המסר צריך לעבור באופן ויזואלי ומיידי, או שהוא כושל כאינפוגרפיקה. אם אני צריך להסתכל על הגרף, לבדוק מה השנתות, מה הנתון, ורק אז להבין מה המסר הראשי, הכללי של הגרף, אז הוא לא. גרף. טוב.

אני לא אומר שגרף הוא רק המסר הראשי והמיידי. אני לא אומר שלא צריך להיות את המידע של השנתות והנתונים הנוספים והתובנות הנוספות שאפשר להבין מהגרף. ברור שהם חשובים, והתעמקות בגרף תתן לנו יותר מאשר הגרף הראשי. אבל אם המסר הכולל, ה-high level של הנתונים שלך ניתן לניסוח כ-"קצת ההדבקה ב-16.5 הוא איטי משמעותית מאשר ב-16.4", אבל הגרף שלך מראה גרף שעולה באופן מובהק – הסיפור שלך הולך לאיבוד.

הנה אותו הגרף, רק שהפכתי את כיוון ציר ה-Y כך שהגדלת מס' הימים בהלימה עם ירידת קצב ההכפלה (ותסלחו לי על עריכת הגרף הגסה, אין לי את הנתונים הגולמיים להכין את הגרף מההתחלה):

הנה. גרף שיש הלימה בין הכותרת שלו לבין הסיפור המיידי, הויזואלי שהוא מספר – הקצב יורד. היאח.

השאלה הבאה היא איך בכלל קורה שגרף כזה מגיע לעמוד הראשי של משרד הבריאות, למידע שיוצא לציבור. איך זה שאף אחד לא הסתכל עליו ואמר "רגע, זה הפוך, זה לא אומר מה שזה מתיימר להגיד". וכאן הבעיה, לדעתי, נובעת מהפער בין מי שמפרסם את המידע למי שצורך אותו. אני לא אפידמיולוג, ואני משתדל לא להציק לאפידמיולוגיים עם שאלות בנושא כשכבר יש להם קצת זמן לנוח, אבל אני לא אתפלא אם המדד הזה – מספר הימים הדרושים להכפלה – הוא מדד מקובל ושגור בפיהם. להעלות את המספר הזה זו המטרה, זה היעד. ברור להם שגבוה, במדד הזה, זה טוב, ולשם הם שואפים. אבל זה מה שיכול לגרום, לדעתי, לגרף כזה לצאת לציבור. אבל לציבור אין את ההתניה הזו שגבוה=טוב במדד ההכפלה, שהוא בכלל לא מדד הכפלה אלא מדד זמן בין הכפלות, ולכן הגרף הזה בעצם פונה לקהל של אפידמיולוגים, ולא לקהל הרחב. וזו טעות שרבים עושים, כשלא מבינים באמת את הפער בין מה שהמומחים מבינים, לבין הקהל שאליו מנגישים את המידע.

לא לינארי, לא לוגריתמי

יוני הפנה אותי לגרף הזה שהוצג (איך לא) בערוץ פוקס ניוז בארה"ב, שמציג את השינוי בקצב גילוי מקרי קורונה חדשים, כנראה במקום מסוים בארה"ב:

גרף קו עם ציר Y לא אחיד
דווח בטוויטר ע"י @MarekGierlinski

מה אהבתי בגרף הזה? שהעיוות בו סובטילי ולא קופץ מיד לעין, בניגוד לגרפים גרועים אחרים. מצאתם כבר את הבעיה? היא בציר ה-Y של הגרף הזה, שבמגוון גרפי ההידבקות הרבים (רבים, רבים) שאנחנו נחשפים אליהם יכול להיות ציר לינארי (כלומר, שהקפיצות של השנתות הן בגדלים קבועים, נגיד 10, 20, 30) או לוגריתימי (כלומר, שהקפיצות גדלות באופן אחיד, נגיד 10, 100, 1000). לשני סוגי הצירים יש שימוש שונה – הראשון יעביר את סדרי הגודל של כמות הנדבקים, השני יעביר את סדר הגודל של *קצב הגידול* בשינוי.

הגרף הזה, עם זאת, הוא… לא זה ולא זה. כלומר, הוא *כמעט* לינארי. והוא *נראה* כמו לינארי, אבל המרווחים בין השנתות לא קבועים. יש לנו 30, 60 ו-90 (קפיצה אחידה של 30), אבל אז פתאום… 100? קפיצה של 10 בלבד? מה המשמעות שלה? תאורטית, שינוי כזה יכול לייצר גרף עם קפיצה גדולה באופן מלאכותי – הקפיצה מ-60 ל-90 ומ-90 ל-100 תיוצג באותו גובה של הגרף וזה יכול ליצור תחושת גידול מזויפת. אבל במקרה הזה מיד חוזרים לקפיצות של 30… עד 190 שם יש קפיצה של 50, ואז שוב 10, ומשם קפיצות בגודל של 50.

אז למה זה טוב? זה ממש לא ברור. אם באמת היתה כוונה לייצר גרף שמעביר סיפור שונה מהנתונים האמיתיים, היה צריך לעשות את זה אחר לגמרי – כי הסיפור שהגרף הזה מספר הוא, בסופו של דבר, לא מאד שונה מגרף שבאמת מתואם עם ציר לינארי אחיד, כפי שמיד פורסם בטוויטר כתגובה לגרף הזה:

גרף קו עם אותם נתונים כמו הגרף הקודם, אבל כשציר ה-Y מצויר באופן אחיד
פורסם בטוויטר ע"י @mayhplumb

אולי הקפיצה בסביבות ה-200 נועדה להדגיש את הצניחה ב-29 למרץ? להדגיש את העליה ב-21 למרץ? לא ברור. אין כאן סיפור שעולה מהשינויים הללו. יכול להיות שכאן, כמו במקרים רבים בעבר, פשוט לקח עורך כלשהו את הגרף הראשוני שצויר ע"פ הנתונים, החליט שהוא לא מספיק יפה, חלק או אלגנטי, והלך ועשה בו שינויים משיקולים אסתטיים. ולעזאזל הסיפור של הנתונים.

כשנתונים חלקיים מייצגים פוקוס, לא הסתרה

אחד הגרפים המדוברים יותר בימים האחרונים, בסביבתי, הוא גרף הטבעת הזה, שהתפרסם בדהמרקר ב-24/03/2020, ומפלח את המיקומים בהם נדבקו חולים בקורונה בהדבקה קהילתית – כלומר, בהדבקה בתוך הארץ, במהלך חיי יום-יום שגרתיים:

Image

אני לא אכנס כרגע לשאלות של בחירת צבעים, או עצם השימוש בגרף טבעת. אני דווקא אתייחס לשאלה של מה לא מופיע בגרף הזה, כי זו שאלה שעלתה ברוב הדיונים שלי סביב הגרף הזה מאז שפורסם.

אז מה לא מופיע בגרף הזה? בניגוד למה שהשימוש בגרף טבעת מרמז – בכך שמדובר בכלל ההדבקויות – מדובר רק בחלק קטן יחסית מסך חולי הקורונה בישראל – כ-35%, ע"פ הכתבה. שאר החולים נדבקו בחו"ל (47% מהחולים) בביתם (5%) או ממקור לא ידוע (13%). למה זה משנה,כי אנשים התרעמו, ובצדק, שיש לנו גרף שמתיימר לתת פילוח של מקומות היבדקות, אבל כשהוא בוחר להתמקד ב-35% מהחולים בלבד, הוא נותן תמונה מוטה של החלק היחסי של מקומות ההידבקות הללו. תוך חמש דקות, יכולתי הרי לייצר את הגרף הזה:

אבל האם באמת הרווחנו כאן משהו? כלומר כן, הטבעת שלי מקיפה יותר נתונים, אבל אז אנחנו חייבים לעצור ולשאול את עצמנו מה בעצם השאלה שאנחנו שואלים, ולמה בכלל אנחנו עושים את האינפוגרפיקה שלנו.

נתונים, בפני עצמם, אינם מעניינים. נתונים לא קיימים בוואקום. כשאנחנו בונים אינפוגרפיקה, אנחנו עושים את זה כי אנחנו רוצים לספר סיפור כלשהו לקוראים שלנו, או כי אנחנו רוצים להוציא תובנות מהנתונים מתוך מטרה מסוימת. והמטרה הזו, והתובנות שאנחנו מחפשים, משפיעים ומכווינים לא רק את סוג האינפוגרפיקה שלנו, אלא גם את הנתונים שאנחנו בוחרים להכניס לתוכה.

אז אם המטרה היא לקבל תמונת מצב מלאה של מקורות ההידבקות, הטבעת שלי ללא ספק תשרת את המטרה טוב יותר. אבל אם המטרה שלנו היא להסתכל על הנתונים של הידבקות בקהילה כדי לקבל תובנות לגבי האפקטיביות של צעדי סגר ובידוד, ולקבל החלטות מושכלות לגבי המשך קיומם, אז הוספתם של 47% החולים בחו"ל לא סתם שלא עוזרים לנו, הם מייצרים רעש רב בגרף ומפריעים להבין איפה במרחב שלנו ישנה בעיה.

אז כן, כתבתי כאן פעמים רבות על הבעיה של קיצוץ בסיס הצירים כטכניקה שמעצימה הבדלים או נותנת לנתון אחד תחושה שהוא עצום, בעוד הוא רק טיפה יותר גדול מאחרים. וגם כאן, אפשר לראות שכשמוסיפים עוד נתונים אז ההבדלים בין בתי כנסת למלונות, נגיד, מרגיש קצת פחות דרמטי. אבל גם קיצוץ מערכת הצירים הוא כלי. כשהוא נעשה בצורה מושכלת ולא בהסתר, כפי שכתבתי כאן, אז הוא כלי אפקטיבי בלהדגיש את מה שאנחנו רוצים להדגיש בסיפור שלנו, ובמסקנות שלנו.

מנפלאות הזמן המעגלי

כבר זמן רב, רב מאד לא עדכנתי את הבלוג הזה. אבל אנשים טובים ממשיכים לשלוח לי – במייל, בפייסבוק ובטוויטר – אינפוגרפיקות מעניינות, מצחיקות או מזעזעות שהם נתקלים בהם. אחת כזו הגיעה אלי היום מתוך כתבה באתר של Atlassian, חברת המפתחת מוצרים לניהול פרוייקטי תוכנה, על ההיסטוריה של מקצוע "מנהל המוצר", היסטוריה עם כמה נקודות ציון משמעותיות לאורכה. איפה לאורכה, אתם שואלים? אה. גם אני עדיין שואל.

History of Product Management
מתוך What Is Product Management, אתר Atlassian.com, נשלף ב-24/02/2020

מה אנחנו למדים מהתרשים הזה? שב-1931 קרה משהו ראשון, שזה נכון – זה גם ראשון ברשימת המקרא מימין וגם… במרכז העיגול? לסמן התחלה? טוב, נו, בסדר. אבל מיד אח"כ אנחנו מתבלבלים. הדבר הבא בטקסט הוא בין 1943-1993, אבל הוא הנקודה הרביעית מהמרכז בתרשים. בשלב הזה אני לא בטוח איפה תשומת הלב שלי אמורה להיות, בטקסט או בתרשים. זה לא עוזר שהפריט הבא בטקסט, משנת 2001, הוא בנקודת הזמן האחרונה (אבל לא בשולי המעגל, שם יש גלגלי שיניים משוננים ומפחידים). אבל הפריט הבא חוזר אחורה, לשנת 1953 משום מה – וכאן בכלל אני לא יודע אם הוא אמור להיות לפני הנקודה השניה (שמסתיימת ב-1993), אחריה (כי היא מתחילה ב-1943), אוט איפשהו בתוכה, כי היא מייצגת טווח של שנים. ואז, כמובן, יש לנו את הנקודה האחרונה שאפילו לא מתיימרת להיות מדויקת.

הבחירה כאן בתרשים כלשהו לא ברורה בכלל, לאור העובדה שיש לנו מספר סוגים שונים של פריטי מידע (נקודות מדויקות בזמן, נקודות כלליות בזמן וטווחי זמן ארוכים). אבל אפילו אם נרצה תרשים, ההגיון אומר שנשתמש באחד מתרשימי ה-Timeline הרבים שכל כלי ויזואליזציה נותן לנו, כמו זה כאן, שעשיתי ב-Google Slides בשלוש דקות:

שימו לב ששמתי כאן רק את הנקודות הפשוטות שקל לשים על timeline פשוט. אבל כמובן שיש לנו גם תרשימים שמאפשרים להציג טווחי זמן חופפים די בקלות. אבל אטלאסיאן לא עשו אף אחד מהדברים הללו. הם שמו גלגל שיניים, העבירו בתוכו מעגלים פנימיים שמתאימים באופן גס מאד – מאד! – לשנים הרלבנטיות, ערבבו את סדר תצוגת הטקסט, והחליטו כי טוב. כנראה היה חסר להם מנהל מוצר טוב לאתר הזה.

אם אין להם מושג, שישימו עוגות

הקורא יואב (תודה, יואב) שלח לנו את רצף הגרפים הזה שהופץ בטוויטר, ומראה, כרגיל, שימוש מוטעה ומיותר לחלוטין בגרף עוגה, הגרף האהוב על עורכים שרוצים למלא פיקסלים על דף העיתון גם בלי שיהיה להם משמעות כלשהי.

רצף הנתונים הללו מראה את ממוצע השערים למשחק של שחקן כדורגל כלשהו (אני מניח), כשהסיפור שמנסים לספר, ע”פ הטקסט המצורף, הוא שאחרי ירידה בהישגים לאורך כמה עונות, השחקן חוזר imageלעצמו ולממוצע השערים שלו.

נעזוב שניה את העבודה שקשה לקבוע טרנד ע”פ רבע-עד-חמישית ממספר המשחקים המוצע לעונה, ונתמקד בעובדה שגרף עוגה הוא, כמו במקרים רבים, לא הגרף הנכון לסיפור הזה. גרף עוגה נועד להשוות בקלות בין כמה מרכיבים שונים שהם חלק משלם אחד. אבל כאן השוואה היא בין כמה עוגות שונות, מה שמקשה על הקורא להבחין באמת בהבדלים מעבר לרמה הגסה ביותר. אין לי דרך טובה להרגיש בעין עם 2016-2017 גדול מ-2017-2018, למשל. הגרף המתבקש והנוח להשוואה כזו הוא גרף עמודות פשוט, מסובב ב-90 מעלות כדי שילווה את הנתונים המספריים.

לא מסובך, נכון? אז מה גרם לעורך העיתון להחליט דווקא ללכת על עוגות? אני חושב שהגורם הוא הנתון שאותו הוא בא להציג, נתון שנראה, במבט ראשון, כמו נתון חלקי מהסוג שנרצה להציג בעוגה. הנתון הוא היחס בין השערים למשחקים – 8 מתוך 10, 17 מתוך 51, וכו’. “אה, מדובר על נתח מתוך כלל? אז זה גרף עוגה!” נעשה עוגה שה-100% שלה הוא ה-51, נדגיש את ה-17 מתוכו, ויש לנו עוגה!

אבל הנתון הזה, של ה-17/5/ או 19/52, הוא לא באמת נתון אמיתי. ה-17 שערים הם לא חלק מתוך ה-51 משחקים. זה לא שהמשחקים מורכבים משערים. הם פשוט משהו שקורה בתוך משחק. זה לא שונה מלהציג נתון של תאונות דרכים בחודש, נגיד, ולהציג גרף של “ב-10 חודשים מתוך 2017 היו 7 תאונות דרכים, אז נציג גרף עוגה שמלא ב-70%. ומה היה קורה אם השחקן היה מבקיע יותר משער אחד למשחק, בממוצע? איך היו מייצגים את זה בעוגה?

הנתון האמיתי שמדברים עליו הוא שיעור השערים למשחק. הוא יכול להיות פחות מ-1 או יותר מ-1, ואפשר להשוות אותו לשנים אחרות. אבל זהו. כל דבר אחר זה רק משחק עם ציורים.

כמה ון זה יותר מדי ון?

אני אוהב דיאגרמות ון. מי לא אוהב דיאגרמות ון? הנה, דיאגרמת ון, לא?

imageאז אתם יודעים מה? מסתבר שלא. זו לא ממש דיאגרמת ון. דיאגרמת ון, כך מסתבר, היא רק דיאגרמה שמחברת בין כל העיגולים שמשתתפים בה. אז שני העיגולים הלא נוגעים שם למעלה? לא דיאגרמת ון. דיאגרמה שבה יש עיגולים שלא חותכים עם כל העיגולים האחרים? לא דיאגרמת ון. מה אתם יודעים. אני הופתעתי.Venn diagrams vs Euler diagrams example using the card deck

אז מה הם כן, אם הם לא דיאגרמת ון? מסתבר שהם דיאגרמת אוילר (Euler), בעוד דיאגרמות ון באות להראות את כל החיתוכים וההצטלבויות האפשריים בין הקבוצות שמופיעות בתרשים, גם אם הן קבוצות ריקות, כמו הקבוצה של קלפים שחורים שהם גם יהלומים כאן, או של הקלפים השחורים שהם גם קלפים אדומים. או של קלפים שחורים שהם גם קלפים אדומים וגם יהלומים. דיאגרמת אוילר, לעומת זאת, באה להראות רק חיתוכים ויחסים שבאמת קיימים בנתונים שלנו – אם אין חיתוך בין קלפים שחורים ואדומים, אז העיגולים לא יחתכו. אם כל היהלומים הם גם קלפים אדומים, אז הם יהיו מוכלים בתוכם.

יותר מדי ון

אז מה בעצם אני רוצה ממכם, חוץ מלהתקטנן על טקסונומיות מדויקות של אלמנטים אינפוגרפיים? ובכן, כן, אני כאן בשביל להתקטנן על אלמנטים אינפוגרפיים (זוכרים איפה אתם?), אבל מעבר לזה, להגיד לכם שבזכות הגילוי הזה, העברתי הרבה מנאמנותי וחיבתי מדיאגרמות ון לדיאגרמות אוילר – הון של האדם השפוי. למה שפוי? בגלל דיאגרמת הן הזו שרצה לה באינטרנט בימים האחרונים:

עכשיו, זו ללא ספק בדיחה, אם כי אחת מושקעת, אבל שמראה את המגבלות של הפורמט הזה, של דיאגרמות ון. מה שנחמד בדיאגרמה הזו היא שאפשר היה לראות אותה גדלה ומתנפחת מיום ליום. זה התחיל פשוט, עם שלוש קבוצות:

Image result for venn diagram hands in the airכאן הכל עדיין לגמרי קריא. שלוש קבוצות + שלושה חיתוכים בין שתי קבוצות + חיתוך משולש = שבעה פריטים על הדיאגרמה, ואפשר להבין את הבדיחה. אבל האינטרנט, כידוע, לא יכול לתת לבדיחה טובה לשבת, ומהר מאד קיבלנו גרסה של ארבע:

Image result for venn diagram hands in the airכאן זה כבר מתחיל להיות לנו כבד וצפוף, כפי שהשינויים בגודל הפונט מראים. כאן כבר יש לנו 13 קבוצות שונות, ונהיה קשה להבין מי בעצם הוא חיתוך עם מי – I know you’re better than this זה של מטיפים, ושל.. רגע, דיג’ייז, ואז כנראה גם של האמא שמורידה סוודר לילד. אבל רגע, לא חסרים לנו חיתוכים בין שודדי בנק ומטיפים (בלבד) ובין אמהות ותקליטנים? אולי. לא יודע. בלאגן שם בפנים. אבל אז נחזור לגרסה של החמש שראינו קודם:

בכנות? אין לי מושג מה קורה שם ואני לא בטוח שיש לי כח להפריד את החוטים הסבוכים של החיתוכים שם. הבדיחה הבסיסית היא במחומש המרכזי המשותף, ברור. אבל כאן אפשר לראות שהמעצב הרגיש צורך להכניס צבעים בשביל להקל על פענוח התרשים. יש שם… 31 אפשרויות? אני לא בטוח. ללא ספק הרבה יותר מאשר בגרסה של ה-4. והצבעים לא לגמרי עובדים, כי מהר מאד השילובים של צבעי הפסטל הופכים לחום אפור ואין לך מושג ממש מה שייך למה.

דיאגרמת ון, בקיצור, נהיית *ממש* לא אפקטיבית בהעברת מידע אם יש לך יותר מארבע קבוצות. ברגע שהאינפוגרפיקה דורשת יותר מאמץ מאשר הנתונים הגולמיים, פספסנו משהו במטרה שלה. זה נכון שיש דרכים לשפר את הקריאות, וזה נכון שבקונטקסטים הנכונים, אתה יכול לצפות שהקוראים שלך יהיו מנוסים ומתורגלים יותר בפענוח התרשים, כמו למשל בתרימים כאלה של חפיפה של מאפיינים גנטיים בקבוצות אוכלוסיה דומות – הבחירה באליפסות במקום עיגולים, הצבעים החזקים וזוויות מקלים על מציאת ההקשר של כל מספר, אבל זה עדיין מורכב ומסובך.

A Venn diagram illustrating overlap of OTUs for nasopharynx, saliva, dominant hand and feces from healthy Chinese undergraduates. A total of 7916 OTUs were detected. Only thirty-seven OTUs were detected in all four habitats.

אז אני לא אומר לא להשתמש בדיאגרמות ון. ואני בטח ובטח לא אומר להמנע מבדיחות מבוססות דיאגרמות ון. אני רק אומר שלא למהר דווקא להשתמש בהם בשביל להעביר, באמת, מידע אמיתי בלי לחשוב על הסיטואציות שבהן זה מתאים.

ולסיום, כמובן, האינטרנט לא יודע מתי להפסיק.

 

מסרים צולבים

שר החינוך נפתלי בנט פירסם היום בחשבון הטוויטר שלו את הגרף הבא, עם ההאשטג “חינוך_בתנופה”, שבו הוא מתגאה בכך שבשנים האחרונות היתה ירידה במס’ ההולכים ללימודי משפטים, ועליה בלימודי הנדסה ומחשבים. אני לא אכנס לשאלה אם זה דבר טוב או לא, או מה כוללים הלימודים הללו (תארים אקדמאים בלבד? מכללות?) כי זה לא העניין כאן. העניין הוא, כמובן, הגרף, ומצג השווא הברור שהוא מנסה להעביר.

 

על גרפים מצטלבים כבר כתבנו לפני כמה שנים, ועל הבעיה הבסיסית שלהם – שהם מתיימרים להציג נקודה שבה נתון א’ “חצה” את נתון ב’, ולהתייחס אליו כהישג. בגרף הזה, נראה שהרגע הזה היה בין תשע”ה לתשע”ו (לא ברור בדיוק מתי, כמובן, כי לא ברור כמה נקודות-מידע יש, מה הרציפות שלהם, וכו’). מתישהו הצטלבו הגרפים, ויש לנו יותר תלמידי הנדסה מאשר משפטים. מה, לא?

הסוד בהטעיה הוא ששני הגרפים יושבים על אותו מרחב גרפי, אבל על צירים שונים. לומדי משפטים הם על ציר שבין 13,000-21,000, בעוד לומדי ההנדסה (פלוס מחשבים, כן? גם אלה שלא מקבלים תואר מהנדס, אבל נעזוב את ההטעיה הזו בכותרת) נעים על ציר שבין 43,000-51,000. כלומר גם אם הגרף האדום של המשפטים היה על החלק העליון של הגרף לכל אורכו, בעוד המשפטים היה על הקו התחתון, עדיין היה לנו פי שניים סטודנטים להנדסה (ומחשבים, וכו’) מאשר למשפטים. נקודת הפתיחה, שמראה כאילו יש יותר לומדי משפטים מאשר הנדסה (בכשליש(!) מגובה הגרף) היא מטעה, כי מדובר על כ-16,000 במשפטים לעומת כ-43,500 בהנדסה – כמעט פי שלוש.

אז מה באמת הנתונים אומרים? שהיתה לנו ירידה של כ-18% בלומדי משפטים (מ-16 אלף ל-13 אלף, ע”פ הגרף) ועליה של כ-16% בלומדי הנדסה (וכו’) (מ-43,500 ל-50,500, בהערכה גסה בעין).

ובינינו? זה לא מעט. לא יודע מה הגורמים, אבל שינוי של 15-20% תוך 5 שנים נראה לי לא מבוטל. הבעיה היא שזה לא הסיפור שהגרף מספר. הגרף מספר על הצטלבות, מהפך, שינוי העליונות מא’ לב’. זה הסיפור שגרף קווים מצטלב יודע לספר. אם היינו משנים את טווח הצירים להיות אחיד, היינו רואים משהו הרבה פחות דרמטי. אבל הדרמה זה העניין כאן, לא ההשוואה, הרי.

וככה זה היה נראה בגרף פשוט באקסל, בלי צירים נפרדים. הרבה פחות דרמטי, כמובן. וזה כשאני הדגשתי את ההבדלים ככל האפשר ע”י קיצוץ מערכת הצירים (ע”ע).

image

בין אבסולוטי ליחסי, בין נתח מהעוגה לנתח מהתמ"ג

אלאחרונה החלה להסתובב ברחבי האינטרנט טבלה שתומכת לכאורה בטענה של טראמפ שמדינות נאט"ו מטילות על ארצות הברית חלק לא פרופורציונלי מהוצאות הביטחון שלהן. הטבלה לקוחה מתוך פוסט באתר של פורבס שמתייחס לטענה. לטבלה הזו יש שתי בעיות (לפחות).

בעיה ראשונה

הטבלה לא מראה את שיעור המימון של נאט"ו על ידי המדינות החברות בארגון. למעשה, מה שהיא מראה הוא את שיעור ההוצאה לביטחון של מדינות אלה, בנתונים מוחלטים (מיליוני דולרים) וכחלק מן התמ"ג (התוצר המקומי הגולמי) שלהן. לנתון השני, החלק מן התמ"ג, יש משמעות (אסביר בהמשך מה היא), אבל שני נתונים אלה לא מראים את החלק היחסי של כל מדינה במימון של הארגון. הבחירה לתת את מרכז הבמה לסכום המוחלט של הוצאות הבטחון בהכרח יעלה את המדינות עם הכלכלה והצבא הגדולים יותר לראש הרשימה באופן לא פרופורציונלי, ולא יעביר את הנקודה שהוא מתיימר להעביר, שארה"ב תורמת באופן לא פרופורציונלי יחסית לגודלה.

בעיה שנייה

הטורים בשמאל הטבלה נראים נורא מרשימים, הם החלק הבולט ביותר בטבלה, אבל הם לא הנתון החשוב. הנתון החשוב מסתתר במלבנים הקטנים מימין, שהגודל של כולם זהה ורק המספרים בהם שונים – שיעור ההוצאה לביטחון כחלק מן התמ"ג.

וכך בריטניה מדורגת שנייה עם 55.2 מיליארד דולר שהם 2.1% מהתמ"ג, בעוד שיוון מדורגת במקום ה-12 עם 4.7 מיליארד דולר שהם 2.4% מהתמ"ג. ארה"ב, עם ההוצאה העצומה שלה והתמ"ג העצום שלה, נראית מובילה בפער ענק על השאר. אבל הפער בהוצאות המוחלטות בין ארה"ב לשאר המשתתפות מאד שונה מהפער בהוצאות היחסיות.

למה התמ"ג רלוונטי?

כדי להבין את זה צריך לזכור שהטענה של טראמפ לא חדשה, ממשלים קודמים בארצות הברית טענו טענה דומה. התוצאה הייתה שבשנת 2014 הגיעו מדינות נאט"ו להסכם שלפיו התחייבו עד שנת 2024 להעלות את הוצאות הביטחון שלהן ל-2% מהתמ"ג לפחות (ראו סעיף 14). כלומר, הדרישה של ארה"ב היא לא ששאר מדינות נאט"ו יסגרו את הפער בהוצאות הבטחוניות המוחלטות מול ארה"ב, מה שכמובן אין להן שום דרך לעשות. אלא שיעלו את ההוצאות שלהן יחסית לתמ"ג. הטבלה שלנו (שמתייחסת ל-2017) מציגה את המצב כאשר למדינות נשארו עוד שבע שנים לעמוד ביעד שלהן. הדו"ח של נאט"ו (זהירות, פד"פ) טוען שהן יעמדו ביעד הזה.

אם נבנה את הטבלה הזו מחדש, כשהפעם ניתן לאינפוגרפיקה המרכזית, הטורים, לספר את הסיפור האמיתי, זה של ההוצאה ביחס לתמ"ג, היא כנראה תראה כך:

מה השיעור האמתי של המימון?

ובכן, כדי לברר את זה אפשר לשאול את פי סוסי המלחמה של נאט"ו. באתר של נאט"ו אפשר למצוא נתונים על התקציב ולפיהם ארצות הברית תורמת כ-22% מהמימון הישיר של נאט"ו, אחריה גרמניה (14.7%) ובריטניה וצרפת (כ-10.5% כל אחת). כלומר ארה"ב תורמת מעט יותר מפי 2 מהמימון של בריטניה לארגון – בעוד שעל פניו, מהטבלה, עולה שארה"ב משקיעה פי 12 יותר.

כל אחד יכול להחליט אם השיעור הזה גבוה מדי או לא, אבל לפחות בואו נתבסס על נתונים רלוונטיים, ונבין מה הם הנתונים שמובאים בפנינו.