האינפוגרפיקה הבאה התפרסמה ב"דה-מרקר" ביוני 2010. היא ראויה לתשומת לב בעיני למרות עתיקותה כי היא רעה באופן מקורי במיוחד:
הסיפור שהאינפוגרפיקה הזאת מספרת הוא ש"שבעה מיליארד אנשים צריכים הרבה מאד אנרגיה". הסיפור נבנה כך: הגרף מראה שהגידול בצריכת הנפט תואם בצורה כמעט מושלמת גידול באוכלוסיית העולם. כל אדם חדש מוסיף כמות קבועה לצריכת הנפט/אנרגיה. כל אדם צורך כמות קבועה של אנרגיה. כל אדם צריך כמות קבועה של אנרגיה. לכן אין דרך לצמצם בצריכת האנרגיה ממקורות פחמניים (נפט, פחם וגז טבעי) בלי " למצוא שלושה מיליארד מתנדבים שיהיו מוכנים להחזיר ציוד ולפרוש מהעולם" (המחיר של אנרגיה ירוקה – פגיעה ברווחה העולמית, דורון צור, דה-מרקר 20/6/2010). יותר על הסיפור הזה בעתיד. עכשיו אני רוצה להתרכז בתרשים עצמו.
לקחתי את נתוני הגרף, הכנסתי אותם לאקסל, וציירתי גרף בעצמי. תראו מה יצא:
סיפור אחר לחלוטין, אה?
מה שהשתבש פה הוא השימוש בתרשים מסוג אשכולות של עמודות כדי לתאר שתי סדרות מספרים שונות לחלוטין. העמודה הלבנה הראשונה מימין מייצגת ערך 87, והעמודה האדומה הסמוכה לה מייצגת ערך 6.8. הן בערך באותו גובה. זאת בעיה.
בגרף עמודות אמורים לבחור סקאלה פעם אחת. במילים אחרות, בוחרים גודל לעמודה אחת ומציירים את כל השאר בפרופורציה. אבל כאן יש שתי סדרות נתונים לא קשורות, ולכן חייבים לבחור סקאלה פעמיים: לבחור גודל לשתי עמודות, אחת לבנה ואחת אדומה, ורק אז לצייר את כל השאר בפרופורציה. זה משאיר למשרטט את הבחירה של "שנת ה-ש'", השנה שעמודותיה יהיו שוות, והבחירה הזאת יכולה להפוך את הסיפור שעולה מהגרף. בגרף של דה-מרקר, שנת ה-ש' היא 2005. בגרף שלי שנת ה-ש' היא 1965. הסיפור של דה-מרקר הוא על מתאם בין הגידול באוכלוסייה לגידול בצריכת הנפט, הסיפור שלי הוא על צריכת נפט שגדלה הרבה יותר מהר מהגידול באוכלוסייה.
לצורך השוואה, הנה גרף שבו שנת ה-ש' היא 2010:
הגרף המקורי של דה מרקר הוא לא שקר גדול יותר מהגרפים שלי. הבעיה היא בבחירת סוג התרשים. תרשים מסוג כזה מתאים להצגת סדרות נתונים תואמות: מספר לקוחות פלאפון לעומת מספר לקוחות סלקום. מחיר קילו תפוחים לעומת מחיר קילו תפוזים. במקרים כאלה הקשר בין העמודות הוא טבעי, ויש רק סקאלה אחת.
מה היה צריך לעשות במקרה זה? הנה שתי אפשרויות. הראשונה היא להציג את אחת מהסדרות בעמודות, ואת השניה בעקומה ((חדי העין שמו לב שבשני הגרפים הראשונים שלי חסרו ערכים על הצירים האנכיים. שימוש בגרף אשכולות-עמודות עם שתי סקאלות שונות הוא רעיון כל כך רע, שאקסל לא נותן לכם לעשות את זה. כדי לצייר את הגרפים הקודמים נאלצתי לבצע תעלולים, שבגללם גם נעלמו הצירים. עכשיו שחזרנו לקרקע בטוחה, אפשר היה להשיב את הצירים. מסתבר שלפעמים צריך לחשוב אם אולי יש סיבה טובה שאי אפשר לעשות משהו באקסל.)):
האפשרות השניה היא לשרטט את מה שבעצם מעניין אותנו: כמה חביות נפט צורך אדם ביום.
וכאן הגענו לבעיית אינפוגרפיקה קלאסית: גרפים יפים וגרפים שאופים. השרטוט האחרון נותן את המידע המדויק ביותר לגבי השאלה האם בני אדם צורכים כמות קבועה של נפט. מבט אחד מספיק כדי לענות (פחות או יותר, אבל רק מ-1985). אבל קשה לא להסכים שזה גרף משעמם. להחריד. הפיתרון המאוזן בין קצת עניין ויזואלי לבין הצגה נכונה של הנתונים הוא כנראה הגרף הקודם, המשלב עמודות ועקומה.
ועד כאן האינפוגרפיקה. אבל אחרי כל ההתעמקות הזאת בצורה, אנחנו נשארים אם שאלה פתוחה: כמה אנרגיה באמת צריכים 7 מיליארד בני אדם? והאם הפיתרון הירוק היחיד הוא העלמות של חצי מהאנושות? לשאלות האלה אחזור (בלי נדר…) בהמשך.
אני חושב שאם ננסה לזקק, בסופו של דבר, כמה כללי אצבע בסיסיים לקריאת אינפוגרפיקות, הראשון יהיה "חשוד מיידית בכל גרף בלי ערכים על מערכת הצירים". בטח ובטח כשזה גרף מורכב או רשימת גרפים מקושרים המתיימרים להציג השוואה בין נתונים, כמו שני הגרפים האחרונים כאן: http://www.globes.co.il/news/article.aspx?did=1000668120)
אוי.
אולי אנחנו צריכים מקום לאסוף דוגמאות כאלה, גם אם אין טעם לכתוב עליהן פוסט כי אין בהן שום דבר ממש חדש?
טוב, אני נאלץ לא להסכים כמעט עם כל הפוסט הזה.
ראשית, כפי שהגרף האחרון מראה די בבירור, כל "שנת ש'" שתיבחר, בין 1985 לבין 2010 תספר סיפור דומה מאוד, כיוון שכפי שציינת, הצריכה של חביות נפט לאדם היא קבועה בקירוב טוב מאוד לאורך התקופה כולה.
שנית, אם נניח שמדובר בתופעה שתחזיק מעמד (הצריכה הקבועה לאדם) הרי שהגרף האחרון לא באמת מעניין, למעט לצורך דיון היסטורי על מה קרה בסוף שנות הששים שהביא לזינוק ומה קרה בשנות השמונים שהביא לירידה קלה.
אלה דיונים מרתקים וחשובים כמובן, אבל הם לא העניין המרכזי כאן. הדיון החשוב הוא בשאלה מהי צריכת הנפט הכוללת כי זה מה שניצב בלב הבעיה שהכתבה עוסקת בה, אבל שרטוט של צריכת הנפט הכוללת בלבד הוא בעייתי כי הוא לא מספר לנו אם העלייה בצריכה היא תוצאה של עלייה בצריכה האישית או של עלייה באוכלוסיית העולם (או של עלייה בשתיהן).
הסיפור המלא, במקרה הנוכחי, מחייב את ההבאה של שני הנתונים גם יחד.
זה לא אומר שהסיפור הזה אכן מסופר היטב בגרף המקורי, אבל הוא גם לא מסופר בגרף האחרון. הוא כן מסופר בגרף הלפני אחרון, אבל לא באופן שהוא יותר ברור או יותר נכון מהגרף המקורי.
באופן כללי אני מתקשה להבין את הבחירה בעמודות כשהציר האופקי הוא ציר הזמן. נכון שהמידע שיש לנו הוא בדיד, אבל זה לא אומר שההצגה שלו צריכה להיות כזו או שנרוויח משהו מהצגה כזו שבעצם מטשטשת במבט ראשון את העובדה שמדובר כאן בתהליך רציף (וסביר להניח שכל אינטרפולציה שנבחר תהיה סבירה למדי, במיוחד בקצב השינויים שרואים כאן), ואכן, בניגוד לגרפים של עמודות, כשמדובר בעקומות אפילו מקובל למדי להציג גרף עם שני צירים אנכיים בעלי סקאלות שונות.
אני לא לגמרי מבינה את הביקורת שלך לגבי הגרף האחרון: אנחנו מסכימים שמה שמעניין פה הוא צריכת הנפט לנפש, וזה בדיוק מה שמציג הגרף האחרון.
באופן כללי, מה שניסיתי להגיד הוא לא שהגרף של דה-מרקר משקר, אלא שהוא מציג את הנתונים בצורה לא מתאימה שפותחת פתח לעיוותים.
חשבתי על זה הרבה.
אני עדיין מתקשה לקבל את הטענה שצריכת הנפט האישית היא הנתון החשוב כאן, אבל בעצם אני פשוט מתקשה לקבל את הטענה שאיזשהו נתון הוא משמעותי בהעברת המסר שהכתבה המקורית מבקשת להעביר (מסר שמעצבן אותי בפני עצמו אבל לא זה הסיפור כאן). נדמה לי שבסופו של דבר מה שהיה כאן זה מידע שקשור לנושא הכתבה ודחף לא נשלט להציג אותו גרפית, גם כדי לתפוס יותר שטח וגם כדי לספק חזות רצינית\מדעית לנסיון די מעצבן "לחנך" את הקוראים.
פינגבאק: כבר חשבתם שזה רק עניין חזותי, אבל מתברר שבכל זאת בילפו אתכם | שקרים יפים