לקרוא מתחת לפנס

האינפוגרפיקה החביבה הזו צצה לי בפייסבוק לאחרונה, וגררה הרבה תגובות – בעיקר מחובבי פנטזיה שמרוצים מכך שהז’אנר שלהם (בין אם נכליל בו את התנ”ך או לא) מככב ברשימת עשרת הספרים הנקראים ביותר בעולם. האינפוגרפיקה עצמה חביבה מאד –שימוש בשפה העיצובית של עולם התוכן, במקרה הזה מדף ספרים, בצורה שמשלבת גרף עמודות בצורה ברורה. יש לי קצת בעיה עם קנה המידה, שסובל כאן מבעיה הפוכה מזו הנפוצה של קיצוץ מערכת הצירים: המעצב בחר להתחיל את מערכת הצירים באמצע הגרף, בשביל שאפשר יהיה להכניס את שם הספר המלא, ורק אז להתחיל ולספור, וזאת בשביל שאפשר יהיה להכנס את השמות בנוחות בלי אילוצים של הגרף. אבל המשמעות כאן היא צמצום-יתר של ההבדלים בין העמודות השונות, כך שבפועל, אין שום הבדל גרפי בין מקומות 4-10, ורק שלושת המקומות הראשונים בעצם מקבלים משמעות שלא נובעת מהסדר של העמודות.

אבל הבעייתיות היותר גדולה כאן היא בנתונים עצמם, כמו שאפשר לראות מהדיונים סביב שני המקומות הראשונים, התנ”ך וספרו הציטטות של מאו, כשהטענה היא ששניהם ספרים שרבים יחזיקו בבית, אבל לא באמת יקראו. אני חושב שהבעיה כאן בסיסית יותר, והיא שהגרף בכלל לא מודד את מה שהוא מתיימר למדוד.

הגרף מתבסס על רשימה שפורסמה באתר Squidoo, שמתיימרת להתבסס על מחקר מעמיק (כי ככה הוא אמר!) לגבי היקפי הדפסה ומכירות של ספרים ב-50 השנה האחרונות. שני הנתונים הללו קשורים אחד לשני, ללא ספק, אבל הם לחלוטין לא מקבילים. מצד אחד, לא מפתיע שיש ייצוג יתר לתנ”ך – לא רק שהוא ספר שאנשים רבים ירצו בביתם בלי קשר לקריאתו, יש גם מיליוני עותקים של התנ”ך שמפוזרים בחדרי מלון, כאלה שמחולקים ע”י מיסיונרים, ועוד. ארגון Gideon’s מתהדר שמאז 1908 הוא חילק 1.7 מיליארד(!) עותקים של התנ”ך. כמה מהם בעצם נקראו? לא ברור.

ובנוסף לייצוג-יתר הזה של ספרים שמודפסים כדי שיחולקו, לא כדי שיקראו, יש לנו גם תת-ייצוג של ספרים בספריות ציבוריות ובספריות של בתי ספר. אם מאות מיליוני תלמידים קוראים שייקספיר כל שנה, איך הוא לא ברשימה? כי הוא ב-Public domain, ועותקים ישנים נמצאים בכל בית ספר, כך שהוא לא מודפס ונמכר כ”כ הרבה. ומה עם חנויות יד שניה? ומה עם ספרים אלקטרוניים? מה עם ספרים שעוברים מיד ליד? כל אלה לא נכנסו לחישוב.

שוב, זה ברור למה הנתון שנבחר הוא זה שנבחר. “נקראות” זה לא משהו מדיד, אלא אם תראיין כל אדם ברחבי העולם. אז אתה בוחר נתון שכן ניתן לכימות – כמות עותקים שהודפסו וכמות עותקים שנמכרו. וגם לנתונים הללו יש ערך. אבל אסור לבלבל ביניהם לבין “הספרים הנקראים ביותר”. ובטח שלא כמו שעורך המחקר עושה, לחשוב שיש קשר בין המצאותו של ספר ברשימה הזו, לבין היותו ספרות טובה.

4 תגובות בנושא “לקרוא מתחת לפנס

  1. "זה לא משהו מדיד, אלא אם תראיין כל אדם ברחבי העולם."
    גם זה לא מדוייק. תקבל הרבה תשובות מוטות כי "קניתי, אך טרם הספיקותי לעיין בו".

    אם תשאל אנשים, אחוז האנשים שיצהירו שהם קוראים "ספרות יפה" יהיה גבוה מהאחוז האמיתי.
    אנשים ייספרו גם ספרים שנחים על השידה ומחכים לתורם (שאף פעם לא יגיע, כי תמיד יש משהו יותר "מעניין") או שקראו את שני העמודים הראשונים לפני שנתיים "וכבר מסיימים", ספרים שהם מתכוונים לרכוש אבל "עוד לא יצא לי" וספרים שהם מצפים שיימצאו חן בעייני השואל או יעלה את ערכם בעייניו או בעייני עצמם.

    כך, כמובן, גם לגבי תוכניות טלוויזיה. כי כולם הרי צופים שעות בערוץ 8.

    • זה נכון. הרצון למדוד ע"פ נתוני הדפסה ומכירות מנסים, אני מניח, להתגבר על ההטיה המובנית הזו בראיונות, אבל הם כמובן נגועים בדיוק באותה בעייתיות בדיוק.

  2. וחשוב לזכור שגם הנתונים שכן נספרו כאן לא יכולים להיות שלמים כשמדובר בסקר עולמי.. נניח שמפרסמי המאמר באמת יכולים לקבל נתונים על כמה ספרים הודפסו ונמכרו בארצות המערב (זאת משימה קשה מאוד, אבל הוא הרי מבוסס על מחקר מעמיק).

    אבל האם הם באמת יכולים לקבל נתונים על ספרים שהודפסו בסין? בהודו? שהודפסו בבתי דפוס פרטיים כדי להיות מחולקים באפריקה?

    קוד דה וינצ'י הוא יצירה מוגנת בזכויות יוצרים. אפשר להניח בפשטנות שעל כל עותק חוקי שמודפס ממנו, צריך לדווח לבעל הזכויות, ויש תיעוד סביר של כמות העותקים ממנו בעולם.
    אבל את התנ"ך (ובאותה מידה, שייקספיר)כל אחד יכול להדפיס, ולהרבה מאוד גופים יש עניין להדפיס ולחלק בחינם.
    אני לא בטוח מה מעמד זכויות היוצרים של מאו, אבל מכיוון שמדובר בפמפלט תעמולה, אני מניח שגם המק"ס לא מתנגדת לכל ארגון שמדפיס ומחלק אותו.
    לא צירוף מקרים שספרים שמחולקים חינם מהווים 85% מכלל ההדפסות ברשימה הזאת.

    נשאלת גם השאלה כמה הוגן להשוות את ההדפסות של קוד דה וינצ'י מאז 1990 – חמש עשרה שנה לפני שיצא – ושל התנ"ך מאז 1990. אם יספרו את ההדפסות בחמשת השנים האחרונות, האם התמונה תשתנה? כנראה. סביר להניח שהתנ"ך יאבד 75% מהעותקים בעוד קוד דה וינצ'י לא יאבד ולו אחד.

    כמה כנסיות נפתחו מחדש ברוסיה אחרי נפילת השלטון הקומוניסטי?
    האם אפשר לכלול את החצי הראשון של שנות התשעים בניתוח הזה, בלי להחריג את התופעות המיוחדות לו?

    עשר דקות של תהייה (באמת? זה מה שאני עושה כבר עשר דקות?!), וכבר הרבה מאוד שאלות קופצות לעין…

סגור לתגובות.