“ריאל מדריד הרבה יותר טובה ממכבי נתיבות והיא פייבוריטית לנצח הערב” אמר פרשן הכדורגל באולפן לקראת המשחק בין הקבוצות, “עם זאת דבר אחד עומד להם לרועץ: הם מעולם לא הצליחו לנצח את נתיבות אם המשחק התקיים בשבוע שבו נערכות בחירות לראשות העיר, והשבוע אכן מתקיימות בחירות כאלה”.
גם אם אתם לא חובבי ספורט אתם בוודאי מכירים נתונים כאלה, שנשמעים מורכבים מאוד, אבל אם חושבים עליהם רגע, מבינים שהם לא באמת הם מעידים על כלום. הרי כנראה ששתי הקבוצות לא באמת שיחקו הרבה פעמים אחת נגד השניה בזמן בחירות, ואין סיבה להאמין שהבחירות הללו ישפיעו על התוצאה. כשאנחנו שומעים נתון כזה, הרבה אומרים לעצמם: “אוי נו, עוד סטטיסטיקה מטופשת”. אלא שיש הבדל די משמעותי בין הציטוט של הפרשן לבין סטטיסטיקה, הבדל שרבים מאיתנו לא מבינים, והוא חשוב מאוד כדי להפנים מהי סטטיסטיקה בעצם. #מה_ההבדל ? טוב ששאלתם.
הציטוט לגבי אחוזי ההצלחה של ריאל מדריד בזמן הבחירות הוא לא סטטיסטיקה, בדיוק כמו המשפטים “ל-78% מהדרדסים יש כובע על הראש” או “אחד מכל מאה בני אדם סובל מסכיזופרניה”. אלו לא סטטיסטיקות, אלא נתונים, פריטי מידע. מטרתה של הסטטיסטיקה היא לעבד ולנתח את הנתונים, ולהסיק מהן מסקנות על העולם.
ההבדל הזה הוא מהותי, משום שבעצם כל נתון שנשמע יכול להיות חסר משמעות לחלוטין, אבל יכול להיות חשוב מאוד. סטטיסטיקה תעזור לנו לזהות למה מבין השניים הנתון עונה. כך למשל, באמצעות מבחן סטטיסטי נוכל לראות האם העובדה שריאל מדריד מעולם לא ניצחה את נתיבות בזמן בחירות היא באמת משהו יוצא דופן, או נתון שיכול לקרות גם באופן אקראי לחלוטין בהנתן מאזן הכוחות בין הקבוצות ותוצאות העבר.
לסטטיסטיקה יש מוניטין רע, בין היתר משום שהבלבול בין סטטיסטיקה לנתונים, גורם לרבים לחשוב שנתונים טיפשיים הם בעצם סטטיסטיקות. בעוד שבעצם ההפך הוא הנכון. לא רק שסטטיסטיקה היא לא אוסף של נתונים טיפשיים, היא גם הכלי שעוזר לנו לזהות האם הנתון שלפנינו הוא טיפשי או לא. אז מגיע לה קצת יותר כבוד מכולנו.
אני רוצה להודות לתומכי הפטריאון של הבלוג, ובראשם למתן רינג, עינבל רמות, מייקל קניגס, שרה עטיה, ותומר כהן, התומכים המובילים. אם התוכן עניין אתכם, אני מזמין אתכם להפוך גם לתומכים, לעזור ל”סיור מוחות” לצמוח ולקבל מגוון רחב של הטבות ותכנים בלעדיים, יכולת להשפיע על הנושאים וצפייה בפוסטים לפני כולם. פרטים נוספים כאן