הסטטיסטיקה נותנת לאיראן בראש

הסטטיסטיקה נותנת לאיראן בראש

בואו נעשה ניסוי מעניין: כדאי לא  לדלג, זה ייקח חצי דקה! רשמו לפניכם סידרה של 20 מספרים תלת ספרתיים בצורה אקראית ככל האפשר. שימרו את הרשימה בצד, מייד נשתמש בה.

 

אני מרמה? זה הכל ישראל

לכולם ברור שתוצאת הבחירות באיראן זויפו. אחמדיניג'ד זכה ליתרון עצום באזורים שבהם  האוכלוסייה מתעבת אותו, ובמקומות שבהם האופוזיציה עמדה לזכות ברוב  גורף חסרו (כמה מפתיע) פתקי הצבעה. אבל האם ניתן להיעזר בסטטיסטיקה כדי לחשוף את ההונאה? כנראה שכן.
במאמר שהתפרסם לאחרונה בוושינגטון פוסט מצביעים מומחים על העובדה הבאה: כאשר בוחנים את רשימת מספרי הקולות שנספרו  ב-116 הפרובינציות (כפי שפורסם על ידי וועדת הבחירות) ובודקים את הספרה האחרונה בכל מספר, מגלים שלא כל הספרות (9..0) מופיעות באותה שכיחות. מה זה אומר?

בניגוד לספרה הראשונה שמייצגת את סדרי הגודל של האוכלוסייה שהצביעה, הספרה האחרונה אינה אמורה לייצג דבר, ועל כן היינו מצפים שתהיה שם התפלגות אחידה פחות או יותר. למשל, אם ניקח רשימה אקראית של 1,000 מספרים נצפה שבערך 100 מהם יסתיימו בספרה 1, 100 יסתיימו ב-2 וכן הלאה. כמובן שיש רעש סטטיסטי ולכן נקבל מספרים קצת גדולים או קטנים מ-100, אבל אם ספרה מסוימת  תחזור 170 פעמים הדבר יעיד בהסתברות גבוהה למדיי שהסדרה אינה אקראית באמת.
כאשר מנתחים את המספרים מאיראן מקבלים בדיוק את זה. הספרה 7 מופיעה בשכיחות של 17% בעוד שהספרה 5 מופיעה בשכיחות של 4% בלבד. כעת בדקו את רשימת המספרים שלכם. כמה מהם מסתיימים ב-7? כמה מסתיימים ב-5? אם המספרים שלכם אקראיים, כל ספרה צריכה להופיע בסוף פעמיים פלוס מינוס. מן הסתם נוכחתם שלבן-אנוש מאוד לא פשוט לייצר סדרה אקראית 'אמיתית'.
דוגמה נוספת: כאשר  נתנו לקבוצת אנשים לבחור מספר אקראי בין 1-20 בניסוי הזה, המספר 17 התקבל ב-18% מהמקרים והמספר 7 ב-12% : ביחד 30%, שהם פי 6 (!) ממה שהיה מתקבל אילו מחשב היה מבצע את הבחירה באקראיות לא מוטית. עד כמה שזה ישמע מטופש, 17 עבורנו הוא יותר 'אקראי' ממספרים אחרים.

בגרף רואים את הטיית התפלגות הספרה האחרונה במספרים מאיראן (כחול) לעומת התפלגות של סדרה 'אקראית' שהייתם ממציאים (ירוק).  אם משמרות המהפכה אכן ניסו לפברק תוצאות, מאוד סביר שהספרה 7 תופיע בסוף המספרים שלהם ביותר מ-10% מהמקרים. למעשה, החוקרים חישבו ומצאו שהסיכוי לקבל סדרת מספרים אקראית כמו זו שהתקבלה בבחירות באיראן הוא פחות מ- 1/200  (חצי אחוז).
בניגוד לאמרתו של מרק טווין ש: "יש שלושה סוגי שקרים: קטנים, גדולים וסטטיסטיקה" נראה שכאן הסטטיסטיקה דווקא עוזרת לחשוף את השקרנים (בהסתברות של 99.5%)
 
באותו עניין:
המאמר ב-Cognitive daily שעליו התבססתי.
מארק טווין בעצם לקח את הרעיון מד'יזראלי שאמר: Lies, damn lies and statistics 
מדריך לטרמפיסט בסטטיסטיקה – בלוג מעניין בנושא סטטיסטיקה מתמטיקה ועוד.
ללמד סטטיסטיקה במקום חדו"א!

תגיות:

להגיב על ניצן לבטל

האימייל לא יוצג באתר. שדות החובה מסומנים *

כתיבת

  • 2 מחשבות על “הסטטיסטיקה נותנת לאיראן בראש