| חגי אלקיים שלם |
הערב שלפני הבחירות היה דרמטי עבורי ועבור השותף שלי במיזם "הסקר השקוף", יונתן לזר-תלם: אחזנו בידינו קובץ נתונים של הסקר השני שערכנו במסגרת הפרויקט – אשר בוצע בימים האחרונים שלפני הבחירות לכנסת (בהם אסור לפרסם תוצאות סקרים באופן פומבי) – ויכול היה, בתיאוריה, לעזור לנו להבין מה קורה עם המצביעים המתלבטים, רגע לפני הרגע האחרון.
יממה וקצת לאחר מכן, עם פרסום תוצאות האמת, הבנו שני דברים עיקריים: סקר של 48 השעות האחרונות מסוגל אמנם להראות הרבה מאוד תנודות, אבל אין לו יכולת להציג את כל מה שקורה וגם לא לנבא בצורה יותר מדויקת את תוצאות הבחירות. כך או אחרת, התוצאות של הסקר מרתקות ואפשר ללמוד מהן המון.
אחרי שסיימנו את ניתוח הנתונים של הסקר השקוף, נערכנו מיד להוצאת הסקר השני: ההיערכות כללה שני שלבים: ראשית, החלטנו לשנות מעט את השאלון בסבב השני (במקום לשאול אנשים עד כמה הם בטוחים בהצבעה שלהם למפלגה שאמרו שיצביעו עבורה, שאלנו מתי הם קיבלו את ההחלטה להצביע למפלגה זו); ושנית, החלטנו, כלקח מהסקר הראשון, לבחור באסטרטגיית ניתוח נתונים מעט שונה כדי להתמודד עם פערי המדגם באוכלוסייה הערבית המבוגרת, באוכלוסיית יוצאי ברית המועצות המבוגרים שאינם דוברים עברית, וכן לתקן פערים אפשריים בדגימת האוכלוסייה החרדית המזרחית לעומת האוכלוסייה החרדית האשכנזית.
עבור המפלגות הערביות והחרדיות, בחרנו באסטרטגיית ניתוח דומה: חישבנו את שתי המפלגות החרדיות ושתי המפלגות הערביות כגוש אחד שלם, חילקנו ממנו 7 מנדטים לאחת המפלגות (יהדות התורה בגוש החרדי, חד"ש-תע"ל בגוש הערבי), ואת היתר "הענקנו" למפלגה השניה (ש"ס בגוש החרדי, חד"ש-תע"ל בגוש הערבי). הרציונל לאסטרטגיית הניתוח הזו התבסס על הדפוסים בתוך האוכלוסייה החרדית: כמו שמכר אמר לנו לגבי ההצבעה ליהדות התורה, "זה ספור". כלומר, מספר הקולות של יהדות התורה הוא נתון ידוע מראש ולא שאלה שיש לפתור, וסביר להניח שיתכנס מסביב ל-7 מנדטים – ולכן, כל קול עודף מעבר לאותם 7 מנדטים הוא כנראה תוצאה של ייצוג יתר לחרדים האשכנזים על פני החרדים המזרחיים. את אותה גישה יישמנו באותו אופן גם בתוך האוכלוסייה הערבית.
עבור האוכלוסייה יוצאת ברית המועצות, החלטנו להכפיל את התמיכה של מפלגת "ישראל ביתנו" בסקר, מתוך הנחה שעל כל משיב שאומר לנו שיתמוך בישראל ביתנו, יש מצביע נוסף שאנחנו לא יכולים לסקור.
בסקר השני נדגמו 617 ישראלים, בדגימת שכבות של החברה הישראלית. המדגם נערך על גבי פאנל משיבים אינטרנטי של חברת iPanel. גודל טעות הדגימה המירבית: 4%. הסקר נערך בשיטות סטטיסטיות מוכרות.
תוצאות הסקר השקוף השני
ניתחנו את נתוני הסקר השני באותו האופן שבו ניתחנו את הסקר הראשון, בתוספת השינויים שפורטו פה לעיל (ראו קופסה), ואלה התוצאות שראינו:
התגובה המיידית שלנו למראה הנתונים התחלקה לארבעה:
- תרחיש "המשתה הגדול" לגמרי הצליח בשמאל: "כחול לבן" הצליחה להביא את העבודה ומרצ קרוב מאוד לאחוז החסימה. לפי הניתוחים שהריץ יונתן, הדרך היחידה שגם מפלגת העבודה וגם מרצ עוברות את אחוז החסימה היא אם המצביעים שמתלבטים בין שתי המפלגות יתחלקו כמעט שווה בשווה, ולא "ינהרו" דווקא לאחת מהשתיים.
- לעומת זאת, בימין נראה שתרחיש "המשתה הגדול" לא ממש עבד: ומלבד "ישראל ביתנו", שגם לאחר גישת ניתוח מאוד "מפרגנת" עבורם עדיין לא התקרבו לאחוז החסימה, נראה שכל מפלגות הימין צפויות לקבל ייצוג בכנסת הבאה.
- אסטרטגיית ניתוח הנתונים שבחרנו עבור המפלגות החרדיות והערביות הביא את הנתונים שלנו להתאמה גבוהה יותר לנתונים ה"מקובלים" – ו"העביר" גם את רע"ם-בל"ד וגם את ש"ס מעל לאחוז החסימה.
- אחוז המתלבטים עדיין ענקי: קצת יותר מ-14% מתלבטים, לעומת קצת יותר מ-17% בסקר הראשון. כלומר, גם עכשיו, אחד מכל 7 משתתפים בסקר עדיין לא החליט למי להצביע פחות מ-48 שעות לפני ההגעה לקלפי.
דבר נוסף שהסקר השקוף השני אפשר לנו לבדוק הוא סיפור לאורך זמן: מתי התומכים של כל מפלגה החליטו לתמוך בה. בנינו מעין מפה שמציגה כמה מהמנדטים של כל מפלגה "הגיעו" אליה בכל שלב של מערכת הבחירות:
הנתונים האלה מספרים סיפור מרתק: למשל, על הליכוד שמתחיל את מערכת הבחירות עם כמעט 18 מנדטים, הרבה יותר מכל מפלגה אחרת, על יהדות התורה שאצלה כמעט ואין הפתעות (ואכן "הכל ספור"), ועל מרצ שמתבססת על בסיס יציב של 3 מנדטים ולא ממש מצליחה לצמוח הרבה מעבר לו במהלך תקופת הבחירות. וגם: על כמעט 16 מנדטים שכנראה פשוט חיכו לראות מי המועמד שהוא לא נתניהו הפעם, ונהרו בהמוניהם למפלגת "כחול לבן" מיד אחרי שהתברר שגנץ יוביל את המחנה – וכן על התחזקות מהירה מאוד של "כחול לבן", לעומת התחזקות מאוד איטית של הליכוד.
לא כל הנתונים האלה התבררו כנכונים עם היוודע תוצאות האמת, אבל הם מעבירים סיפורים מרתקים שמעולם לא דווחו לנו בתקשורת – סיפורים שניתן ללמוד עליהם בקלות ולבנות עליהם תילי-תלים של פרשנות. או, בקיצור, פספוס עצום של גופי התקשורת המסורתיים.
הסקר השקוף מול תוצאות האמת
עם חשיפת המדגמים, ובהמשך קבלת תוצאות האמת, יכולנו להשוות את הניבוי שלנו למה שקרה באמת. קודם כל, בואו נראה השוואה של תחזית הסקר השקוף הראשונה, תחזית הסקר השקוף השניה, ממוצע הסקרים של השבוע האחרון, ותוצאות האמת:
בגדול, ניתן לראות כמה מגמות עיקריות בהבדלים בין תוצאות הסקרים לתוצאות האמת:
- ייצוג החרדים הוערך בהערכת חסר עצומה: המפלגות החרדיות קיבלו בסקר השקוף השני ובממוצע הסקרים האחרון 11 ו-12 מנדטים בהתאמה, לעומת 16 מנדטים בתוצאות האמת.
- בצד השמאלי של המפה, הניבוי של הסקר השקוף השני היה קרוב מאוד לתוצאות האמת: "כחול לבן" התחזקה מעט, בעיקר בגלל מספר המפלגות שלא עברו את אחוז החסימה ושיטת חלוקת העודפים, בעוד שנראה שהמתלבטים בין העבודה למרצ בחרו בעיקר במפלגת העבודה (בניגוד לחלוקה שווה בשווה בנתונים שלנו).
- בצד הימני של המפה, נראה שהתחזית פספסה גם את המעבר העצום של 9 מנדטים ממפלגות הימין השונות (בעיקר הימין החדש וזהות) לליכוד, וכמובן, את ישראל ביתנו, שלמרות הכל עברה את אחוז החסימה.
- בסך הכל, הסקר השקוף השני ניבא 66 מנדטים לגוש הימין-חרדים, ו-54 מנדטים לגוש המרכז-שמאל-ערבים – הבדל מזערי מתוצאות האמת, עם יחס גושים של 65-55.
איך אנחנו מסכמים את פרויקט הסקר השקוף?
ראשית, בנוגע למודלים ו"טיפול" בנתונים: לא ציפינו להוציא את הסקר המדויק ביותר. ככל שהתקדמנו באיסוף הנתונים ובניתוח שלהם, הבנו – גם מההיכרות הגוברת שלנו עם הנתונים וגם מעצות שקיבלנו מעמיתים בתחום – שיש מגוון שיטות מתוחכמות יותר ופחות "לטפל" בנתונים כדי להתייחס לאוכלוסיות "נעדרות", שאינן מיוצגות כראוי בסקר. חלק מהשיטות האלה מוכיחות את עצמן (למשל, עם הדיוק הגבוה יותר של סוקרים מנוסים יותר בכל הנוגע למספר המנדטים של מפלגת "ישראל ביתנו"), וחלק פחות (אף סוקר לא התקרב לנבא את גודל ההישג של ש"ס). בחרנו בכוונה לנקוט בשיטות צנועות יחסית שדורשות מעט הנחות יסוד (למשל, חילקנו את המתלבטים שווה בשווה בין כל המפלגות שביניהן הם מתלבטים, בניגוד לרוב הסוקרים שבחרו לחלק אותם עם יתרון למפלגה כזו או אחרת), וברור לנו שעם קצת יותר ניסיון בתחום היינו יכולים לדייק מעט יותר ספציפית בנוגע לאוכלוסיות קשות לסקירה.
שנית, בנוגע להחלטות של הרגע האחרון: את הנתונים שאנחנו ראינו לגבי מפלגות "הימין החדש" ו"זהות", שעברו אצלנו את אחוז החסימה בפער משמעותי, ראו גם כל שאר הסוקרים בארץ. חלקם ניבאו למפלגות אלה רק 5-6 מנדטים, אבל כולם ניבאו שיעברו את אחוז החסימה. יש מי שבחרו להסביר את דפוס הנתונים הזה בבעיות דגימה, אבל בעיות הדגימה שעליהן מדברים (דגימת יתר של צעירים, למשל) הן בעיות שלא מאוד תואמות את המציאות. ההסבר הסביר יותר הוא שהשאלה "למי היית מצביע אם הבחירות היו מתקיימות היום" היא שאלה שמלכתחילה לא יכולה לנבא תזוזות של הרגע האחרון בין מפלגות קרובות: הרי הבחירות לא מתקיימות ביום שבו נערך הסקר, וידוע לנו שאנשים משנים את דעתם גם ברגע האחרון ממש, עם החלטה אחת בדלת אתר ההצבעה והחלטה אחרת מאחורי הפרגוד. על הידיעה הזו מתבססת ההשקעה הגדולה של מפלגות בנוכחות בשטח ביום הבחירות עצמו (כדי למשוך מצביעים ממפלגות שכנות), וההצלחה המרשימה של מפלגות שמצליחות להרים מערכי שטח אפקטיביים ביום הבחירות (למשל, יש עתיד ב-2013).
כאשר שאנשים מסוגלים לשנות את דעתם ברגע האחרון – לא מפתיע בכלל שיכולות להיות תנודות אדירות בתוך כל גוש פוליטי, גם בדקה ה-90 ממש. המשימה של כתבים וסוקרים, בהתאם, לא צריכה להיות לסקר את מצב הסקרים הנוכחי – אלא לאסוף נתונים שיאפשרו להעריך איפה יתקיימו תנודות דרמטיות כאלה ברגע האחרון. נתוני הסקר השקוף הראשון כבר הצביעו על כך שהימין החדש בסכנת מחיקה, פשוט בגלל אחוז מצביעי הימין החדש ששוקלים להצביע גם לליכוד. נכון, לא ראינו את אותו האפקט בקרב בוחרי זהות, אבל סיקור שהיה מתמקד בתופעה הזו עדיין היה מספק לנו הבנה טובה יותר של מה שקורה בשטח באמת.
שלישית, בנוגע לסקרים ב"תקופת ההאפלה", בארבעת הימים לפני הבחירות: נראה שהסקרים האלה מסוגלים "לראות" הרבה מהתזוזות שמפתיעות אותנו בסופו של דבר ביום הבחירות – כמו ה"שתייה" של קולות ממפלגת העבודה וממרצ אל תוך "כחול לבן" – אבל הם עדיין מפספסים חלק אחר מהתזוזות, המתרחשות ממש ברגע האחרון (לדוגמא התנודה של כלל הימין אל תוך הליכוד). האם זה טיעון לטובת או לרעת האיסור על פרסום סקרים בימים האחרונים לפני הבחירות? לדעתי האישית – אף אחד משניהם. סקרים יעצבו את קבלת ההחלטות של הבוחרים גם אם הם יפסיקו להתפרסם חודש שלם מראש, פוליטיקאים ימצאו דרך לעשות ספינים על סקרים בכל תצורה שהיא, והדבר העיקרי שישתנה בין תקופות איסור פרסום באורכים שונים הוא מידת ההפתעה שלנו מהתוצאות ביום הבחירות. בסופו של דבר, יש טיעונים טובים לכל הצדדים, ואם זה היה תלוי בי באופן אישי – הייתי מחליט לא להאריך את תקופת איסור הפרסום ולא לצמצם אותה.
רביעית, בנוגע לדיוק של הסקרים: לא משנה איך תסובבו את זה, ברמת הגושים הסקרים היו מדויקים מאוד, הטווח שלהם נע בין 63-57 לגוש הימין לבין 67-53 לגוש הימין, והתוצאות הסופיות נפלו בדיוק באמצע. כל הטענות על "יום הכיפורים של הסוקרים" צריכות לקחת בחשבון את הנתון הזה, ולהבין שהיכולת באמת לנבא איך השמאל או הימין יחלקו את הקולות שלהם תמיד תהיה מוגבלת מאוד.
ולבסוף, בנוגע לתפקיד של סקרים במערכת הבחירות: ראינו בפרויקט הזה כיצד החלטות שרירותיות יותר או פחות של הסוקרים מעצבים בצורה דרמטית את התוצאות, ויכולות לתרום גם לדיוק רב יותר (כמו במקרה של "ישראל ביתנו", למשל), אבל גם לפספוסים גדולים יותר (כמו במקרה של "זהות" ו"הימין החדש"). ראינו גם כמה עובדות מרתקות אפשר ללמוד מהסקרים: על איזו מפלגה מתחילה עם ה"בייס" הכי גדול והכי יציב, על איזה שיקולים מניעים הצבעה למפלגות שונות, על המתלבטים והאופן שבו הם יכולים לנוע, ועוד.
המסקנה? אנחנו צריכים לדרוש מהתקשורת יותר. ניתן לספר סיפורים מעניינים יותר על הסקרים, ניתן לסקר אותם בצורה שקופה יותר ומעמיקה יותר, וניתן לפתח מערכת יחסים בריאה יותר מול האמת שבסקרים והטעויות שלהם. אנחנו מקווים שהצלחנו להראות את הדרך האפשרית בנושא, ושהתקשורת הממוסדת תרים את הכפפה כבר במערכת הבחירות הבאה.
***
חגי אלקיים שלם הוא פסיכולוג פוליטי, יועץ אסטרטגי, עורך סקרים מקצועי ומנחה הפודקאסט "הספינר"; יונתן לזר תלם הוא סטטיסטיקאי מוסמך, עובד כחוקר נתונים בחברת הייטק ויוזם הפרויקט "הסוקר האוטומטי".
תגובה אחת
כולי תקווה שעד מערכת הבחירות הבאה נראה שעוד כלי תקשורת יקבלו השראה מהפיילוט הזה, ובאמת נראה עלייה ברמת השיח סביב הסקרים.
יהיה קשה להשלים עם המצב בו כלל כלי התקשורת לא מגיעים להעמקה של שני חוקרים צעירים ונמרצים בזמנם הפנוי…