כיצד בדקנו אלפי כותרות ב- 48 שעות?

עיתונות אזרחית פוגשת עיתונות נתונים - מאחורי הקלעים של בדיקת "העין השביעית" ו"קרן התחקירים" את סיקור נתניהו באתר "וואלה" • הירתמות של למעלה מ- 50 מתנדבים, במודל של עיתונות ציבורית, עמדה מאחורי הניתוח הכמותי של אלפי כותרות ראשיות בזמן קצר
שיתוף ב facebook
שיתוף ב twitter
שיתוף ב whatsapp
שיתוף ב telegram
שיתוף ב email

רוצה את מיטב הכתבות והתחקירים של שקוף ישירות לתיבה? פה נרשמים לניוזלטר:

שיתוף ב facebook
שיתוף ב twitter
שיתוף ב whatsapp
שיתוף ב telegram
שיתוף ב email

קח הטבות רגולטוריות בשווי מיליארד שקל, תן סיקור מיטיב באתר האינטרנט שלך. כך בתמצית מתארת המשטרה את חשדותיה נגד ראש הממשלה בנימין נתניהו ונגד איל ההון שאול אלוביץ', בעל השליטה בבזק ובאתר "וואלה". הטייה בסיקור יכולה להיות עניין מורכב וסמוי מהעין – למשל בהוראה על מה לא לכתוב או בצנזורה עצמית של עיתונאים, אבל הדעת נותנת שיהיה לה גם חלק גלוי – במה שכן התפרסם. כשמדובר בעיתון דפוס, קל יותר ללכת לספרייה ולבדוק את לפני הקלעים של הההטייה, אולם מה עושים כשמדובר באתר אינטרנט?

דפי האתר אמנם אמורים להיות זמינים, אך אין ערובה לכך שתוכנם לא השתנה או שנמחקו כליל. מעבר לכך, דפי הבית, המקבילה של דפי השער העיתון, אלו המהווים את חלון הראווה של האג'נדה הגלויה והסמויה, כלל אינם נשמרים מלכתחילה. על מכשלה זו התגברנו באמצעות מאגר הנמצא בידי "העין השביעית", ובו מתועדות כל הכותרות הראשיות באתר "וואלה" בחודשים שקדמו לבחירות לכנסת ה-20, תקופה שהדעת נותנת שתהיה קרקע פורייה להטייה פוליטית. במטרה לבחון את הטענות שנשמעו אודות הטיית הסיקור בוואלה לטובת ראש הממשלה, החלטנו לעבור ידנית על כל הכותרות ולבדוק את העמדה (סנטימנט) שהובעה בהן כלפי נתניהו ומשפחתו. האתגר נבע מהיקף החומר: כ-15,000 כותרות.

ההחלטה הראשונה והמשמעותית ביותר שקיבלנו הייתה לפנות למודל של עיתונות ציבורית (Civic Journalism) כדי לקטלג את הכותרות. לשם כך פנינו לתומכי "קרן התחקירים" ו"מאה ימים של שקיפות" וביקשנו מהם עזרה ב"סינון חומר הקשור לתיק 4000", עם דרישה להתחייבות לשעתיים של עבודה לכל הפחות. בתוך 24 שעות התנדבו למשימה למעלה מ-80 איש כאשר 50 מהם אכן השתתפו בפועל, בתהליך שהסתיים כולו בתוך שלושה ימים. בהזדמנות זו נרצה להודות לעשרות המתנדבים שתרמו מזמנם לפרויקט.

חלק קטן מתומכי קרן התחקירים

החלטה נוספת שהתקבלה בראשית הדרך היתה לצמצם את היקף החומר שיעבור סינון ידני, על-ידי התמקדות רק בכותרות שהופיעו בכל שעה עגולה ומחיקת כותרות שהופיעו מחוץ לשעות השיא (23:00 – 05:00). מהלך זה צימצם את כמות הכותרות פי חמישה. בנוסף, העברנו את הקבצים – שהיו בפורמט HTML ללא עיצוב – דרך סקריפט (שנכתב בידי מתנדב בעל מומחיות רלוונטית) שהפך אותם לפשוטים יותר לקריאה.

בשלב זה חולק החומר למקבצים של 100 כותרות. כל מקבץ נמסר לטיפולם של שניים או שלושה מתנדבים שונים, בכדי לאפשר השוואה בין התוצאות. לכל מתנדב נשלח מייל עם הנחיות זהות לסינון החומר (אותן תוכלו לקרוא פה) וכן המקבץ עליו הוא אחראי. המתנדבים התבקשו למלא טופס משוב בעבור כל כותרת שהתוכן שלה הובן בידיהם כ"פוליטי". במידה והכותרת עסקה בראש הממשלה נתניהו – גם להגדיר את הסנטימנט בה – חיובי, שלילי או ניטרלי.

הנחיות למתנדבי סינון החומר

בשל אחוזי ההשתתפות (60%), טעויות הזנה שנוקו ואלמנט של מקריות – כ-70% מהכותרות נסרקו לבסוף בידי אדם אחד והיתר בידי שניים או יותר. בעבור כותרות שנסרקו בידי אדם בודד, ביצענו דגימה של התוצאות לאימות דיוק הנתונים. בעבור כותרות שנסרקו בידי יותר מאדם אחד, ביצענו "בדיקת הסכמה": במידה והבודקים הסכימו על הסנטימנט (מה שקרה בכ-60% מהמקרים), נבחרה התוצאה המוסכמת. במידה ולא היתה הסכמה, נסרקה הכותרת בידינו בשנית לבחירת העמדה המדויקת יותר.

במקביל, גם כן בעזרת מתנדב מקצועי, בנינו מאגר מידע גולמי אליו הוכנסו כל הכותרות מתקופת הזמן המדוברת (כאמור, כ-15,000 שורות). באמצעות המאגר חיפשנו כותרות "חשודות" בהתבסס על מטא-נתונים (אורך חיי הכותרת, כמות הפעמים שהוחלפה, האנשים שמוזכרים בטקסט וכו') וכן ביצענו השוואות בשינויים שהתבצעו בתוכן בפועל.

בהמשך לנכתב בתחילת המאמר, חשוב להזכיר את המגבלות הברורות של התהליך הכמותי שביצענו: ראשית, הוא מתייחס רק למה שפורסם בפועל בכותרת הראשית של "וואלה" ולא לידיעות שנדחקו בתחתית הדף או לא פורסמו כלל. כמו כן, הסיווג התמקד בכותרת בלבד – ולא בתוכן הכתבה או בתמונות שהתלוו אליה (דיווחים קודמים הצביעו על התמונות כזירת התערבות מרכזית). עוד ראוי להוסיף כי הבדיקה הכמותית שערכנו חסרה אלמנט השוואתי (לאתרים אחרים) ועל כן היא עשויה לפספס את הדקויות שבסיפור שמאחורי כל כותרת.

בחודשים הקרובים נשאף להרחיב את העבודה העיתונאית מבוססת-מידע (Data Journalism) על מאגרי מידע דומים, של כותרות אתרי החדשות בישראל.

לכתבה הראשית: בדיקת "העין השביעית" ו"קרן התחקירים": היחס לנתניהו במערכת הבחירות של 2015 בכותרות הראשיות באתר "וואלה" היה מאוזן עם נטייה חיובית • עורכים באתר מעידים: מאבק בין המערכת העיתונאית ללחצים מצד בעל השליטה, שהתגברו אחרי נצחון נתניהו בבחירות

רוצה את מיטב הכתבות והתחקירים של שקוף ישירות לתיבה? פה נרשמים לניוזלטר:

שיתוף ב facebook
שיתוף ב twitter
שיתוף ב whatsapp
שיתוף ב telegram
שיתוף ב email
ניר בן-צבי

מייסד-שותף, מנכ"ל

נולדתי בנגב, גדלתי בגליל המערבי. בוגר 8200, פריק של עיתונות, טכנולוגיה, סדר ותהליכים. נשוי לרעות, אבא לנעמי.

בוגר תואר ראשון בניהול ומשפטים, חבר בנשיאות מועצת העיתונות (מטעם שקוף).

לפני שקוף עבדתי כעשר שנים בעולם ההייטק (בישראל ובקליפורניה) – מרביתן בסטרטאפ בתחום אבטחת המידע – במהלכם ניהלתי צוותים של בדיקות תוכנה, אוטומציה, תמיכה טכנית, הטמעות, פיתוח עסקי וניהול מוצר.

ב-2018 הקמתי עם תומר אביטל את "שקוף" – סטארטאפ חברתי, מתוך מטרה לבנות כלי תקשורת רחב היקף ומשנה מציאות.

כתיבת תגובה

האימייל לא יוצג באתר.

שקוף הוא כלי התקשורת העצמאי הגדול בישראל. פה תקראו עיתונות חוקרת, מעמיקה וביקורתית, בתחומי הון-שלטון-עיתון, עבודת הכנסת, משבר האקלים ועוד.

"עצמאי" אומר שכל המימון שלנו, מהשקל הראשון ועד האחרון, מגיע רק מ- 6,709 איש ואישה בדיוק כמוך. אנחנו לא לוקחים אגורה מבעלי הון או קרנות, אין פרסומות ואנחנו משוחררים משיקולי רייטינג. זו מהפכה: אנחנו היחידים בישראל שפועלים במודל הזה, באופן שמבטיח שנעשה עיתונות נקייה מאינטרסים ומלחצים פוליטיים, כזו שנכנסת לעובי הקורה ולא פוחדת לומר את האמת. כל תמיכה, בכל סכום, מאפשרת לנו להמשיך ולשנות את המציאות הישראלית, למען כולנו.

משוב על האתר החדש

אנחנו בתקופת הרצה, נשמח לכל פידבק.

תודה על המשוב!

בזכותך אנחנו משתפרים כל הזמן.

אם עדיין לא הצטרפת כמו"ל – אפשר לעשות את זה כאן.

מערכת שקוף.