top of page
תמונת הסופר/תלירון דורפמן

ויקיפדיה בעידן ה-Generative AI והFake- News

עודכן: 2 בדצמ׳

אדם הולך במנהרה

ב-8 ביולי מלאו 20 שנה למיזם ויקיפדיה העברית. שבוע לאחר מכן, התקיימה בתל אביב חגיגה לציון המאורע. רוב

הנוכחים באולם לא היו עמה בשנתה הראשונה וגם לא בשנייה; כמה מהם אף לא נולדו אז. עם זאת, כולם הסכימו שהרבה מאוד השתנה בעולם מאז נוצרה ושבמקביל, השתנו גם האתגרים עמם הם מתמודדים, ושעוד צפויים לאלה העוסקים לילות כימים בהנגשת מידע דרך ויקיפדיה הנכתבת בשפתם.

מיעוט כותבים – מעט עריכות; ריבוי כותבים – צורך להגן מפני ניסיונות להטיות.


בשנותיה הראשונות, המיזם בישראל התמודד עם אתגרים הקשורים לכמות המועטה של הכותבים והעורכים בו, מה שגם הביא לכמות מצומצמת של ערכים, בהם לתחומים רבים כלל לא הייתה התייחסות. כעת, כשבוויקיפדיה העברית מעל ל-338 אלף ערכים, האתגר בישראל עבר, כמו גם במדינות ושפות אחרות, לשמירה על האיכות של היקף התוכן האדיר, לצד טיפול בניסיונות מצד גורמים שונים להטיות או להכנסה מכוונת של אי-דיוקים. כאשר בכל בית משתמשים במיזם, גדלה גם כמות הכותבים המזדמנים, כאלה שנכנסים רק כדי לבצע תיקון קטן שנראה להם מתאים, להוסיף פרט על אדם שיצא להם להכיר באופן אישי או לעדכן נתונים הנוגעים לנושא עליו שמעו בתוכנית בטלוויזיה או למדו עליו מסרט בו צפו. פעמים רבות, מידע כזה הוא לכל הפחות לא מדויק, מכיל פרטים פחות חשובים, שאין מקומם באנציקלופדיה, או שבכלל מדובר בעריכות מטעמים אחרים. אולי תתפלאו, אבל ניסיונות לשתול בערכים פרטי מידע שגויים באופן מכוון, מה שמכונה בשפת המיזם "השחתה", נפוצים למדי.


יש כותבים שיכניסו זאת כדי "לבחון את המערכת", כלומר לשמש בודקים-מטעם-עצמם של מהירות איתור המידע השגוי עד למחיקתו בידי העורכים. אחרים, יכניסו את הפרטים הללו כדי ליצור הטעיה מכוונת של הקוראים או הטיה של הלכי רוח בקרב הציבור, קידום אג'נדות אישיות. כמות התרומות העצומה דורשת מערכת משוכללת יותר שכוללת תהליכים סדורים לניטור השינויים התמידיים במיזם, ויותר מתמיד, נדרש גם שיתוף פעולה בין העורכים. העורכים העוסקים בבקרה שוטפת של כל העריכות והתוספות מכונים בז'רגון הפנימי "מנטרים" מלשון ניטור (באנגלית: New Page Reviewer). לעיתים פעולותיהם נתפסות כפחות זוהרות, או פחותות בחשיבותן, ביחס להשקעת זמן בכתיבת ערכים חדשים, אולם אין זה כך.


בפועל, בחינה מתמדת של איכות המידע מביאה לכך שהוא ממשיך להיחשב לכזה שניתן לסמוך עליו, ומביאה לכך שאנשים ממשיכים לפנות לוויקיפדיה לבחינת כל נושא דעת, בין אם לצרכי קבלת תשובה למשחק טריוויה, לעזרה לילדים בהכנת שיעורי בית או לצורך כתיבת מאמר עיתונאי. קוראים שיפקפקו במהימנות המידע המוגש להם במיזם, יחששו לחזור אליו להשגת תשובות על שאלות עתידיות. לצורך עבודתם, משתמשים ה"מנטרים" בכלים טכנולוגיים שונים שפותחו במהלך השנים, ושחלקם מבוססי בינה מלאכותית. בוטים מונעים את פרסומן של עריכות שברור לגמרי שאין בהן תוכן רצוי ובמקביל, מסמנים עריכות בהן עלולות להימצא השחתות. כך, המנטרים האנושיים יכולים לבחון מהר יותר שינויי תכנים בהם נמצאו סימנים מחשידים, לבטל השחתות, לחסום את המשחיתים ואז, להתפנות לטיפול בנושאים מורכבים.

הסתמכות על מקורות מסורתיים בהתחלה מול שמירה מפני מידע כוזב והטרלה:

בשנותיה הראשונות של ויקיפדיה, עורכים הסתמכו לרוב על מקורות "מסורתיים" כמו אנציקלופדיות מודפסות, ספרים וכתבי עת אקדמיים. במקביל לגידול בפופולריות שלה, ככל שוויקיפדיה גדלה בהיקפה, עד שהפכה לאחד מחמשת האתרים הנצפים בעולם, היא משכה יותר תשומת לב מקבוצות שונות, כולל כאלו עם כוונות זדוניות.


ההשחתה הפכה לעיתים למתוחכמת. כבר לא מדובר בעיקר בהגנה ממעשי קונדס. כעת נדרשת שמירה מפני חדירה של חדשות כוזבות (Fake News), כולל כאלה שהופצו ברשתות חברתיות, ויש צורך בהבחנה בין מידע שבהכרח מגיע ממקורות אמינים לבין כזה שעלול אף לכלול אלמנטים שיוצרו בעזרת כלי Deep Fake - תוכן שנראה אמיתי למרות שנוצר בכלי AI; זאת, על ידי שילוב תמונות וסרטונים על גבי תמונות וקטעי וידאו אחרים. לשמחתנו, בחינת הדברים מלמדת שככל הנראה, בהשוואה לפלטפורמות אחרות, ויקיפדיה הושפעה פחות מזיופים עמוקים.


ההסבר לכך נעוץ בזה שעל פי כללי הייסוד של המיזם, התוכן של ויקיפדיה יסתמך בעיקר על מקורות גלויים – כאלה הניתנים לאימות בקלות, ופחות על מקורות סגורים, מאחורי חומת תשלום. מעבר לזה, עוד מראשית ימיה של ויקיפדיה העברית למשל, החליטו כותביה שלמעט מקרים יוצאי דופן, לא ישמרו בין הדפים ערכים באורך שורה או שתיים. באופן הזה יש עוד נדבך המונע החדרה של מסרים קצרים, ללא תימוכין או הפניות למקורות שיאפשרו אימות של הנתונים. החלטה זאת, שהינה יוצאת דופן, ולא נקטו בה צוותים מקבילים בשפות אחרות, הביאה לכך שהיא נחשבת לאחת משלוש הוויקיפדיות המובילות מבחינת עומק התכנים.


עם זאת, ויקיפדיה אינה חסינה לחלוטין מפני הסיכונים הפוטנציאליים הנשקפים מזיופים עמוקים. כאלה שיצליחו לקבל במה באמצעי תקשורת ההמונים עלולים למצוא את דרכם אל דפי המיזם ולאור החשיפה, העורכים עלולים יהיו להחשיבם כתכנים לגיטימיים. משכך הדברים, כשהטכנולוגיה ליצירת זיופים עמוקים מתפתחת ללא הרף, ברור לקהילת העורכים שהם עשויים להידרש למערכות זיהוי אוטומטיות מסוגים נוספים, כדי להגן על המיזם בשכבה נוספת, מעבר לזאת של בחינת המידע בעין האנושית.

במציאות בה כלי Generative AI מאפשרים יצירת תכנים בקלות, עורכי ויקיפדיה נדרשים להמשיך לכתוב את הערכים בעצמם. הסיבה לכך היא שכלים כדוגמת Chat GPT או Google Bard מסתמכים על מידע ממקורות שונים וביניהם, ויקיפדיה. קישורים לערכים בוויקיפדיה מהווים אסמכתאות לנתונים המובאים בתכנים המיוצרים על ידי BingAI. לו יאפשרו העורכים הכנסה של ערכים המופקים על ידי כלים אלה, הם עלולים להשריש טעויות שטרם נופו מערכי ויקיפדיה באותה שפה או אף מאתרי הוויקיפדיה בשפות אחרות. זה טיבם של כלי ה-Generative AI, נכון לשעת כתיבת המאמר, הסתמכות על מידע והצגתו בצורות שונות, ללא אפשרות פשוטה לבצע בחינה מעמיקה של טיב התכנים המקוריים.

אבל לבסוף, המציאות הנוכחית לא הפכה הכול לקשה או מורכב יותר. עם כל הקשיים החדשים, אין להתעלם מכך שטכנולוגיות שצצו במהלך שני העשורים שיפרו משמעותית את עבודתם של הכותבים והעורכים בוויקיפדיה בדרכים שונות. אם בעבר העריכה התבצעה רק מתוך מחשב, אנו עדים לאחוז גדל בהתמדה של עריכות מממשק התוכנה של ויקיפדיה לטלפונים ניידים. אנשים מבצעים שיפורים ותוספות תוך כדי נסיעה ברכבת לעבודה, במהלך טיול בחו"ל, בתור לרופא וגם ממיטתם, דקה לפני שהם נרדמים.

אחד התחומים בהם הייתה ההתקדמות הבולטת ביותר הוא פיתוח ממשק עריכה נוח וידידותי למשתמש. בשנים הראשונות, הכתיבה בוויקיפדיה נעשתה בכלי שדרש לימוד של מה שמכונה בוויקיפדיה "קוד מקור" או "תחביר ויקי" (wiki markup). הצורך בלימוד הנושא עלול היה לעיתים להרתיע תורמים חדשים. בשנים האחרונות התווסף לוויקיפדיה כלי "העורך החזותי" (Visual Editor), המקל על אנשים לערוך ולתרום ללא צורך בלימוד תחביר מורכב. אפילו הוספה של הערות שוליים, המכילים תימוכין והפניות למקורות חיצוניים הפכה קלה יותר, מה ששיפר את עומק התכנים ואת האפשרות לבחון את מהימנותם. כלים נוספים אפשרו שילוב בערכים של תמונות, תכני וידאו וקבצי קול – כל זאת באופן פשוט ונוח יותר מאשר בעבר. זאת, אפילו ללא הצורך לציין שצילום דיגיטלי הפך נגיש, מה שמאפשר הוספה של צילומים איכותיים יותר על ידי תורמים רבים יותר.

אפילו "זום" בא לעזרת ויקיפדיה. כיום מקיימים עורכי ויקיפדיה שונות, בליווי אנשי עמותת "ויקימדיה", הדרכות למתעניינים בנושא באמצעות תקשורת מרחוק. אין עוד צורך להרחיק לעיר הגדולה לשם הגעה למפגש כזה, ולא תמיד נדרש לשלוח מדריך למקום מרוחק. נפתח צוהר לרבים, אף מקרב כותבי העברית מרחבי העולם, להצטרף להדרכות אלה, ומשם פתוחה הדלת לנחיתה רכב יותר במיזם.

משכך הדברים, ויקיפדיה בכלל, וויקיפדיה העברית בפרט, הפכו למרכז ידע דינמי, מדויק ונגיש יותר. הכלים החדשים מעצימים את התורמים והעורכים שלה ומאפשרים להם ליצור תכנים עשירים ומקיפים יותר עבור כל הקוראים שלהם מרחבי העולם.

וכשזה כך, לא תרצו להצטרף אליהם? כולכם מוזמנים!



 

רוצה ללמוד עוד על בינה מלאכותית?

הנה מספר כתבות שאולי יעניינו אותך:


Comments


bottom of page