יום הזיכרון לשואה ולגבורה תשפ''ג

"הבינה המלאכותית מסייעת לעבות את נתוני הקורבנות ושורדי השואה"

כך סיפר מיכאל ליבר, מנהל אגף חדשנות וטכנולוגיות מידע ביד ושם, שהתראיין לאנשים ומחשבים בערב יום השואה ● ליבר סיפר כי: "אחד התחומים בהם אנו עוסקים באופן מסיבי הוא NLP, עיבוד שפה טבעית"

מיכאל ליבר, מנהל אגף חדשנות וטכנולוגיות מידע ביד ושם.

"אנו עוסקים בהטמעת מודלים ורכיבים של בינה מלאכותית זה מספר שנים. בשנה האחרונה, לאור התקדמות התחום, אף העמקנו את הטיפול בנושא. AI מסייעת לנו לטפל בנתונים רבים יותר ובאופן חכם ויעיל יותר – וכך אנו יכולים לעבות את הדאטה על שורדות ושורדי השואה, כמו גם על הקורבנות, ולהעשיר את קורות חייהם", אמר מיכאל ליבר, מנהל אגף חדשנות וטכנולוגיות מידע ביד ושם.

"אחד התחומים בהם אנו עוסקים באופן מסיבי הוא NLP, עיבוד שפה טבעית", סיפר ליבר עובדה מרתקת בראיון לאנשים ומחשבים ופירט, "ואנו עוסקים בו רבות בכל הקשור לזיהוי ישויות ועדויות. מדובר בחומר מאוד בעייתי מבחינת NLP – כיוון שאנו עובדים בשפה העברית, שם המצב פחות טוב מאנגלית, כי יש הרבה פחות מודלים".

לדבריו, "במסגרת העדויות, אנו מנסים ולעתים מצליחים, לחלץ מידע מסודר אודות נספים, שייתכן שלא נרשמו באופן מסודר בהיכל השמות. אנו מפעילים את המודל כדי להצליב או לשייך רשומה למול אנשים – שורדים או נספים – שהם כן מזוהים. כך, אנו יכולים לעבות את קורות חייהם: AI מזהה בעדות ישויות, אנשים, מקומות או אירועים – והחוכמה מתחילה בזיהוי, גם זיקה, קשר, וגם הקשר – קונטקסט. כך, אם יש לנו עדות וידיאו של שעות, המודל מסייע לנו לחלץ נתונים מה קרה למי מבני המשפחה של העד או העדה. הוא מסייע להבין את הטקסט לעומק, למשל האם מישהו 'נשלח למחנה ריכוז', משמע הוא נרצח שם, כי זו אינה מסקנה אוטומטית. השימוש ברכיבי AI מזרז את העבודה הסיזיפית שנעשתה על ידי בני אנוש, ומקצר תהליכים".

הוא הוסיף וסיפר כי "המשכנו השנה בפרויקט של למידה עמוקה לטובת טיפול טוב יותר במאות מיליוני המסמכים שברשותנו. המערכת מבוססת אנבידיה ונועדה לתת עוד מידע, בלא התערבות אנושית ולהעשיר את המטה-דאטה שלנו".

הנצחה וזיכרון. במוזיאון יד ושם אך גם בדיגיטל.

הנצחה וזיכרון. במוזיאון יד ושם אך גם בדיגיטל. צילום: BigStock

IT Awards 2022: אות הערכה לפרויקט בתחום ה-AI-ML 

ליבר ציין כי "בתחרות מצטייני המחשוב 2022 של אנשים ומחשבים קיבלנו השנה אות הערכה בקטגוריית בינה מלאכותית-לימוד מכונה, בשל פיתוח מערכת לחילוץ ואיתור שמות מתוך עדויות קיימות. בסופו של התהליך יתווספו למאגר של יד ושם אלפי שמות חדשים של קורבנות וניצולים, ומידע נוסף לגביהם".

לפני ימים אחדים יד ושם חנך את מייצג ספר השמות, המציג את שמות 4,800,000 מיליון קורבנות השואה. הספר כולל את שמותיהם של הקורבנות, מקום הולדתם, תאריך לידתם ומקום הירצחם אם הוא ידוע.

השמות הכתובים בספר הם פרי עבודת איסוף של עשרות שנים שמבצע יד ושם מיום הקמתו ועד היום באמצעות דפי עד, איתור מסמכים שונים מתקופת השואה, שיתופי פעולה עם אתרי הנצחה וזיכרון ועוד. "אורכו של הספר הוא שמונה מטרים", אמר ליבר, "ומימדיו העצומים מעידים על האובדן הבלתי נתפש והעצום. עמודיו האחרונים של הספר – ריקים, ומסמלים את השמות שעדיין לא אותרו, תועדו והונצחו, וייתכן כי לעולם לא יאותרו".

לדבריו, "אנו מעריכים שהיעד המספרי בר-ההשגה הוא 5.1 מיליון רשומות של נספים. כמובן שבחלוף הזמן, קצב איתור הרשומות הולך ונהיה איטי".

הפקת תשובות מכלל מאגרי המידע על השואה

לפי ליבר, "נכנסנו השנה לדור 2.0 של הנגשה של הידע והמאגרים שלנו, והתחלנו את DAtA Project, ראשי תיבות של Digital Access to All. אנו בונים פלטפורמה אחודה, עם מחברים (קונקטורים) וממשקי API – לאיגום כלל מאגרי המידע ביד ושם ולהנגשתם – מידע ארכיוני, מידע מאוספים מוזיאליים, מחקרים, תמונות, מסמכים, אודיו וסרטונים. כך, מי שייגש למאגרי המידע, ישאל שאלה פעם אחת – ויקבל תשובה כוללת, מכל מאגרי המידע השונים, כי בנינו שכבות חדשות חכמות, עם יכולות תחקור מתקדמות".

"בפלטפורמת הניהול הפנימית של יד ושם, שהוותה את התשתית לספר השמות", ציין, "נוספו משנה שעברה כ-4 מיליון עמודי תיעוד למערכת, המכילה כעת יותר מ-224 מיליון עמודים סרוקים. יהיה קשה עד בלתי אפשרי למצוא תיעוד לכולם".

פרויקט גדול הנמצא בעיצומו, סיפר ליבר, "הוא העברת אתר האינטרנט של יד ושם, ששכן באירוח במתקן סלקום-נטוויז'ן בחיפה – לאתר של בינת בהר חוצבים, בקרקע, לא בענן".

הוא הוסיף כי "אנו בוחנים מעבר ל-נימבוס, הענן הציבורי הממשלתי. מה שעומד לנגד עינינו הוא העלויות של ארגון כמונו, בעל כמות נתונים מטורפת, ובלא היררכיה ויכולת לתעדף את צרכי האחסון. אנו כבר עושים שימוש בנימבוס כיום לטובת גמישות בניתוב של עומסי עבודה ותעבורה, בשילוב כלי 5F".

מאמצים אינטנסיביים בשל השעון המתקתק

"כולם מבינים שהזמן של מרבית שורדי השואה, שיכולים לספר את סיפורה בגוף ראשון – קצוב", סיכם ליבר. "לכן, אנו מסתייעים ב-IT כדי לחשוף את סיפורי השואה, לרבדיה השונים, למגוון אוכלוסיות, בארץ וגם בעולם, תוך מיקוד בצעירים ובצעירות. הדור הצעיר הוא זה שיישא את זיכרון השואה, והדיגיטל יאפשר זאת. הטכנולוגיה תמשיך לתפוס מקום משמעותי בפעילותינו, כדי שנגיע לקהלים רחבים יותר, שאינם קהל שבוי, שאינם בהכרח מחוברים 'טבעית' לסיפורי שואה – אנחנו חייבים להיות מעניינים ורלוונטיים".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים