יד ושם מחליף את תשתיות ה-IT – לתמיכה בריבוי שירותים וגולשים
"אנחנו בונים את הדור הבא של תשתיות המחשוב לטובת הצעירים, שרוצים - ומקבלים - חוויית גלישה ידידותית עם צריכת שירותים משופרת", אמר מיכאל ליבר, מנמ''ר יד ושם, בראיון לרגל יום השואה
מערך ה-IT של יד ושם נמצא בימים אלה במהלכו של פרויקט רחב היקף להחלפת תשתיות ה-IT של המוסד להנצחת השואה. מטרת הפרויקט משולשת: תמיכה בריבוי הגולשים באתר, לרבות היערכות לגלישת שיא (Peak) סביב יום השואה; גידול בנפחי האחסון בהם מטפלים אנשי ה-IT במוסד; והיערכות למתן יותר שירותי מחשוב עבור ה-"צרכנים" באתר – גולשים מן המניין, כמו גם מדענים, היסטוריונים וחוקרים בתחום.
הפרויקט החל לפני כשנה וצפוי להסתיים בחודשים הקרובים. היקפו הוא בשווי מיליונים רבים של שקלים, אלא שבפועל עלותו פחותה: חלק ממנו בוצע דרך מכרז של החשב הכללי באוצר וחלקו במסגרת פרויקט שימור המורשת הגלובלי של EMC, אליו שותפים יד ושם ומוסדות אחרים בעולם להנצחת השואה. במסגרת זו מספקת ענקית האחסון למוסדות אקדמיים ולמכוני מחקר מערכות אחסון מתקדמות במחיר נמוך.
תשתיות ה-IT החדשות שהוטמעו נועדו לתמוך בגידול רחב ההיקף של הנתונים המאוחסנים ביד ושם, העומד על שלושה פטה-בייט, מתוכם 400 טרה-בייט לטובת אתר האינטרנט של הארגון. מדובר בשלוש מערכות חדשות: אחת של EMC, שנייה של היטאצ'י דטה סיסטמס (HDS) ושלישית של HP. זו האחרונה הוטמעה על ידי מטריקס, במסגרת מכרז החשב הכללי.
עוד בוצע כחלק מהפרויקט חידוש לתת האתר הכולל את שמות הנספים בשואה, שמהווה חלק מאתר יד ושם. האתר נמצא כרגע בתצורת בטא, אך כבר זמין לקהל ויעלה בקרוב באופן מלא. חידוש האתר נועד לענות על הצורך לעמוד בחוק הנגישות החדש, שייכנס לתוקף באוקטובר. תשתית ה-IT החדשה היא רספונסיבית, תומכת בנגישות הנדרשת ועובדת מול רכיבי מובייל. בחודשים הקרובים יתווספו לאתר עוד מאגרי מידע.
מיכאל ליבר, מנהל אגף טכנולוגיות המידע של יד ושם, אמר לאנשים ומחשבים כי "כל הפיתוחים שערכנו נעשו בתפיסת אג'ייל. המטרה שלנו היא לשתף את קהל הגולשים באמצעים שונים, כגון פורום, על מנת לקבל מהם משוב ולהיעזר בהם כדי לבנות אתר טוב יותר".
"הדור הבא של יד ושם"
אנשי ה-IT כינו את התשתית החדשה YVNG – הדור הבא של יד ושם. הכוונה ב-"הדור הבא" היא דו משמעית – הן טכנולוגית והן מבחינת גיל. "בנינו את פלטפורמות ה-IT שלנו בראייה של חוויית המשתמש של הדור הצעיר, כפי שהוא רגיל בשימוש באתרים אחרים, כי זה הדור החשוב לנו", אמר ליבר. "עם כל הצער שבדבר, דור הניצולים הולך ומתמעט, ואנחנו מביטים קדימה ורוצים להיות רלוונטיים ולהתאים עצמנו לדור הצעיר".
הוא ציין כי "השרתים החדשים הם בעלי יכולות לאחסון מהיר והיברידי, עם עשרות טרה-בייט של פלאש (Flash) ודיסקים מהירים. נוסיף בהמשך יכולות אנליטיקה ו-Big Data".
שבע שפות – והצרפתית בהמשך
במהלך 2015 גלשו באתר יד ושם 18 מיליון גולשים – 10% מהם מישראל והשאר מהעולם. האתר פועל כיום בשבע שפות: עברית, אנגלית, פרסית, רוסית, ספרדית, גרמנית וערבית. בשנה הבאה הוא יעלה בשפה הצרפתית.
ביד ושם מצפים כי מספר המבקרים באתר השבוע, שכולל את יום הזיכרון לשואה ולגבורה, שמתחיל הערב (ד'), יעמוד על שיא של קרוב לחצי מיליון, לעומת אלפים או עשרות אלפים ביום רגיל. לדברי ליבר, "כחלק מההיערכות לשיא הגלישה, אנחנו מוסיפים שרתים נוספים לתשתית הווירטואלית שלנו, המבוססת על VMware".
נמשך פרויקט מחשוב שמות קורבנות השואה
עד כה הצליח יד ושם לזהות יותר משני שלישים משמות קורבנות השואה. להערכת אנשי המוסד, כיום מתועדים במאגר השמות, המופיע באתר, כ-4.6 מליון קורבנות. לפי ההערכות של ההיסטוריונים, בסופו של דבר יכיל מאגר השמות את פרטיהם של 80% מכלל הקורבנות, שכן כנראה שקשה יהיה למצוא, או שלא יימצא כלל, תיעוד לשאר.
המאגר המרכזי של שמות קורבנות השואה עלה לרשת בנובמבר 2004, כשבו פחות משלושה מיליון שמות. עם העלאת המאגר יצא המוסד במבצע רחב היקף לאיסוף שמות חסרים מהציבור הרחב, שההיענות לו הייתה רבה, בפרט לנוכח העובדה שמספרם של הניצולים הולך וקטן.
מקורם של כמחצית השמות שנמצאים כיום במאגר המקוון בדפי עד – טפסים ובהם שמותיהם ופרטיהם האישיים של הנספים, שממלאים קרובים או מכרים שלהם. רבים מאותם דפי עד מולאו לאחר השקת הקמפיין. מקור יתר השמות הוא בפרויקטי הנצחה של קהילות וניצולים, וכן במסמכים ארכיוניים. הקושי העיקרי הוא באיתור שמותיהם של יהודים שנרצחו במזרח אירופה ובשטחי ברית המועצות לשעבר, היות שבניגוד למצב שהיה במערב אירופה, במדינות אלה בוצע הרצח פעמים רבות במקום המגורים של היהודים, והנאצים לא ערכו רשימות גירוש עם פרטיהם של הקורבנות.
ליבר מחדד את האבחנה בין מספר הנספים לרשומות אודות הקרבנות – שמספרן גבוה יותר, שכן על קורבן אחד יכולים להיות פריטי רישום רבים, למשל על הולדתו, הירצחו, או מסמך אודותיו מהגטו או ממחנה ההשמדה. "הבעיה אינה פשוטה", אמר, "ואנחנו עסוקים רבות במציאת פתרונות לכך. לדוגמה, חיפוש אודות הקורבנות בפולין, יעלה 3.5 מיליון רשומות, אבל חיפוש אחר מספר הקרבנות ממדינה זו יעלה נתון נמוך יותר. אנחנו מקווים ליצור תמונת מצב יותר טובה".
כדי לעשות זאת, מסתייעים אנשי ה-IT של יד ושם בין השאר בפתרונות ה-Big Data של HP ובאלגוריתמים המפותחים על ידי מעבדות החברה בחיפה. כך הם מפתחים דרכים חדשות לחשיפת יותר מ-1 פטה-בייט של מידע בלתי מובנה, המאוחסן בארכיוני המרכז.
מה עם איטלקית? יפנית? סינית??