יד ושם יעלה לרשת את עשרות מיליוני המסמכים שבארכיוניו בפרויקט שהיקפו כעשרות מיליוני ש'

הפרויקט - המשך המאמץ לתיעוד שמות קורבנות השואה היהודים ● עד כה הונצחו פרטיהם של כ-3.5 מיליון מהקורבנות במאגרי המידע של יד ושם

כל הפנים והשמות.

מוסד יד ושם מתחיל בימים אלו בפרויקט העלאה לרשת של המסמכים שבארכיוניו. הפרויקט, שהיקפו מוערך בעשרות מיליוני שקלים, ייארך מספר שנים, ותלוי בכמות התקציבים והתרומות שיופנו למוסד. במסגרת הפרויקט יצולמו כל עשרות מיליוני הדפים והמסמכים המצויים בארכיוני המוסד, ייסרקו דיגיטלית, יעברו תהליך סיווג ומיפתוח (Indexing), ואז יועלו לרשת.

מטרת הפרויקט, אמר מיכאל ליבר – מנמ"ר יד ושם, היא להנגיש את המידע על השואה להיסטוריונים ולחוקרים, למחנכים ולתלמידים וכן לכל מי שמתעניין בפרטים היסטוריים על השואה. כך, יוכלו הגולשים לעיין במסמכים ובדפים מסוגים שונים: תצלומים, עדויות, יומנים ומכתבים אחרונים, מסמכים ומפות. אחד מיעדי המיחשוב העיקריים במקום, אמר ליבר, הוא להנגיש את הארכיון רב התעודות ואת אוספי הפריטים הקשורים לשואה – לקהל הרחב, דרך האינטרנט. "הקמנו מערך דיגיטציה גדול", אמר ליבר, "ואנו עוסקים בסריקה של מסמכים, מיקרופישים, וידיאו, חומרים חזותיים וקוליים בכמויות גדולות".

הפרויקט הוא המשכו של פרויקט אחר הנמשך ביד ושם – פרויקט לתיעוד שמות קורבנות השואה היהודים. נכון לעכשיו מונצחים פרטיהם של כ-3.5 מיליון מהקורבנות במאגרי המידע של יד ושם. מספרם המדויק של קורבנות השואה היהודים אינו ידוע, ונאמד בקרוב לשישה מיליון. שמות הנספים מגיעים משני מקורות עיקריים: ממצאי איסוף של "דפי עד" של יד ושם, אותם ממשיכים לאסוף כל העת, והמקור השני הוא ממסמכים ארכיוניים, אותם סורקים ביד ושם על בסיס קבוע. ממסמכים אלו דולים חוקרי המוסד שמות של נספים. "לשם כך דרוש ידע היסטורי, על מנת לוודא שהשמות אותם אנו מוסיפים לרשימה אכן היו קורבנות", מסביר ליבר.

פרויקט המשך לתיעוד שמות הקורבנות הוא פרויקט שמתחיל בימים אלה ביד ושם: אימות והצלבת הנתונים בין שני מאגרי שמות של קורבנות. האחד, כאמור, הוא 3.5 מיליון קורבנות שפרטיהם אומתו. השני, מאגר גולמי, המונה מעט יותר מארבעה מיליון שמות של קורבנות, שמופיעים במסמכים היסטוריים נוספים, שרק חלקם זוהו או תועדו במאגר השמות המאומת. לדברי ליבר, הרצון בפרויקט האימות הוא להיות זהיר: לשמור על כבוד המתים, כמו גם על כבוד מי שטרח ומילא פרטים על בני משפחתו הקורבנות, ומנגד – לטייב את הנתונים ולא להיות במצב של שמות הרשומים כקרבנות באופן כפול או משולש.

פרויקט ההצלבה והאימות, שייארך כמה חודשים, יסתייע ביכולות מיחשוביות ומקצועיות הקיימות בידי חוקרי יד ושם, במסגרתן נבנתה מתודולוגיה של טיוב נתונים "קלאסי" של IT, בצירוף שימוש בידע היסטורי הקיים בידי החוקרים. כך, לדוגמה, למחנות ריכוז והשמדה היו כמה שמות, או שבמחנה אחד היו כמה תתי-מחנות. לאחר שפעם אחת נקבע, כי קורבן מסוים הושמד במחנה, ניתן להשליך דפוס זה גם על קורבנות אחרים מאותו מחנה. בסופו של פרויקט טיוב הנתונים, ישנו אנשי ה-IT של יד ושם את הממשקים באינטרנט למאגר השמות. כך, גולש המחפש שם של קורבן ספציפי, יוכל לקבל את כל המופעים שהמערכת "חושבת" שיכולים להיות רלוונטיים לחיפוש.

בהיבט איחסון הנתונים, מערכות ה-IT של יד ושם פועלות בשתי סביבות איחסון – מתוצרת EMC ו-NEXSAN. אלו מטפלות בכ-500 טרה-בייטים של נפח נתונים, כמות הגדלה מדי שנה בעשרות טרה-בייטים של נפח. כמות הנתונים המאוחסנים הוכפלה לפני כחצי שנה, בשל העברת ארכיון סטיבן שפילברג ליד ושם. הנתונים נמצאים ברובם בשרתי יד ושם וחלקם באתר האינטרנט. חומר הארכיון, שהטיפול בו ארך מספר חודשים, כולל כרבע פטה-בייטים של מידע ומכיל גם העתקים של כ-52,000 עדויות של ניצולים ועדים אחרים מ-56 מדינות ב-32 שפות – שתועדו משנת 1994 עד שנת 2000, ושהועברו לירושלים.

לפני שלוש שנים החליט הוועד המנהל של ארכיון שירות האיתור הבינלאומי של הצלב האדום בבד-ארולסן בגרמניה, לפתוח את הארכיון לציבור. לפי הערכת מומחים ביד ושם, ההחלטה תעניק לציבור הכללי ולחוקרים, בפעם הראשונה, גישה ל-50 מיליון תיקים מתקופת מלחמת העולם השנייה. בתיקים יש מידע חדש על מחנות ריכוז וכפייה ועוד שמות של קרבנות שואה ממסמכים שהתקבלו בארכיון מתחילת שנות ה-60'. בשנות ה-50' קיבל יד ושם כ-20 מיליון דפי מסמכים שהיו בארכיון עד אז, רובם נוגעים ליהודים בתקופת השואה. מערך ה-IT ביד ושם ממשיך לקבל חומרים של הארכיון, עד לקבלת עותק שלם שלו. "עד כה", אומר ליבר, "קבלנו עשרות מיליוני סריקות של מסמכים, ובסיום הפרויקט, בעוד כשלוש שנים, יהיו בידינו עשרות מיליונים נוספים של מסמכים".

כיצד אתם מסתדרים בהיבט התקציבי?
"המצב הכלכלי משפיע על כולם. יד ושם מתוקצב על ידי משרד החינוך ומתרומות. עד כה, לא נפגענו בהיבט התרומות – מי שהתחייב לתרום – עשה זאת. למרות זאת, מחלקת ה-IT שבראשותי נערכה לימים קשים, ביצענו פרויקטים של קונסולידציה של מערכות, וכן ערכנו פרויקט וירטואליזציה לשרתים באתר האינטרנט שלנו, מבוסס VMware".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים