כך מסייעת הטכנולוגיה לגלות מה עלה בגורל ילדי תימן החטופים

פרויקט הדיגיטציה של 400 אלף המסמכים בפרשת ילדי תימן, שנחשפו היום רשמית בארכיון המדינה, התבצע באמצעות מוצרי דוקומנטום, שאותם הטמיעו אנשי NessPRO ● אנשי קבוצת יעל הקימו את אתר ארכיון המדינה, על תשתית של גוגל

למצוא דרך להגיע לאמת. פרשת ילדי תימן. צילום: ויקיפדיה

"היינו שותפים לפרויקט שמביא לכך שאנשים שסבלו משך שנים – יוכלו למצוא דרך להגיע לאמת על יקיריהם", כך אמר לאנשים ומחשבים אודי שטרית, מנהל חטיבת יישומי מערכות לניהול תוכן, NessPRO – קבוצת מוצרי התוכנה של נס.

חשיפת המסמכים בפרשת ילדי תימן לציבור התאפשרה באמצעות ביצוע פרויקט הדיגיטציה של המסמכים, שנחשפו היום רשמית בארכיון המדינה. אלה כוללים מאות אלפי עמודי תיעוד ומסמכים היסטוריים. הפרויקט התבצע באמצעות מוצרי ניהול התוכן דוקומנטום (Documentum), אותם משווקת בישראל NessPRO.

ב-2014 פורסם בלעדית באנשים ומחשבים כי גנז המדינה יצא לפרויקט אירכוב דיגיטלי של מסמכי המדינה, מבוסס דוקומנטום ומוטמע על ידי NessPRO. היקפו הכספי של הפרויקט, רימון – לא נמסר, אולם לאנשים ומחשבים נודע שיעמוד על עשרות מיליוני שקלים. בסופו של דבר, ייסרקו, יקוטלגו ויאורכבו מאות מיליוני מסמכים המגיעים מכאלף גורמי ממשלה שונים.

ד"ר יעקב לזוביק, גנז המדינה, אמר אז כי "היכולת לשמור מסמך למשך עשרות שנים ואז להראותו בחלוף עשרות שנים – איננה ברורה מאליה. 90% מהמסמכים אינם בעלי ערך לטווח הרחוק. בהנחה שארכיון המדינה והמדינה יתקיימו מאות בשנים – צריך לדעת לשלוף אותם, צריך לחשוף אותם לציבור – זו סוגיה גדולה ומסובכת".

הפרויקט הנוכחי של דיגיטציה והנגשת המסמכים של ילדי תימן, אמר שטרית, "נעשה בזמן שיא, של חודש וחצי". הוא ציין כי "טכנולוגיות חדשניות של יצירת ישויות ידע, העשרתן וקישורן לתיקים ולמסמכים הארכיוניים לרבות תהליכי חשיפה מתקדמים – אפשרו את בניית אחד הארכיונים המתקדמים בישראל ובעולם".

לדבריו, "העלאת המסמכים לארכיון הדיגיטלי התבצעה בהתאם להחלטת הממשלה. מוצרי דוקומנטום ששולבו בפרויקט מאפשרים נגישות מירבית ומיידית לציבור למידע על ילדי תימן, תוך שימוש ביכולות חיפוש ואיחזור מתקדמות. המסמכים ניתנים לצפיה באתר הארכיון".

מימין לשמאל: השר צחי הנגבי; אודי שטרית, מנהל חטיבת יישומי מערכות לניהול תוכן, NessPRO; ד''ר יעקב לזוביק, גנז המדינה

מימין לשמאל: השר צחי הנגבי; אודי שטרית, מנהל חטיבת יישומי מערכות לניהול תוכן, NessPRO; ד"ר יעקב לזוביק, גנז המדינה

לדברי שטרית, "תת-הפרויקט כלל סריקה של 400 אלף העמודים של שלוש ועדות החקירה שעסקו בפרשה. חשפנו את כלל המסמכים שהובאו בפני ועדות החקירה, כולל עדויות שהוצגו בהן. לאחר מכן ביצענו תהליך העשרה וחיבור בין המסמכים וקישור ביניהם. השארנו את שמות הילדים הנעלמים, והשחרנו רק את המידע הרפואי מטעמי צנעת הפרט וסודיות רפואית".

"האתגר היה לא רק טכנולוגי – אלא נדרשנו לתת מענה לרגולציות בתחום. לצד החשיפה של המסמכים, הבאנו יכולות של ביצוע חיפושים מעמיקים על נתונים שונים".

אתר גנז המדינה פותח על תשתית גוגל (Google) ועל הענן של גוגל – ובוצע על ידי אנשי קבוצת יעל, כשהמנוע של דוקומנטום – עובד תחתיו.

"פיתחנו עוד יכולות, בנוסף לניהול התוכן של פרויקט רימון", אמר שטרית. "את כל תת-הפרויקט הזה ביצענו בחודש וחצי – הודות לתשתית שהוטמעה כבר בפרויקט". הוא סיכם באומרו כי "הפרויקט דרש עבודה מאומצת ושימוש בכלים טכנולוגיים המאפשרים קליטה ומיפתוח אוטומטיים של המסמכים הרבים".

ד"ר לזוביק אמר היום (ד') כי "באמצעות המערכת של ארכיון המדינה ניתן לחשוף מידע היסטורי שהיה אגור עד כה בארכיונים פיזיים של ניירת – ללא גישה לציבור הרחב".

מימין לשמאל: דוד מרגלית, מנמ''ר ארכיון המדינה; השר צחי הנגבי; עמית דובר, משנה למנכ''ל קבוצת יעל; עומרי גלבר, מנהל הפרויקט מטעם יעל; ד"ר יעקב לזוביק, גנז המדינה

מימין לשמאל: דוד מרגלית, מנמ"ר ארכיון המדינה; השר צחי הנגבי; עמית דובר, משנה למנכ"ל קבוצת יעל; עומרי גלבר, מנהל הפרויקט מטעם יעל; ד"ר יעקב לזוביק, גנז המדינה

לדבריו, "כיום ארכיון המדינה עובר לעידן חדש, בו כלל הציבור בישראל יוכל לחפש מידע ולהתבונן בו באמצעות האינטרנט, וארכיון ילדי תימן הוא בין הסנוניות הראשונות של עידן חדש זה. הודות למערכת הממוחשבת החדשנית, יכול כיום ארכיון המדינה לגייס עובדים ללא ניסיון בארכיבאות ותוך שעות ספורות להכשיר אותם לחשיפת הנתונים ולשיבוצם במערך הכולל של המידע שמספק ארכיון המדינה".

אתר הנגשה חדש

קבוצת יעל השלימה בימים אלה את הקמתו של אתר הנגשה חדש לארכיון המדינה. בהמשך להחלטת הממשלה, הוקם בארכיון המדינה פורטל דיגיטלי ייחודי ורב-ערוצי – אינטרנט, סלולר ורשתות חברתיות, שישמש תשתית אחידה להצגת מידע לציבור, למשרדי הממשלה ולארכיונים אחרים.

הפרויקט, שהוטמע על ידי קבוצת יעל, כולל יכולות חיפוש והנגשה המבוססים על פתרונות גוגל בשילוב פתרון להנגשת מידע ארכיוני, פרי פיתוח אנשי יעל תוכנה. המערכת מייצרת חוויית משתמש ידידותית ומשלבת כלים לתצוגה וגלישה מתקדמות, כגון: מצגות, תצוגה גיאוגרפית, סרטונים ועוד.

ד"ר לזוביק אמר כי "שיתוף הפעולה עם קבוצת יעל בבניית אתר אינטרנט מתקדם וידידותי ממצב את ארכיון המדינה כאחד המתקדמים בעולם בהנגשה מקוונת של אוספיו. בזכות יכולות אלו, יכולים היום אזרחי המדינה לראות את כל החומר הארכיוני הקשור לפרשת ילדי תימן ואחרים, מבלי להזדקק לניסיון מחקרי ארוך".

עידן נוי, מנהל אגף Business Optimization בחטיבת פתרונות התוכנה של קבוצת יעל, אמר כי "הפרויקט הינו נדבך נוסף בתוכנית הלאומית לצמצום הפער הדיגיטלי וקיום ממשל זמין. במסגרתו מתאפשרת לקהל הרחב נגישות ישירה ופשוטה למידע הרלוונטי, בטכנולוגיות מתקדמות. מדובר במערכת דיגיטלית אטרקטיבית, המיועדת לציבור הרחב ולא רק לאנשי מחקר".

"המערכת עושה שימוש בחומר ארכיוני מלא – לא רק כתבות נבחרות – ומציגה אותו באינטרנט, כך שכל עדכון יהיה נגיש באופן שוטף לציבור הרחב. הפורטל מקושר למערכות הפנימיות של ארכיון המדינה ומבצע עדכון נתונים כל פרק זמן קבוע. מנוע החיפוש של גוגל ששולב בפרויקט, מאנדקס את כל החומר, כך שיהיה ניתן למצוא בדיוק את מה שמחפשים ולסנן את תוצאות החיפוש לפי נתונים שונים שנקבעו על ידי הארכיון".

תגובות

(2)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

  1. שוטיקו

    הנגבי הוסף לתמונה בפוטושופ? או שכולם?

  2. יובל

    להלן משוב על פרויקט הדיגיטציה המהולל: א. איכות סריקה ירודה. ב. אין אפשרות לחפש מלל ברמת המסמך, ולפיכך ניתן להסיק ש-OCR כנראה פתרון לא מוכר במחוזותינו. ג. חיפוש איטי.

אירועים קרובים