ארכיון המדינה יצא לאירכוב דיגיטלי מבוסס דוקומנטום בהיקף עשרות מיליוני שקלים
מטמיעים את הפרויקט אנשי NessPRO, קבוצת מוצרי התוכנה של נס ישראל ונציגת דוקומנטום בארץ, יחד עם אנשי ה-IT של הגנז ● בסופו של הפרויקט ייסרקו ויאורכבו מאות מיליוני מסמכים
גנז המדינה יצא לפרויקט אירכוב דיגיטלי של מסמכי המדינה. הפרויקט מבוסס מערכת ניהול תוכן דוקומנטום (Documentum) מבית EMC, ויוטמע על ידי אנשי NessPRO, קבוצת מוצרי התוכנה של נס ישראל ואנשי ה-IT בארכיון המדינה. היקפו הכספי של הפרויקט לא נמסר, אולם לאנשים ומחשבים נודע כי הוא יעמוד על עשרות מיליוני שקלים.
הפרויקט החל בשנה החולפת, חלקים ממנו כבר עובדים והוא צפוי לארוך שנים רבות. בסופו של דבר, ייסרקו, יקוטלגו ויאורכבו מאות מיליוני מסמכים המגיעים מכאלף גורמי ממשלה שונים. את הפרויקט חשף ד"ר יעקב לזוביק, גנז המדינה, ארכיון המדינה, בכנס DOCUFORUM – הדור הבא שערכה NessPRO, קבוצת מוצרי התוכנה של נס ישראל. האירוע, בהפקת אנשים ומחשבים, נערך היום (ה') באולם קסיופיאה, קניון ארנה הרצליה פיתוח. לכנס הגיעו 150 מלקוחות החברה והנחה אותו האמן העל חושי שימי אטיאס.
ד"ר לזוביק הציג כיצד ייראה הארכיון הדיגיטלי שיעמוד לרשות הקהל. הוא פתח בסיפור, לפיו לאחר חתימת הסכם השלום עם מצרים, בעקבות הסכמי קמפ דיוויד בסוף שנות ה-70', אמר ראש הממשלה המנוח, מנחם בגין כי "יש דברים רבים שלא ניתן עדיין לחשוף, ובחלוף השנים ניתן יהיה לספר אותם לציבור". בשבוע שעבר, אמר ד"ר לזוביק, "חשפנו לציבור עשרות רבות של מסמכים שבגין אמר שאינו יכול לדבר עליהם – אבל ביום מן הימים ניתן יהיה להראותם".
"היכולת לשמור מסמך למשך עשרות שנים ואז להראותו בחלוף עשרות שנים – איננה ברורה מאליה", אמר גנז המדינה. הוא תיאר את המשימות של הארכיון: תיעוד בעל ערך היסטורי במשרדי הממשלה; הבאת המסמכים להפקדה בארכיון; שמירה לטווח רחוק; חשיפה לציבור; סיוע לחוקרים ולהיסטוריונים.
"90% מהמסמכים אינם בעלי ערך לטווח הרחוק", אמר ד"ר לזוביק, "בהנחה כי ארכיון המדינה והמדינה יתקיימו מאות בשנים, אז צריך לדעת לשלוף אותם, צריך לחשוף אותם לציבור – זו סוגיה גדולה ומסובכת".
תפקידי הארכיון בעידן הדיגיטלי, אמר, הם: רגולציה על יצירת תיעוד המסמכים במשרדים; זיהוי תיעוד בעל ערך היסטורי; הבאה להפקדה בארכיון; שמירה ושימור; סריקה ודיגיטציה של תיעוד היסטורי עם יכולת לחשיפה עתידית; חשיפה לציבור ורישום עשיר; הנגשה ושירות לציבור הרחב "כי ארכיון חייב להיות נגיש לכל ילד בן 7 שרגיל לקבל כל מידע בגוגל (Google) וביו-טיוב (YouTube)". בימים אלה, אמר ד"ר לזוביק, "אנו סורקים מדי יום 150 אלף מסמכים, בקצב הנוכחי נסיים בעוד 40 שנה".
הגנז אמר כי בשנה החולפת החליטה הממשלה על סדרת החלטות של הגדרה מחדש בתחום, המתקצבות אותו לטובת הפרויקט. "הממשלה הבינה את הצורך לעבור מעולם של נייר לעולם דיגיטלי", אמר, "קיבלנו תקציב מכובד וחובת ההוכחה עלינו. חברנו לנס והתחלנו לעבוד על מערכת רימון".
בהתייחסו למערכת ניהול התוכן דוקומנטום, אמר ד"ר לזוביק כי "רצינו מערכת שתעשה את התהליכים אבל גם תתפוס את הידע. למשל זיהוי של תיעוד במשרדים, שיביא לידע אודות המסמך, נסיבות יצירתו, ועוד פריטי מידע בעל ערך".
הוא תיאר את פרויקט האירכוב וניהול הנתונים בארכיון המדינה כפירמידה. בבסיסה, אמר, מצויה שכבה תחתונה ובה פריטים, מאות מיליוני דפים, שהם הנתונים. שכבה מעל היא המטה-דטה, הדרך בה מתארים את הפריטים. מעליה יש שכבת ידע – למה יצרו את המסמך. ומעל – מגוון יישומים.
הידע, אמר הגנז, מופיע בשמונה סוגים: ידע אודות המשרדים, שם הנתונים נוצרו; הפונקציות שהיו במשרדים; האישים הרלוונטיים; החלטות החשיפה, בכפוף לצנזורה ולביטחון המדינה; נושאים שונים; האירועים; אירועים נילווים; תיעוד נילווה. "יצרנו ישויות ידע ואנו עוברים על כל פריט ופריט", אמר, "אנו בונים לעצמנו מערכת שתאגור בתוכה המון חומר". הוא סיים באומרו כי "הדרך ארוכה. אנו בעיצומה של הקמת המערכת, היא בחלקה מבצעית וחלקה בפיתוח. נעשיר את המערכת במגוון פריטי ידע".
נשמח לעזור בסריקת מסמכים עבור הארכיון הדיגיטלי המתהווה בימים אלה. סקאנבוק מתמחה במתן שירותי סריקה למסמכים, ספרים ועוד.