יישום כלי ניטור וניתוח מתוצרת ברודקום באל על
חטיבת ברודקום תוכנה ב-NessPRO, קבוצת מוצרי התוכנה של נס, הציגה במפגש מיוחד שהתקיים באחרונה ועסק ב-DX NetOps – הפתרון של ברודקום לניטור ולניתוח התפעול של תשתיות תקשורת – את יישומו באל על. DX NetOps היא חבילת כלים לאוטומציה וייעול של תשתיות הרשת, שמאפשרת ניטור ביצועי רשת, ניהול תקלות ואירועים, אוטומציה של רשתות וניתוח.
מארק טוך, ארכיטקט פריסייל בחטיבת ברודקום תוכנה ב-NessPRO, ציין שלפני הטמעת המערכת של ברודקום, אל על השתמשה לניהול תשתית התקשורת שלה בכלי ניטור וניתוח שונים מתוצרת ספקים שונים. היעדר כלי מאוחד לפיקוח על כל התשתית הפך את הטיפול בתקלות בחברת התעופה לתהליך מייגע, שארך זמן רב. לאל על היו כלים נפרדים לניטור זמינות תשתית התקשורת, היו בעיות בניתוח התקשורת באמצעות לוחות מחוונים וגרפים, והיה כלי נפרד לניתוח תעבורת NetFlow. לא היה לה כלי אחוד שאפשר לקבל מבט כולל על מצב תשתית התקשורת.
אל על זיהתה את הצורך בכלי WebUI אחוד לניטור ולתחקור של כלל תשתית התקשורת בארגון. בנוסף, החברה דרשה חיבור OOTB ל-MOM שלה, תוך ייעול זמני התגובה ומיקוד שורש הבעיה בתקלות.
זאת ועוד, אל על הכירה בחשיבות של ניתוח והצלבת המידע לצורך הפקת ערך מוסף במיקוד המשאבים לטיפול מיידי ויעיל בבעיות. החברה גם ביקשה ליצור שפה אחידה לתקלות, עד לרמת ההתראות ב-SMS. כמו כן, היא ביקשה להעלות את הרציפות העסקית וזמינות המערכות.
כך הפתרון של ברודקום סייע לאל על
טוך הביא בדבריו כמה דוגמאות לתהליכי הניטור והניתוח באמצעות הכלים של ברודקום באל על. כך, לדוגמה, ניתוח עומסי התעבורה ברשת מטרמינל 3 ואליו, כולל צילומי וידיאו ממצלמות האבטחה, ואפליקציות עסקיות שונות, כאשר החברה מקבלת התראות על קווים שסובלים מעומס יתר – דבר שעשוי להצריך שדרוג של הקו, ועל "קפיצות" בתעבורה, שעלולות לגרום לבעיות ברשת. דוגמה נוספת היא לוח מחוונים שמראה מעקב אחר התעבורה בקווים החשובים ביותר בארגון. כמו כן, מנתחת המערכת תלונות על בעיות שונות בתשתיות. בנוסף לכך, קיים מעקב אחר ניצול הקיבולת של אתר ה-DR, מעקב אחר יציבות אתר האינטרנט של אל על ועוד.
אל על הוסיפה במהלך 2022 פתרון של AppNeta, שמאפשר לצוותים שלה לעקוב אחרי הביצועים של אתרי החברה מנקודת מבטו של לקוח הקצה, ממקומות שונים ברחבי העולם. כמו כן, המערכת מאפשרת למדוד רוחב פס בין אתרים של החברה ומול ענן Azure, ולתחקר בעיות תקשורת גם בקמפוס של החברה וגם מול ISP או ספקי ענן.
בהמשך המפגש דיבר חן עמרם, ראש אגף תשתיות ואבטחת מידע באל על, שאחראי לשמירה על יציבות וזמינות המערכות בחברה. עמרם הדגיש את החשיבות שיש לארגון ב-100% זמינות של המערכות שלו. "זהו המדד שלפיו אני נבחן ביום יום", ציין. "זמינות התשתית לכל הארגון היא מדד חשוב שבו אנחנו נבחנים, ובנוסף לכך, אחד ממדדי הביצוע המרכזיים (KPIs) שבהם נמדדים אנשי השו"ב הוא אילו תקלות דווחו על ידי השו"ב לפני שהלקוח דיווח עליהן".
עמרם ציין שחלק מתשתיות הדיגיטל והאפליקציות של אל על הן היברידיות, וחלקן במלואן בענן, ואנשי השו"ב בחברה צריכים לראות את הבעיות בלוח המחוונים שלהם, ולא להגיע למצב שבו לקוח מתקשר ואומר שמערכת מסוימת אינה עובדת מבלי שהם יודעים זאת. "התשתיות הן נרחבות מאוד, וכוללות קמפוס גדול בנתב"ג ועוד כ-80 נציגויות ברחבי העולם. המערכות משולבות זו בזו, וכולם צריכים לקבל את אותו השירות 24 שעות ביממה", אמר עמרם.
הוא אמר שכדי להתמודד עם האתגרים האלה, הצוות משתמש כמעט בכל הכלים של ברודקום, ובכלים נוספים, במטרה לבצע את הניטור הדרוש של התשתית, האפליקציות והדיגיטל – דבר שמאפשר מבט מקיף על כל המערכת. עמרם הוסיף שהניטור מתבצע הן על המערכות של הארגון והן על ספקי תוכנה כשירות (SaaS).