רד-האט מציגה מערכת לזיהוי תמונות רנטגן בבתי חולים – בעזרת ML וקונטיינרים
אבישי סבן ושון פז יציגו בכנס השנתי של רד האט את OpenShift כפלטפורמת PaaS – מאיסוף הנתונים כל הדרך אל למידת המכונה
ביום ג' הקרוב, ה-3 בנובמבר, תקיים רד-האט (Red Hat), החברה הגדולה בעולם לפתרונות קוד פתוח, את כנס Red Hat Forum, והשנה במתכונת מיוחדת של חוויה וירטואלית, שתשודר במקביל ברחבי EMEA (אירופה, המזרח התיכון ואפריקה), כולל ישראל. המסלול הישראלי יציג הרצאות, הדגמות וסיפורי לקוח, שיועברו על ידי צוותי המכירות והפיתוח של רד-האט ישראל, בשיתוף נציגי לקוחות מובילים בתעשייה.
במסגרת הרצאה שתעסוק בהעברת דטה לידע (Transforming Data into Knowledge) יציגו שון פז, ארכיטקט פתרונות ברד-האט, המתמחה בעולמות ה-Data services, ואבישי סבן, ארכיטקט פתרונות ברד-האט, המתמחה בעולמות פיתוח האפליקציות, את האתגרים העיקריים העולים בעולמות הבינה המלאכותית ולמידת המכונה והדרך לפתרונם, תוך שילוב של Openshift, קונטיינרים וקוברנטיס. כחלק מההצגה, ידגימו השניים שימוש בכלים מתקדמים של בינה מלאכותית ולמידת מכונה בעולמות המדיקל. ההדגמה תכלול דמו שמציג אנליזת צילומי רנטגן לגילוי דלקת ריאות בזמן אמת, ומראה את השתלבות רד-האט בפרויקט המשלב בין עולם הרפואה לעולם הבינה המלאכותית.
כמות הנתונים עצומה, אבל מה עם תהליך הפקת הידע מהם?
פז וסבן מציינים כי כמות הנתונים שארגונים יכולים לאסוף כיום הינה עצומה ומערך הכלים גדול. הנתונים (בצורתם הגולמית) נאספים בתשתית הפנימית בארגון, אך לא ניתן להסיק מהם מסקנות בשלבים הראשונים, ונדרש תהליך הפקה. תהליך זה כולל את הכנת הנתונים, הניקוי והטיוב שלהם – פעמים רבות, הנתונים הגולמיים אינם אמינים, ריקים או שגויים. הכנסה למנוע אנליזה (גם כחלק מ-OpenShift) ושימוש בכלי בינה מלאכותית יתרמו לקבלת המסקנות המבוקשות.
במקביל לאתגרים בעולמות הבינה המלאכותית והביג דטה, בסביבה הארגונית יש באזזז רב לגבי נושאים טרנדיים אלה. ארגונים רוצים לעסוק בכך כיום, אך בפועל, מסות הנתונים, חוסר ידע והיעדר כוח אדם מונעים מהם להגיע למטרותיהם העסקיות. מעטים עושים את זה נכון.
הרצאתם של פז וסבן תעסוק בנושא זה מהפן העסקי, מאחר שמטרת הבינה המלאכותית היא לענות על צורך עסקי – החלטה שארגון צריך לקבל על בסיס תשובות, שאותן הוא יקבל בעזרת מודל המבצע "פרדיקציות" ולמידה עצמית. מודל זה עונה לשאלות: האם להשקיע במוצר שאותו אני מפתח? האם עליי להשקיע בנתיבים אחרים? היכן נמצא קהל הלקוחות שלי? ההרצאה תציג את מושגי ה-AI (בינה מלאכותית), ML (למידת מכונה) ו-DL (למידה עמוקה) ואת השלכותיהם על הפן העסקי, ותראה כיצד יכולה רד-האט לסייע לכם במסע זה עם קשרים ושותפויות.
"מסות הנתונים מכריחות למצוא פתרונות יצירתיים"
פז אמר כי "אנחנו נמצאים בעידן שבו נתונים הפכו לנפט הארגוני, ורוב הארגונים עדיין מנסים לפתור את הקשיים של המחר עם התשתית של האתמול. מסות הנתונים מכריחות אותנו לחשוב מחוץ לקופסה ולמצוא פתרונות יצירתיים. היכולת של OpenShift לרוץ על כל סביבה בצורה אבסטרקטית – בין אם מדובר בענן ציבורי, פרטי, שרתים פיזיים או וירטואליים – מאפשרת גמישות וגדילה אופקית, מהקצה ועד לענן המרכזי. OpenShift משמש פלטפורמה למימוש המוצרים בעולמות הבינה המלאכותית ולמידת המכונה, שמעגל החיים שלהם מנוהל בצורה אוטומטית באמצעות Operators, וביניהם Kafka, Spark, Presto, Kubeflow, Kative ועוד".
"שימוש בקונטיינרים מהווה יתרון בעולמות מדע הנתונים, וחברות רבות כבר שם", אמר סבן, כאשר הוא מתאר את הלקוחות שעימם הוא עובד. "אג'יליות ואוטומציית Pipelines ללמידת מכונה באמצעות קונטיינר מאפשרות לפשט את האתגר של תהליך האימון, הבדיקה ויישום המודל".
בדמו, סבן יציג סיפור מקרה – על תהליך של למידת מכונה לתמונות רנטגן בעולם המדיקל מעל OpenShift בארכיטקטורת מיקרו-שירותים. בדמו נעשה שימוש בטכנולוגיות קוד פתוח אשר רד האט שותפה להן, כלים כמו Ceph, Knative Serverless, Kafka ו-Tekton.
התהליך מתחיל כאשר תמונה נאספת ממקום מרכזי ומשם היא מועברת לזיהוי, כאשר היא עטופה בתוך קונטיינר. כשהמודל מזהה דלקת ריאות, הוא מעביר את התמונה למקום מרכזי שבו נמצא הרופא, שמקבל את הפרטים אודות המטופל. אם אין זיהוי ודאי, המודל מסווג את התמונה כ-"אנונימית", והיא נשלחת למומחה, שיבצע Label מחדש – וחוזר חלילה. באמצעות ניתוח המידע יכולים בתי החולים למכן את תהליך הזיהוי, להקטין זמן תגובה ולנצל משאבי רופאים ומומחים בצורה יעילה.
ההשתתפות ב-Red Hat Forum 2020 אינה כרוכה בתשלום, אך יש להירשם מראש. לתוכנית הכנס ולהרשמה לחצו כאן.