מצא את ההבדלים: BI מול ביג דטה
נדמה שרבים מבלבלים בין BI וביג דטה ● אייל בירן, סגן ראש החטיבה הבנקאית בבנק לאומי, עושה סדר ומסביר את ההבדלים בין השניים
ביג דטה. BI. ביג דטה. BI. נדמה שאין מושגים שמתערבבים יותר משני המושגים הללו. לא אחת אני שומע על ארגונים שרוצים להתפתח בעולם הביג דטה ושואלים איך ליישם פעילות BI. מנגד, אני נתקל במומחים שונים שעיקר פעילותם הוא בעולם ה-BI, אולם הם מתיימרים להבין ולייעץ גם בביג דטה. על תקן מורה נבוכים, אנסה לעשות סדר בעולמות המעט חופפים הללו.
אתחיל מהסוף, משתי עובדות ברורות: הראשונה היא, שביג דטה אינו מושג שווה ערך ל-BI. מדובר בשני שלבים שונים בעולם האנליזה. האחד מוקדם וכללי והאחר בשל ומתפתח. מי הוא מי? מיד נגלה; העובדה הברורה השניה היא, שעולם הביג דטה אינו עוסק דווקא בהיקפים של כמויות וגודל, אלא דווקא במורכבות וביכולת להעשיר מידע סטנדרטי במידע אחר על מנת למקסם את ערכו. על כך בטורים אחרים, אולם בכל זאת חשוב לזכור זאת כבר עתה.
להלן ההבדלים:
שלב ה-BI
מדובר למעשה בחקר וניתוח נתונים. לרוב יבוצעו הפעולות בו על ידי אנליסטים שמפעילים תוכנות מחקר מסוג ה-BO (ר"ת Business Objectives) או תוכנות מתקדמות יותר שיקבלו משימות שונות וקבצי דטה. הרצת התוכנות על הדטה תאפשר קבלת תמונה של תוצאות / מגמות / השוואות / גרפים / ממצאים מספריים. למעשה, פעולות BI מספקות לנו מידע עסקי או אחר, שמציג את הדטה שחקרנו באופן תוצאתי. לרוב נענה בחלק זה על שאלות מוכרות לנו, כגון: מה קרה? מה היה? מתי? היכן? מה התוצאה?
לדוגמה, ניתן לחשוב על כל דו"ח בסיסי שמבקשים מנהלים בשגרת יומם: דו"ח מכירות והכנסות, דו"ח הוצאות, דו"ח אזורי או דו"ח דמוגרפי. מדובר בשאלות ידועות מראש שעליהן אנחנו מחפשים תשובות ברורות, ממוקדות ומיידיות.
בעולם ה-BI לוקחים דטה שקיים בארגון או בפעילות, ומגישים אותו כמידע למקבלי ההחלטות. בחלק מהמקרים המידע אף יוגש באופן גרפי/ויזואלי, כולל תובנות ראשוניות תוצאתיות: מה עלה ומה ירד? מה הממוצע? מה השכיח והחציון? מה היה בתקופה מקבילה או בתקופה דומה? מה הפער מול המתחרים או מול היעדים? ויזואליזציה מתקדמת יכולה לעזור בהצלחת הטמעת פעילות ה-BI ולעודד שימוש בחקר הנתונים בשאלות הבאות.
שלב הביג דטה
כאן כבר מתבצעת קפיצת מדרגה בחקר הנתונים. כבר לא נסתפק בהצלבת המידע ובהגשתו הלאה, אלא ננסה להביא מתוך המידע גם תובנות (Insights). מדובר על שלב שבו המידע הראשוני מנותח על ידי Scientists Data שהתמחותם הינה בחקר נתונים מעמיק המשתמשים בתוכנות שונות מהמתקדמות בשוק על מנת להוציא את המוץ מהתבן.
בשלב הביג דטה, הנתונים אינם משמשים ליצירת מידע בלבד, אלא ליצירת ערך של ממש. המידע מקבל השבחה משמעותית והתובנות בגינו יכולות להשפיע על השורה התחתונה בדו"ח הרווחיות הבא או על פעילות השיווק האפקטיבית המתוכננת לחודש הקרוב.
אופן שאילת השאלות משתנה בשלב הזה – משאלות עבר לגבי מה היה, אנו עוברים בניתוח הביג דטה לשאלות העוסקות באנליזה חיזוי וניבוי: מה יהיה? מה יקרה אם? מה יכול להיות? לדוגמה, נוכל להסתכל על דו"ח של פעילות לקוחות באתר אינטרנט ולנתח אותו במימד של מה עשו לקוחות דומים באתר מקביל ומשם לנסות לחזות מה יהיה המוצר הבא שיתאים לכל לקוח שגולש באתר.
חקר הנתונים בשלב הביג דטה ישלב הצלבות של מידע מובנה הקיים בשוטף בארגון ומידע לא מובנה שייווצר בעזרת כלי איסוף וניטור מתקדמים, כמו כלי ניתוח טקסט או ניתוח דפוסי גלישה ויתורגם על ידי מודלים אנליטיים של חיזוי וניבוי פעילות וטרנזקציות. בשלב הביג דטה נמצא גם מעורבות של מערכות מיכוניות אוטומטיות (Machine Learning) הלומדות את החזרות השונות בפעילות ומאפשרות למידענים לנתח קבוצות או פרטים בצורה מדויקת יותר.
לסיכום: BI זו התחלה חשובה ופעילות מחויבת במציאות העסקית, אולם ביג דטה הינו שלב מתקדם הרבה יותר שלמעשה יוצר את הפער ושובר השוויון בין ארגון שיפרוץ בשנים הבאות למתחריו, ובין ארגון שיישאר מאחור.
* אייל בירן הוא סגן וממלא מקום ראש החטיבה הבנקאית וראש אגף הפיתוח העסקי והדיגיטל בבנק לאומי
במדעי המחשב קיים אתגר חדש - כיצד מעבדים כמויות אדירות של נתונים (עשרות פטה-ביט) בזמן סביר תוך שמירה על רמות אחזור ודיוק (recall & precision) גבוהות וניתוח BI של כמויות נתונים בלתי נתפשות אלה. אחת הדרכים היא עיבוד מקבילי של חלקי התצריף - גישה שמביאה עימה בעיות שלא זה המקום לפרטן. למשל, מערכת ההפעלה המדהימה HADOOP מאפשרת לחלק את הנתונים למכונות שונות ולתאם את פעילות העיבוד בצורה יחסית נוחה למה שהיה אפשרי לפני השקתה. מקורות מומלצים: gartner.com/it-glossary/big-data gartner.com/technology/webinars/business-intelligence-big-data.jsp
בליל של מילים וסיסמאות, בעולם האונליין ביג דאטא זו טכנולוגיה שגורה ומתחיייבת לאור נפחי המידע העצומים. ביג דאטא לא משמש בשביל לשאול שאלות אחרות אלא על מנת לספק פתרון מהיר יעיל ומקיף בכל אספקט עסקי. רק עכשיו הבנקים מתחילים לשאול את השאלות הנכונות שבמרבית התחומים כבר מוכרים ועל בסיסם כבר קיימים מודלים ופתרונות עסקיים
זה נכון לבנקים במדינה כמו ישראל כשאתה חברת טלקום עולמית , פלטפורמת פרסום עולמית , מנהל מליארד אפליקציות או חוקר ייצור של צ׳יפיים אז ה big data בא לך טבעי איסוף וניתוח של מאות מיליארדי רשומות , כולל bi מעליו , אנליטיקה מגמות וכל מה שרשום בכתבה על המידע הזה