הנתונים: הנפט של העידן הדיגיטלי – חלק ד'
המערכות האנליטיות הן אלה המעבירות את הנתונים הגולמיים דרך אוסף של תהליכים מורכבים עד להפיכתם למידע, ידע ותובנות עבור המשתמשים והארגונים ● ניתן להתייחס לאנליטיקה כאל בית הזיקוק של העידן הדיגיטלי, המשמש לעיבוד הנפט הגולמי והפיכתו למוצרים בעלי ערך רב
אם הנתונים הם הנפט של העידן הדיגיטלי, אזי ניתן להתייחס לאנליטיקה כאל בתי הזיקוק של העידן הדיגיטלי. ניתן לראות את בית הזיקוק כמתקן המשמש לעיבוד הנפט הגולמי והפיכתו למוצרים בעלי ערך רב. בדומה, המערכות האנליטיות הן אלה המעבירות את הנתונים הגולמיים דרך אוסף של תהליכים מורכבים (גזירה, העשרה, בדיקה, טעינה, עיבוד וניתוח) עד להפיכתם למידע, ידע ותובנות עבור המשתמשים והארגונים.
אנליטיקה איננה נושא חדש. היא החלה להתפתח קצת אחרי הופעת מערכות המידע בשנות ה 60 של המאה הקודמת, כלומר לפני כ-55 שנה. במהלך השנים המערכות האנליטיות זכו לשמות רבים וביניהם Business Intelligence ,Data Warehousing ,Decision Support Systems ובשנים האחרות Data Analytics, וכמובן הפכו ממערכות פשוטות יחסית שעסקו בעיקר בדיווח (Reporting) למערכות העוסקות בניתוחים מורכבים ועוסקות בחיזוי, ניתוח מגמות, סימולציות ועוד.
נשתמש במאמרו של פרופ' טום דבנפורט כבסיס להבנת את ההתפתחות של המערכות האנליטיות. פרופ' דבנפורט, אחד החוקרים המובילים בתחום האנליטיקה העסקית ומי שחיבר מחקרים וספרים רבים בתחום, פרסם מאמר במגזין Harvard Business Review בדצמבר 2013 שכותרתו הייתה "Analytics 3.0 – In the New Era Data Will Power Consumer Products and Services".
פרופ' דבנפורט במאמרו חילק את התפתחות המערכות האנליטיות לשלוש תקופות – אנליטיקה 1.0 – עידן הבינה העסקית שהחל להתפתח אי שם בשנות ה-60 של המאה הקודמת; אנליטיקה 2.0 – עידן ה-Big Data שהחל בסביבת שנת 2000; ואנליטיקה 3.0 – העידן המודרני של השנים האחרונות המשלב את הבינה העסקית עם ה-Big Data כתשתית לכלכלת נתונים (Data Economy), עידן שבו לא ניתן להבדיל בין העסקים לבין הנתונים – הם שלובים זה בזה. התרשים הבא מציג את שלושת השלבים האלו ואת המאפיינים העיקריים של כל שלב.
נסקור בקצרה את שלושת השלבים:
אנליטיקה עסקית 1.0 – עידן הבינה העסקית (Business Intelligence)
זהו העידן שבו תפיסת מחסן הנתונים והבינה העסקית הלכו והתפתחו. תחילה מחוללי דו"חות ושאילתות ואחר כך החלו להופיע כלים מתוחכמים לגזירת הנתונים ממערכות המקור (כלי ETL) ובהמשך כלים מתקדמים לניתוח, וויזואליזציה ותחקור. עם השנים כלים אלה הפכו למתוחכמים וגמישים.
כיום רוב הארגונים מיישמים את תפיסת מחסן הנתונים ומשתמשים בכלים אנליטיים כחלק מתהליכי קבלת החלטות ואף לפיתוח היתרון התחרותי. ניהול מחסן הנתונים הפך לחלק בלתי נפרד של המערכות המנוהלות על ידי אגפי ה IT.
המאפיינים העיקריים של עידן אנליטיקה 1.0 הם:
● מקורות הנתונים מצומצמים יחסית ועיקרם פנים ארגוניים. הנתונים ברמת מבניות גבוהה.
● הפעילות האנליטית מוגבלת יחסית וממוקדת בעיקר בהפקת דו"חות וניתוח של מה שכבר קרה (Descriptive Analytics and Reporting). מי שמבצע את הניתוח הם אנליסטים בסיסיים של BI.
● תהליך הניתוח מורכב יחסית ומחייב גזירת הנתונים ממערכות המקור, הכנתם לטעינה למחסן הנתונים וביצוע של ניתוחים באמצעות כלים אנליטיים ייעודיים.
● האנליסטים שעסקו בניתוח הנתונים פעלו מאחורי הקלעים והכינו דו"חות וניתוחים עבור המנהלים ובדרך כלל לא היו חלק מהתהליכים העסקיים וקבלת ההחלטות.
● רמת הזיקה בין האנליטיקה לבין אסטרטגיה העסקית הייתה מוגבלת והיא בדרך כלל ללא השפעה ישירה על היתרון התחרותי של הארגון.
● בחלק ניכר מהארגונים, מנהלים המשיכו לבסס את החלטות שלהם על אינטואיציה וניסיון ופחות על ניתוח של נתונים.
אנליטיקה עסקית 2.0 – עידן ה Big Data
ההתפתחות העצומה בכוח המחשוב, הירידה המתמדת בעלויות החומר ועלויות יחידות האחסון ובמקביל התפוצצות הנתונים בעקבות יישומי אינטרנט ומובייל, גרמו לאנליטיקה לעלות שלב, שלב ה-Big Data, שלב שהחל אי שם בשנות ה-2000.
אמנם המונח Big Data הופיע בשלב מאוחר יותר, בסביבות 2010, אבל חלק ממאפייניו החלו להופיע מוקדם יותר, מיד עם תחילת עידן האינטרנט. אתרי המסחר האלקטרוני והרשתות החברתיות שצמחו במהירות עצומה, הביאו איתם אתגרים חדשים בניהול הנתונים ולצורך לטפל בכמויות עצומות של נתונים ובמגוון רחב של פורמטים (טקסט, תמונות, וידיאו, קול וכד').
חברות האינטרנט החדשות והגדולות כגון אמזון (Amazon), יוטיוב (YouTube), פייסבוק (Facebook), גוגל (Google), e-Bay ואחרות, החלו לפתח שיטות וטכנולוגיות חדשות להתמודדות עם היקפי הנתונים הגדולים. הנתונים הפכו לאחד הנכסים העיקריים של חברות אלה והן החלו בפיתוח מוצרים ושירותים חדשים מבוססי נתונים. לדוגמה לינקדאין (LinkedIn) פיתחה מוצרים כגון People You May Know ו-Jobs You May Be Interested In ועוד.
נוצר הצורך בעיבוד מקבילי מסיבי ו-Hadoop היווה את אחד הפתרונות לכך. דור חדש של מערכות לניהול בסיסי נתונים נולד – NoSQL, בסיסי נתונים המסוגלים לטפל במגוון עשיר של פורמטים שונים של נתונים ובזרימה מהירה של נתונים הנכנסים לבסיס הנתונים.
טכנולוגיית מחשוב ענן גם כן סיפקה פלטפורמה לאחסון ועיבוד כמויות עצומות של נתונים. החלו להופיע גם טכנולוגיות לעיבוד נתונים בזיכרון (כמו למשל Hana של SAP) וכן טכנולוגיות שהביאו את כוח העיבוד אל בסיס הנתונים במקום להביא את הנתונים אל השרתים.
כפי שניתן לראות, הדרישות האנליטיות של העידן החדש היו שונות מאד מהעידן הראשון והביאו להופעת מקצוע חדש – מדען הנתונים (Data Scientists).
נסכם את מאפייני עידן האנליטיקה 2.0:
● מקורות נתונים חדשים, עצומים בנפחם ובגיוון גדול של פורמטים לא מובנים. ההגדרה המקובלת של Big Data נקרא V3 ומצביע על נפח הנתונים הענק – Volume, על מגוון גדול של סוגי הנתונים – Variety ועל המהירות העצומה בכניסת הנתונים למאגר – Velocity.
● יכולות אנליטיות חדשות הנדרשות להתמודד עם האתגרים החדשים.
● הופעת ההתמחות החדשה של מדעני נתונים (Data Scientist) שנועדה להתמודד עם האתגרים של עיבודים אנליטיים מורכבים וחקר נתונים מתקדם לקבלת תובנות (Insights) חדשים מתוך הנתונים.
● חברות חדשות, בעיקר ענקי האינטרנט, החלו לפתח זן חדש של מוצרים, מוצרי נתונים (Data Products) שהיוו עבורם מקור חדש של הכנסות.
● חלק משמעותי ממקורות הנתונים המשמשים לאנליטיקה עבר למקורות חיצוניים כמו סנסורים, רשתות חברתיות וכד'.
● הופעת מערכות לומדות (Machine Learning) האיצה את הצורך ביכולות מתקדמות של עיבוד נתונים וגם סיפקה פלטפורמה ליכולות ניתוח מהירות ביותר.
אנליטיקה עסקית 3.0 – השפעה משמעותית לתמיכה בכלכלת הנתונים
ניתן לחשוב שאנו עדיין בעידן השני, אולם ניתן לראות סימנים לעידן חדש של אנליטיקה. זהו העידן המשלב בצורה מיטבית את שני העידנים הקודמים. זוהי סביבה הלוקחת את הטוב מהבינה העסקית ומה-Big Data כדי לקבל תובנות מהירות ולפתח מוצרים חדשים מבוססי נתונים בעלי השפעה משמעותית על הארגון.
אמנם אנו עדיין בשלב ראשוני של עידן אנליטיקה 3.0, אולם ניתן כבר לראות ארגונים מתחומי התעשייה, שירותי הבריאות, קמעונאות, פיננסים המשתמשים בנתונים כדי לייצר אוסף חדש של מוצרים מבוססי נתונים המביאים ערך חדש ללקוחותיהם ויכולת לייצר פלטפורמות מתקדמות לקבלת תובנות מהירות עבור מנהלי הארגון.
המאפיינים העיקריים של עידן אנליטיקה 3.0 הם:
● האנליטיקה הפכה לנכס אסטרטגי, היא הכרחית לפעילות הארגון.
● יכולות לייצור מהיר של תובנות עסקיות.
● כלים אנליטיים מתקדמים זמינים למקבלי ההחלטות המסופקים ביעילות בנושאים בהם הם נדרשים.
● ההתפתחויות בתרבות הארגונית מביאות לשילוב של האנליטיקה בתהליכי קבלת ההחלטות ובתהליכים העסקייים.
● כל הארגונים יכולים לייצר מוצרים מבוססי נתונים (ולא רק ארגוני האינטרנט). אנו עדים להופעה של כלים חדשים המשלבים יכולות בתחום אחסון/שינוע/אנליזה/עיבוד והגשה בו זמנית לעומת מספר פתרונות נפרדים.
שימוש באנליטיקה כנכס אסטרטגי
להלן מספר דוגמאות לחברות העושות שימוש באנליטיקה כנכס אסטרטגי. חברת התובלה הענקית Schneider National העושה שימוש הולך וגובר של הנתונים המגיעים ממקורות חדשים (כמו רמות הדלק במשאיות, מיקום המכולות, התנהגות הנהגים ואינדיקטורים נוספים) כדי להשתמש באלגוריתמים מתוחכמים לאופטימיזציה של הלוגיסטיקה. המטרה שלהם היא לחשב מסלולים אופטימליים, להוריד את עלויות הדלק ולהקטין את מספר התאונות.
החברה התעשייתית הענקית ג'נרל אלקטריק (General Electric) הגדירה את נושא האינטרנט התעשייתי, האינטרנט של הדברים שמחבר את כל ההתקנים התעשייתיים שלהם, כיעד אסטרטגי ומשלבת בכל מוצריה סנסורים המספקים נתונים על הביצועים שלהם. היא הקימה חטיבת תוכנה ענקית, פיתחה אוסף של פרוטוקולים וכלים תחת המותג Predix ומשקיעה רבות בקידום תפיסת האינטרנט של הדברים שלה.
החברה אוספת את הנתונים, מנתחת אותם באמצעות כלי Big Data ומספקת ללקוחותיה תובנות רבות בנושא תחזוקת המוצרים וניצול אופטימלי שלהם. החברה מקדמת את הרעיון של Digital Twin, אובייקט חכם המדמה בתוכנה את פעולת המכשיר וכמובן מאפשר הפקה בזמן אמיתי של תובנות והנחיות חוזרות להתקן הפיזי עצמו.
למשל לכל טורבינת רוח שהם מייצרים ומתקינים יהיה תאום דיגיטלי המקבל נתונים בזמן אמיתי מהטורבינה עצמה. תאום זה יאפשר ניתוח בזמן אמיתי של מצב הטורבינה ולהפיק תובנות בדבר תפעול הטורבינה להפקת חשמל בצורה היעילה ביותר ולשדר אותם מיידית כדי לשנות את זווית הפעולה של הטורבינה. תדמיינו מצב שבו לכל מנוע סילון, טורבינה, קטר, מכונה לדימות רפואי ש-GE מייצרת ומתקינה יהיה תאום דיגיטלי המחובר לתאום הפיזי בזמן אמיתי ומדמה את פעולתו.
עוד דוגמה היא ענקית המוצרים פרוקטר אנד גמבל (Procter & Gamble). החברה עברה משימוש בבינה עסקית בנושאים נקודתיים לשימוש במרכז עשיית העסקים. הם שילבו את נושא האנליטיקה תוך בניית 500 חדרי דיונים מיוחדים, Business Sphere, עתירי מסכי תצוגה בהם המנהלים עוסקים בקבלת החלטות ומסתייעים בכלים ובתצוגות האנליטיות.
UPS משתמשת במערכת Orion כדי לבצע אופטימיזציה בזמן אמת של מסלולי הנסיעה עבור 55 אלף נהגיה. כל אלה הן דוגמאות של יישומים מתקדמים של אנליטיקה המשלבת את הבינה העסקית וה-Big Data כדי לייצר תובנות מהירות ויעילות ובחלק מהמקרים לייצר מוצרים מבוססי נתונים ללקוחותיה.
במאמר הבא נסקור את המודלים העסקיים מבוססי הנתונים.
סדרת כתבות מצויינות. תודה