Big Data – מרימים את הכפפה
חלק ראשון מתוך ארבעה
מה החידוש ב-Big Data? הרי תמיד התעסקנו בנתונים, אחסון, מיון, שליפה וכו'. אלא שהמגמה של הצטברות כמויות ענק של מידע בארגון, שרובו הגדול בלתי מובנה, גרמה לכך שניתן שם לנושא וחברות מציעות פתרונות שונים להתמודדות עם האתגר הזה.
עובדה היא שאנחנו נמצאים בעיצומה של מהפיכת מידע. ארגונים נדרשים להתמודד עם כמויות נתונים ונפחי מידע אותם הם לא הכירו בעבר, ונדרשים לפעול לשם כך בהיבטי העיבוד והניתוח בצורה שונה. העולם השתנה ומקורות המידע הפכו למגוונים יותר, והם כוללים את המדיה החברתית. היחידות העסקיות דורשות יותר שירותים וניתוחים מבוססי מידע, והכול מהר יותר – קרוב לזמן אמת. לכולם ברור, כי כמות הנתונים עימם ארגונים נאלצים להתמודד, גדלה. סדר הגודל הוא כ-50% בכל שנה, כאשר בשנים הקרובות שיעור הצמיחה יהיה גדול אף יותר, בשל הרצון להכניס למחסני הנתונים גם מידע בלתי מובנה, מעולם האינטרנט ורשתות חברתיות. מנהלים רבים אומרים שכמות המידע שעומד לרשותם גדולה מדי מכדי להתבסס עליו לצורך קבלת החלטות. מצב זה מהווה עבור הארגונים אתגר טכנולוגי, אך גם הזדמנות עסקית.
לתופעת הגדילה האקספוננציאלית של נתונים בארגונים קוראים כיום "Big Data". נפח המידע, מגוון מקורותיו, והמהירות שבה הוא מתקבל, הם שלושה היבטים עיקריים שמשפיעים. מקובל להתייחס למידע הגדול מ-10 טרה ביטים כאל Big Data.
סוף שנת העסקים מתקרבת ועמה נפתחת עונת התחזיות לשנה הבאה ולאלו שיבואו אחריה. שתי חברות המחקר הגדולות, IDC וגרטנר (Gartner), פרסמו את התחזיות הראשונות שלהן ל-2012, שנכתבו על סמך שיחות עם גורמים בשוק, משתמשים וחברות ספקיות. שתי החברות ציינו בראש התחזיות שלהן שתי מגמות: מיחשוב ענן ו-Big Data.
להערכת IDC, למרות המיתון עליו מדברים כולם, ההוצאות העולמיות על IT יצמחו מדי שנה ב-7% ויגיעו בשנת 2020 להיקף של 5 טריליון דולרים. תחזיות אחרות שפורסמו באחרונה גורסות, כי על המנמ"רים להפנים שענף ה-ICT הופך להיות ענף של שירותים וצריכה שוטפת מצד משתמשים רבים, בדומה למודל של חברת חשמל, ולכן האתגר של המנמ"ר בשנים הבאות יהיה לסייע לארגונים לטפל בנפחים ההולכים וגדלים של המידע הנצבר בארגונם – גידול שהוא אחת התוצאות הישירות של המעבר לענן.
על פי IDC, יצטרכו המנמ"רים להתמודד עם אתגרי איחסון שמעולם לא התמודדו איתם בעבר. כך, עד סוף 2012 הם יצטרכו להתעסק עם כ-2.43 זטה-בייטים במידע לא מובנה. הבעיה תחריף גם מכיוון אחר, עקב התגברות של תופעת מיזוגים ורכישות שתגדיל היקפי המידע שארגונים ממוזגים יצטרכו להתמודד עמם, ולתת מענה לאוכלוסיה גדולה יותר של משתמשים, מבלי להפוך את משאבי האחסון לבור ללא תחתית.
טכנולוגיות חדשות של "מידע מבוית" מוזילות את עלויות יצירת, שמירת, ניהול ואיחסון המידע בשישית לעומת העלויות המקבילות ב-2005. כך, עלות טיפול בג'יגה-בייט מידע עמדה לפני שש שנים על 18.95 דולרים וצפויה לעמוד על 0.66 דולרים ב-2015. נתון נוסף מעלה, כי היקף ההשקעה של ארגונים ביקום הדיגיטלי – מחשוב ענן, חומרה, תוכנה, שירותים וצוותים – שנועדו ליצור, לנהל, לאחסן ולחולל הכנסות ממידע גדל מאז 2005 ב-50% לסכום של ארבעה טריליון דולרים. ב-2005 עמד היקף ההשקעה על 2.7 טריליון דולרים והוא צפוי להגיע ל-5.2 טריליון ב-2015.
מחקר נוסף של IDC קובע, שב-2011 ייווצר וישוכפל מידע בנפח עצום של 1.8 זטה-בייט (1.8 טריליון ג'יגה-בייט, או 1.8 מיליון פטה-בייט) – נתון המשקף מצב לפיו כמות המידע בעולם מוכפלת מדי שנתיים. כמויות המידע האדירות האלה הן כמובן "Big Data" במיטבו. סטיב באלמר, מנכ"ל מיקרוסופט (Microsoft) העולמית, אמר לא מכבר, כי חברתו מכפילה את המאמצים שהיא משקיעה בתחום ה-"Big Data", מאחר ולטענתו זה עומד בראש סדרי העדיפויות של לקוחות החברה.
גם חברת המחקר והייעוץ הבינלאומית מקינזי (McKinsey) התייחסה לנושא זה, והגיעה למסקנות דומות לדעה הרווחת: Big Data הוא אתגר ניהולי וטכנולוגי ממדרגה ראשונה, שארגונים חייבים לדעת להתמודד איתו. במסגרת המחקר, ניסחו חוקרי מקינזי חמש עצות מעשיות להתמודדות עם ים המידע ששוטף אותנו, ועם היכולות המתרחבות המאפשרות כמעט לכל אחד לאסוף כל סוג מידע שהוא רוצה ולאחסן אותו באין מפריע על כל מדיה.
המסקנה הראשית העולה מהמחקר, היא שאיסוף, שמירה וניתוח של Big Data לצרכים הפנימיים של הארגון, יכולים לייצר ערך מוסף לעולם הכלכלי, ולהביא להגדלת הפרודוקטיביות והתחרותיות של ארגונים. החוקרים של מקינזי סבורים, שחברות וקובעי מדיניות חייבים להשקיע הרבה יותר מאמצים כדי למקסם את הפוטנציאל הטמון ב-Big Data. להלן חמש הדרכים שניסחו מומחי החברה להעצמת ה-Big Data בארגון:
1. הנגשה ברמה גבוהה יותר של המידע הנכלל בקטגוריה של Big Data. שקיפות יכולה למנוע שימושים לא ראויים במידע – במיוחד בסקטור הציבורי
2. ככול שהמידע משקף עומק רב יותר – כך הוא חזק יותר. כך, ככול שארגונים ישמרו יותר ויותר מידע על מדיה דיגיטלית, הם יוכלו לנתח אותו טוב יותר
3. Big Data מאפשר לארגונים לייצר סיגמנטים מגוונים שמתורגמים לשירותים התואמים את ציפיות המשתמשים. מהלך זה מומלץ מאוד על ידי מקינזי, במיוחד בסקטור הציבורי
4. יש לעשות שימוש באלגוריתם אוטומטי שימנע תהליכים ידניים או חצי-אוטומטיים שיובילו לקבלת החלטות לא נכונות. ניתוח מעמיק ביותר של מידע יכול לשנות מציאות המבוססת על קבלת החלטות של מנהלים שמה שמניע אותם זה מידע ממקורות שונים
5. יש לשאוף תמיד לחדשנות במודלים עסקיים, במוצרים ובשירותים. ה-Big Data יכול לשפר מאוד את דרך העבודה של מחלקות הפיתוח, בהיותו מסוגל להביא מידע מפולח ומעמיק על אירועי מכירות של שירות ומוצרים
גם אנליסטים שצופים האטת פעילות בשוק ה-IT בשנת 2012 מעריכים שתחום ה-Big Data יתפתח ויקבל האצה משמעותית, כאשר ה-"אחראים" לכך יהיו בין היתר מיחשוב הענן, הווירטואליזציה, הרשתות החברתיות וה-BI – שנמצאים כולם בתנופה גדולה.
כתבה מעניינת מאוד גם אני חושב שמיקרוסופט עדין לא במשחק בכלל אנחנו בטווינגו מטמיעים SYBASE IQ ו-VERTICA ומכירים את הנושא של BIG DATA מעל 10 שנים נשמח לסייע
עצמון מינס זורק לחלל האויר BUZZWORD - והוא BIG DATA. הרי BIG DATA מחביא מאחוריו כל מיני טכנולוגיות שונות בתכלית - ודווקא מיקרוסופט לא משחקת היום בכלל במגרש הזה - אין לה שום מוצר BIG DATA אמיתי (ובטח שלא SQL Server). כשהולכים לעולם של BIG DATA - הרי שמדובר בשינוי מבני מהותי בתשתית של המערכות וזה עניין יקר ומורכב מאד ולכן זה יקח זמן עד שנראה מערכות BIG DATA בארגונים בישראל כמו שגוגל, פייסבוק, לינקדאין, יוטיוב וכו' כבר מיישמות BIG DATA. BIG DATA מחביא המון בעיות: אין סטנדרטים, אין מספיק מומחים בתחום ואין חברות מובילות באמת שעומדות מאחורי מוצרי ה-BIG DATA המובילים כמו HADOOP ,MONGODB, CASSANDRA וכו'. גם אין כלי BI שיודעים לעבוד בצורה סטנדרטית מול מאגרי מידע כאלה.