Big Data בחלקים קטנים – פרק ג': Machine Learning vs. Data Scientists
הפעם נעסוק במושג Machine Learning, ננסה להבין איך לא להתיימר ללזקוף לטובת מוצרים יכולות שלא ממש יש להם ונלמד שהכל ,עדיין, מתחיל בהגדרת מטרות ושאילת שאלות
Machine Learning vs. Data Scientists
No one would have believed that
in the last years of the 19th century
that human affairs where being watched
from the timeless worlds of space
No one could have dreamed we were being scrutinized
as someone with a microscope studies creatures
that swarm and multiply in a drop of water
כך מתחילה ונפתחת יצירת המופת שנוצרה ב-1978 – War Of The Worlds (Part 1) – Eve of war. קריינותו של ג'ף ווין את המילים הנהדרות האלה מלווה אותי מאז ועד היום.
בין אם אתם מאלה שמכירים את היצירה היטב ובין אם רק שמעתם אותה, ניתן להבין מהר מאוד במה היא עוסקת: השתלטות של חייזרים מכוכב אחר על כדור הארץ. לילה אחד ב-12 באוגוסט בו העולם נכבש תחת כח המכונות.
מה מביא אותי אחורה בזמן לשמוע שוב את היצירה הזו? Machine Learning. כן, כן – אותו מושג טרנדי שחוזר על עצמו בעולם ה-Big Data. כל ספק שמנסה למכור את מוצריו מסביר לך בכל הזדמנות שניתנת לו שאתה לא באמת עוסק בעולם ה-Big Data אם אתה לא נעזר ביכולות של Machine Learning.
למה כולם מתכוונים? לאותם כלים שדרכם ממנפים יכולות של עיבוד מידע גדול ורחב ומריצים באמצעותם אלגוריתמים שונים על מנת לזקק ולנתח מידע ומשמעויות שונות והכל באופן אוטומטי ובמהלכי עיבוד מתוזמנים ואף בריל טיים.
אז מה לזה ולג'ף ווין אתם שואלים? אין פה נסיון להיות אפוקליפטי או דרמטי ותיאור המכונות שכובשות את העולם אינו מה שאני חוזה שיתרחש אצלנו עקב השתלטות של איזו מכונה לניהול המידע על האנליסטים שמפעילים אותה. יחד עם זאת, הקו המקביל שאני כן רואה הינו אותו תחום אפור בין שימוש במכונות לתלות במכונות.
הטענה שלי היא שעולם ה-Big Data, מורכב ככל שיהיה וטכנולוגי ככל שיהיה, עדיין חסר ערך בלי תובנותיו של אותו האנליסט שמפעיל את המוצרים, מריץ את התוכנות ועומד מאחורי "המכונות".
באין ספור פגישות עם ספקים אני נתקל באמירות היומרניות שהמוצר של אותו ספק יודע להריץ את עצמו לבד, לשאול את השאלות העסקיות ולהביא תובנות רבות ערך לארגון. ושוב אני מסביר לכל מי שרוצה לשמוע שאין כזה דבר שנקרא מוצר שיודע לשאול לבד את השאלות העסקיות הרלבנטיות. תמיד השאלות הראשוניות יוגדרו על ידי האנליסטים בעסק, אותם Data Scientists מקצועיים בתחומם, בעלי ניסיון עסקי, שיודעים מה העסק באמת מחפש.
ממש כמו אליס בארץ הפלאות. היאשואלת את השפן: תסביר לי באיזו דרך ללכת? השפן עונה לה בשאלה: לאן את רוצה להגיע, אליס? אליס משיבה: אני לא יודעת, ואז השפן מסביר לה: אם אינך יודעת לאן את רוצה להגיע, מה זה משנה באיזו דרך תבחרי?
זהו כל העניין. חקר המידע תמיד יתחיל בהגדרת מטרה ומה רוצים להשיג. אותה מטרה צריכה להיות מוגדרת על ידי הצד העסקי ותמיד הגדרה זו תכלול את השאלות הרלבנטיות.
אין מוצר, ואל לנו להתיימר שיהיה כזה, שיודע ללמוד את הנתונים ולשאול מכאן שאלות עסקיות רלבנטיות. אני לא מתכוון לכלים שמנטרים ומנגישים מסעות לקוח ברשת או דפוסי התנהגות. אלה כלים ש-"צופים" על המידע ומתרגמים אותו לידע. עדיין, השאלות שהכלים הללו "שואלים" והמסעות שהם מנטרים מוגדרים על ידי גורמי אנוש. משמע, על ידי המידענים שבעסק.
Machine Learning הוא מושג מטעה. ספקים עושים בו לעיתים שימוש לא נכון ועלולים לגרום לנציג עסק לא מנוסה לפתח ציפיות לא רלבנטיות. אם העסק לא יודע מה הוא מנסה להשיג ומה הוא רוצה לשאול שום מכונה או מוצר לא יעשו זאת במקומו.
איני בפתחה של מלחמת עולמות ואף אחד עוד לא ממש מאיים על כדור הארץ, אבל בואו נחליט שלא נתיימר לזקוף לטובת מוצרים יכולות שלא ממש יש להם ונבין שהכל, עדיין, מתחיל בהגדרת מטרות ושאילת שאלות. ואם אתם לא ממש יודעים לאן אתם רוצים להגיע, תחקרו ותלמדו, כדי שלאחר שתבחרו בדרך, לפחות תיהנו ממנה.
הכותב הוא סגן וממלא מקום ראש החטיבה הבנקאית וראש אגף הפיתוח העסקי והדיגיטל בבנק לאומי.
לפרקים הקודמים:
תגובות
(0)