הנתונים: הנפט של העידן הדיגיטלי – חלק ג'

כיום מערכות תוכנה מסוגלות לזהות בצורה טובה דיבור, פרצופים או חפצים, להמליץ על ספרים וסרטים ללקוח בעקבות למידה של הרגליו ● אם בפרדיגמה הקודמת התכניתן נדרש להגדיר את האלגוריתם, בפרדיגמה החדשה אין צורך בכתיבת תוכנה, אלא בחשיפת המערכת לעוד ועוד נתונים

רז הייפרמן, מנכ"ל משותף ויועץ בכיר לחדשנות דיגיטלית ב-B-Digital. צילום: קובי קנטור

השנים האחרונות הביאו לשינוי דרמטי בתחום מדעי המחשב, מעין מהפכה שקטה שהביאה לעליה חדה בשימוש בנושא המכונות הלומדות, ענף של תחום האינטליגנציה המלאכותית. האינטליגנציה המלאכותית היא ענף מחקרי ותיק בתחום מדעי המחשב, נושא שעורר את דמיונם של רבים אולם לא פרץ למרכז הבמה.

במשך עשרות שנים הייתה פרדיגמה מקובלת בעולם המחשוב – האדם הוא זה שמפתח את האלגוריתם ומעביר (מתכנת) אותו לשפת מחשב כלשהי. המחשב מבצע במהירות ויעילות את מה שהאלגוריתם קובע. הוא מקבל קלט מסוים והופך אותו לפלט מסוים בהתבסס על ההנחיות של האלגוריתם. המשמעות היא שעל המפתח של האלגוריתם להתייחס לכל המצבים האפשריים ולהגדיר מה המחשב יעשה בכל מצב כזה. התרשים הבא מתאר פרדיגמה זו.

הפרדיגמה המקובלת של תכנות

הפרדיגמה המקובלת של תכנות

לסוג מסוים של יישומים וביניהם ראיה, זיהוי דיבור, תרגום, רובוטיקה ועוד, פרדיגמה זו לא פעלה היטב ולמרות שנות מחקר רבות המדענים לא הצליחו לפתח אלגוריתמים טובים. ההתפוצצות בכמות הנתונים הדיגיטליים, תופעה אותה תיארנו כבר, הביאה מצד אחד לצורך בניתוח כמויות הולכות וגדלות של נתונים מסוגים שונים ומצד שני השלימה את היכולת של למידה מתוך הנתונים.

הרעיון, הלא חדש חייבים לומר, של ללמוד ולהסיק את האלגוריתם מתוך הנתונים ואת החלפת התכניתנים במערכות תוכנה לומדות, הביא להופעת הפרדיגמה החדשה – מכונות (מערכות) לומדות. אלו מערכות תוכנה המשנות את עצמן ככל שהן נחשפות ליותר נתונים, כלומר לומדות מתוך הנתונים.

כיום מערכות תוכנה מסוגלות לזהות בצורה טובה דיבור, לזהות פרצופים של אנשים או חפצים, להמליץ על איזה ספרים כדאי ללקוח לקרוא או איזה סרטים לראות בעקבות למידה של הרגלי הקריאה או הצפייה של לקוחות. אם בפרדיגמה הקודמת התכניתן נדרש להגדיר את האלגוריתם ומה על המחשב לעשות בכל מצב, בפרדיגמה החדשה ולמשימות מסוימות, אין צורך בכתיבת תוכנה אלא בחשיפת המערכת לעוד ועוד נתונים (דוגמאות).

הנתונים כוללים את המופעים של מה על המערכת לעשות (למשל דוגמאות של תמונות שבהן אנו מציינים אם בתמונה מופיע חתול או כלב) והמערכת מעדכנת את מערכת התוכנה כך שתזהה את המשמעות של מופעים חדשים (למשל אם נראה לה תמונה כלשהי, המערכת תוכל לזהות אם מדובר על חתול או כלב).

היישום של מערכות לומדות מתבסס במידה רבה על התיאוריה של הרשתות העצביות המלאכותיות (Artificial Neuron Networks). בתהליך הלמידה מאמנים את הרשת על ידי הצגת דוגמאות והמשקלות של הצמתים ברשת משתנות בהתאם.

התרשים הבא מתאר את הפרדיגמה החדשה.

הפרדיגמה החדשה, מערכות לומדות

הפרדיגמה החדשה, מערכות לומדות

דיון מעמיק יותר במכונות לומדות והתיאוריה המתמטית וסטטיסטית העומדות מאחוריהן, הוא מעבר למטרות מאמר זה.

אולם דבר אחד ברור ובולט – הנתונים וה-Big Data, במקביל להתפתחות המדהימה בעצמת המחשוב, המחשוב המקבילי והיכולת לאחסן כמויות עצומות של נתונים, מניעים ומקדמים את טכנולוגית המערכות הלומדות. מערכות אלה מהוות תשתית משמעותית ליישומים רבים ומתקדמים של העידן הדיגיטלי, עידן המתאפיין בצורך ביצירת תובנות עסקיות מתקדמות וגמישות המתעדכנות תוך כדי כניסת נתונים חדשים ועד כדי זמן אמיתי.

במאמר הבא נסקור את המודלים העסקיים מבוססי הנתונים.

לחלק ב' לחצו כאן.

לחלק א' לחצו כאן.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים