הרנסנס של למידת המכונה כבר כאן
מה דרוש על מנת שהחלום של מכונות תבוניות יתגשם הפעם? ● הבסיס להצלחת הלמידה העמוקה הוא בתשתית האחסון - העתיד כבר כאן ואין שום סיבה להתפשר עליו הפעם
"לאנשים יש חלומות. אפילו לכלבים יש חלומות, אבל לא לך, אתה רק מכונה. חיקוי של חיים. האם רובוט יכול לכתוב סימפוניה? האם רובוט יכול להפוך בד ליצירת מופת יפהפייה?" הציטוט המפורסם הזה מתוך הסרט "אני, רובוט", המושפע מאוסף סיפוריו הקצרים של סופר המדע הבדיוני אייזק אסימוב, מציג שאלות שהטכנולוגיה כיום כבר יודעת לענות עליהן.
תוכנות מחשב, הכוללות יכולות של למידת מכונה, מלחינות סונטות, שירים ויצירות קלאסיות ואף יוצרות ציורים ברמה שלא הייתה מביישת אמנות גבוהה. המחשב או הרובוט התבוני, המסוגל לקבל החלטות באופן עצמאי, קורם עור וגידים לנגד עינינו.
הרעיון של מכונות תבוניות טופח כבר במהלך שנות ה-50 של המאה הקודמת, כאשר המחקר בתחום הבינה המלאכותית הגיע לשיאו. בתקופה זאת אף עלתה הציפיה כי יישומים חכמים, מכונות ורובוטים ישרתו את הציבור הרחב בתוך זמן קצר בביצוע מטלות יומיומיות. אולם, לדעת רבים, הציפייה הזאת הקדימה את זמנה ולא התממשה, משום שבאותה תקופה לא היה קיים כוח מחשוב חזק מספיק שיוכל לתמוך בה, וכך, מחקר הבינה המלאכותית נזנח למשך תקופה ארוכה.
כיום, עשרות שנים מאוחר יותר, הרעיון נולד מחדש כאשר יישומים בעלי יכולות למידת מכונה (Machine Learning) משתלטים על אספקטים שונים בחיינו. מעבר ליצירות האמנות שהזכרנו, ניתן למנות יישומים דוגמת תוכנות לזיהוי פנים, מתרגם סימולטני בצ'אטים (דוגמת סקייפ), שירותי נסיעות שיתופיים (דוגמת אובר), כלים רפואיים דיאגנוסטיים, פתרונות חכמים של אבטחת מידע ועוד.
בעוד אנו עומדים בפתחה של תנועת רנסנס מרגשת בתחום למידת המכונה, עולה מושג נוסף על הפרק, ושמו "למידה עמוקה" (Deep Learning). ההבדל בן למידת מכונה ללמידה עמוקה מלמד על העתיד שאליו עולם המחשוב הולך.
אלגוריתמים של למידת מכונה זקוקים לקלט של נתונים, אך גם זקוקים לאדם בתווך ש-"ינחה" אותם בסדרת חוקים וסיווגים, על מנת שילמדו להבחין ולזהות את שנדרש מהם.
לדוגמה, אם נטען מספר רב של תמונות של חתולים וננחה את האלגוריתם כי זהו חתול, הוא ילמד בסופו של דבר לזהותו בעצמו גם בתמונות חדשות שטרם הוצגו לו. לעומת זאת, בלמידה עמוקה, האלגוריתם אינו זקוק לאדם בתווך כלל, כל מה שהוא צריך הוא ריכוז גדול יותר של נתונים על מנת שיוכל ללמד את עצמו כיצד להגדיר, לסווג ולזהות את החתול.
בזכות יכולות של למידה עמוקה מחשבים כיום הגיעו ליכולת זיהוי תמונה מהירה ומדויקת יותר אפילו מזו של האדם. תארו לעצמכם כמה היא יכולה להיות משמעותית כשמדובר בזיהוי של גידולים סרטניים בבדיקות דימות. היא עשויה אפילו להטות את הכף בין חיים או מוות.
פתרון בעיות שעד היום לא היה ניתן לפתור על ידי מכונות
אפשר לומר שלמידה עמוקה קרובה יותר לבינה מלאכותית עליה חלמו מדענים לפני עשרות שנים, וייתכן שהיא אותה תבונה עליה כתב אסימוב וסופרי מדע בדיוני רבים אחרים. כך או כך, היא המהפכה שתעצב את עתיד חיינו בעשורים הקרובים. אמנם, היא דורשת יותר כוח מחשוב ויותר נתונים, אבל היא גם תאפשר פתרון בעיות שעד היום לא היה ניתן לפתור על ידי מכונות.
המפתח להצלחת הלמידה העמוקה, בסיבוב השני כיום, טמון ביכולת לעבד נפחים עצומים של מידע, שכן אלגוריתמים של למידה עמוקה מציגים ביצועים גבוהים יותר ביחס ישר לכמות הדוגמאות שהם יכולים "ללמוד" מהן.
ככל שנטען יותר דוגמאות, כך הדיוק של האלגוריתם יגדל. אפשר להשוות את דרך הפעולה של הלמידה העמוקה (רשת נוירונים מלאכותית) למוח האנושי, שלומד מהחוויות וההתנסויות שלו. חשבו לרגע על תינוק קטן שמתחיל ללמוד על העולם, על חפצים, בעלי חיים, מאכלים ובכלל, על כל הסובב אותו. אם נתייחס לדוגמת החתולים שהזכרנו קודם, ככל שאמו של התינוק תראה לו יותר תמונות של חתולים, מגזעים שונים, בעלי צבעים שונים, המופיעים בתנוחות שונות, על רקע שונה ובגדלים שונים, כך הוא ידייק יותר בזיהוי שלהם ובהבחנה שלהם לעומת בעלי חיים אחרים.
כך גם האלגוריתם של הלמידה העמוקה לומד. ככל שנטען יותר דוגמאות של חתולים, כך רמת הדיוק שלו תגדל, והוא יוכל לזהות חתולים בכל סוג ובכל צורה וסצנה , גם אם לא תמיד מדובר בחתול בצורתו הקלאסית והשכיחה – (למשל אוזן וזנב של חתול מבצבץ מאחורי הספה).
יחד עם זאת, בשונה מהמוח האנושי, האלגוריתם יכול ללמוד בצורה מבוזרת יותר (באמצעות ריבוי מחשבים) ולגשת לדוגמאות רבות יותר באופן משמעותי לעומת בן אדם. לכן, כלי החישוב המתקדמים של הלמידה העמוקה זקוקים למעבדים גרפיים חזקים וליכולת לשמור נפחי מידע עצומים ולגשת אליהם, במהירות ובמחיר משתלם כלכלית.
שום סיבה להתפשר על העתיד
בשנים האחרונות ראינו כיצד טכנולוגיות האחסון המיושנות מתחילות לפנות את הדרך לטכנולוגיות ה-All Flash, אולם גם הן עדיין לא הביאו את הבשורה לה העולם מחכה, שכן הן הציגו שיפור בביצועים, אבל היו יקרות באופן משמעותי מאחסון בדיסקים מסתובבים ולא אפשרו אחסון בסדרי הגודל האדירים שמתבקשים או יכולת לגדול.
על מנת למצות את הפוטנציאל האמיתי בלמידת המכונה, עלות האחסון תצטרך לרדת באופן משמעותי. כיום, המדיה של ה-All Flash עדיין יקרה פי 10-15 לעומת טכנולוגית הדיסקים המסתובבים, ויחס זה, על פי כל התחזיות, יישאר כך גם כאשר כלל מחירי האחסון ירדו בשוק.
זה הזמן להכיר בטכנולוגיות חדשניות של היפר-אחסון, שמציגות ביצועים גבוהים יותר מ-All Flash במחיר דומה מאד למדיית הדיסקים המסתובבים. טכנולוגיות אלו מבוססות על תוכנה חכמה שיודעת לנצל משאבים פשוטים יחסית לכדי יכולות אחסון של נפח אדיר בצפיפות גבוהה ושטח קטן, מבלי לוותר על אמינות וביצועים גבוהים.
הדמיון והסקרנות בנושא לא נזנחה, וצורות חדשות של מחשוב מחכות לכולנו מעבר לפינה אם נדע לנצל את משאבי המידע שלנו נכונה. לא רחוק היום בו כולנו נוכל לנסוע במכוניות אוטונומיות, ניעזר בתוכנה שתענה בשבילנו על האימיילים או נקבל עצות מלומדות וחכמות על השקעות מבוטים. הבסיס להצלחת הלמידה העמוקה הוא בתשתית האחסון – העתיד כבר כאן ואין שום סיבה להתפשר עליו הפעם.
הכותב הינו סמנכ"ל מוצרים ב-Infinidat.
תגובות
(0)