פרופ' מיטשל, חוקר לימודי מכונה: "ניתן לסייע למחשב ללמוד, ולא רק לאמנו למערך ידע סגור"
"כדי להקים מערכת מומחית טובה, צריך פשוט להאכיל את המחשב בכפית ולספק לו את כל הנתונים והקשרים ביניהם", אמר פרופ' תום מיטשל מבית הספר למדעי המחשב באוניברסיטת קרנגי מלון בארה"ב ● פרופ' מיטשל הציג בכנס הבינלאומי ללימוד מכונה, המתקיים בחיפה, מערכת שפיתח, הלומדת קשרים בין מושגים מתוך האינטרנט ויודעת לטפל במושגים חדשים לה, אם כי לא תמיד ב-100% ● כך, ידעה המערכת לזהות את יבמ, אולם טענה שהיא עוסקת רק במחשבים אישיים ונקנתה על ידי לנובו
"'לימוד מכונה' הוא כותרת כללית למערכות שבהן המחשב לומד פרטים על העולם ומשתמש בהם אחר כך למערכות מתמחות. ואולם, אחת הבעיות היא שכדי להקים מערכת מומחית טובה צריך פשוט להאכיל את המחשב בכפית ולספק לו את כל הנתונים והקשרים ביניהם. בתום שלב האימון – המערכת יודעת את מה שלימדו אותה", כך אמר פרופ' תום מיטשל מבית הספר למדעי המחשב באוניברסיטת קרנגי מלון בארצות הברית. הוא הציג מערכת הלומדת ללא הפסקה בכנס ICML – הכנס הבינלאומי ללימוד מכונה, המתקיים בימים אלה בחיפה, בארגון חוקרים ממרכז המחקר של יבמ (IBM) בעיר. הכנס מתקיים בהשתתפות מאות חוקרים מרחבי העולם.
למערכת, המכונה NELL (ר"ת never-ending language learner), יש שתי מטרות: למצות מידע מובנה מהרשת כדי לאכלס את בסיס הידע ההולך וגדל שלה וללמוד בכל יום יותר, תוך הסתמכות על הידע שנרכש עד לאותו מועד ושילוב הידע החדש בתוכו.
השיטה שבה בחרו החוקרים שפיתחו את המכונה היא ללמד אותה בסיס ידע מסוים ואת הקשרים בין העצמים השונים, ולאפשר לה ללמוד לבד על עצמים חדשים, תחת הכותרת "לימוד מודרך למחצה" (Semi-supervised training). "מבחינה מסוימת, המערכת שאנחנו בונים היא כמו תינוק, בלמידה יש שתי אפשרויות – למידה מפוקחת ולמידה לא מפוקחת. את רוב הידע שלו על השפה הילד מקבל מהקשבה למבוגרים, לפעמים ההורים או הגננת מסבירים לו פריט מידע כזה או אחר, והוא צריך לעשות סדר בידע", אמר פרופ' מיטשל.
"הבעיה אינה פיתוח אלגוריתם אלא ניסוח הבעיה", הוסיף. "צריך לתת אנתולוגיה של מאות דוגמאות והקשרים ביניהן, שלפעמים גורמים לתלות. הניסוח הראשון הוא לפשט את הבעיה. צריך ללמד את המחשב זוגות של דוגמאות ואת ההבדלים ביניהן".
בהרצאתו תיאר פרופ' מיטשל דוגמאות למקרים שבהם המערכת הצליחה ללמוד ידע חדש לעומת מקרים שבהם היא פספסה זאת. כך, הסבירו בחוקרים למערכת כיצד לזהות שמדובר בחברה ואילו שאלות יש לשאול. כשהראו לה בפעם הראשונה את האותיות IBM, הצליחה המערכת לזהות שמדובר בחברה, ואף ידעה היכן ממוקם המטה שלה. עם זאת, כשהיא נשאלה באילו תחומים עוסקת החברה, המידע באינטרנט מתקופת העיסוק של החברה במחשבים אישיים היה כל כך רב, עד שהיא התפתתה לקבוע שהחברה עוסקת במחשבים אישיים ושהיא נרכשה על ידי לנובו (Lenovo). פרופ' מיטשל אמר שהמערכת צריכה להמשיך וללמוד ולבנות בעצמה עצי קשרים נוספים בכל יום.
הוא הוסיף שבחלק מתחומי הידע האחרים, למשל מזון, המערכת מצליחה ללמוד בקלות על הקשרים בין עצמים שונים, ממאמרים שהיא קוראת באינטרנט. לעומת זאת, בתחומים אחרים, כגון ציוד ספורט, הצלחתה קטנה מאוד (23% בלבד).
המחקר הסתייע במחשב על שתרמה יאהו! (!Yahoo), והוא ממומן על ידי הקרן האמריקנית הלאומית למדע וגוגל (Google).
ללא רוח /נשמה (קשר ללילבה/מקור/"אלוהים") לעולם לא תצליח הבינה מהלכותית