Big Data ומכונות לומדות

בענף האינטליגנציה המלאכותית, ה-Big Data פורח במיוחד ● הרעיון באופן כללי הוא שבמקום להורות למחשב מה לעשות, פשוט נספק לו נתונים בנוגע לבעיה ונאמר לו שימצא פתרון לבד

21/09/2016 12:55
אריה עמית, יועץ אסטרטגי וניהולי בכיר ב-I-amIT

מהו הערך של Big Data? יש לנו יותר מידע, ניתן לעשות דברים שלא ניתן היה קודם.

אחד התחומים הכי מרשימים שבו זה קורה, הוא התחום של מכונות לומדות.

מכונות לומדות הוא ענף של אינטליגנציה מלאכותית, שהיא בעצמה ענף של מדעי המחשב.

הרעיון באופן כללי הוא שבמקום להורות למחשב מה לעשות, פשוט נספק לו נתונים בנוגע לבעיה ונאמר למחשב שימצא פתרון לבד.

כדי להבין את הרעיון נסתכל על המקור שלו. בשנות ה-50, איש מדעי המחשב ביבמ (IBM), בשם ארתור סמואל, אהב לשחק דמקה. הוא כתב תוכנת מחשב כדי שיוכל לשחק נגד המחשב. הוא שיחק וניצח כל הזמן, כי המחשב ידע רק מהלכים חוקיים.

סמואל ידע אסטרטגיה, לכן הוא כתב תוכנת-משנה שפעלה ברקע, וכל מה שהיא עשתה היה לאמוד את הסבירות שסידור נתון על הלוח יוביל לעמדת ניצחון לעומת עמדת הפסד לאחר כל מהלך. הוא שיחק נגד המחשב והמשיך לנצח. ואז נתן למחשב לשחק עם עצמו.

הוא שיחק עם עצמו ואסף יותר מידע. הוא אסף יותר מידע וזה הגדיל את הדיוק של החיזוי שלו. וכשסמואל חזר לשחק מול המחשב, הוא הפסיד בכל משחק. הוא יצר מכונה שהתעלתה על יכולתו, במשימה שהוא עצמו לימד אותה.

והרעיון הזה של מכונה לומדת מגיע לכל מקום. איך לדעתכם יהיו לנו מכוניות ללא נהג? האם נהיה במצב יותר טוב כחברה אם נכניס את כל חוקי התנועה לתוך תוכנה? לא. האם הזיכרון זול יותר? לא. האלגוריתמים מהירים יותר? לא. המעבדים טובים יותר? לא. כל הדברים הללו חשובים, אבל הם לא הסיבה.

הסיבה היא ששינינו את אופי הבעיה. ממצב שבו ניסינו באופן מוגזם ובגלוי להסביר למחשב כיצד לנהוג למצב בו אנו אומרים, "הנה, קח לך המון נתונים על הרכב – ואתה תמצא את הפתרון. אתה תמצא שזה רמזור, שהרמזור אדום ולא ירוק, פירושו שצריך לעצור ולא להתקדם."

מכונות לומדות נמצאות ביסוד הרבה דברים שאנו מבצעים ברשת: מנועי חיפוש, אלגוריתמים של אמזון (Amazon) להתאמה אישית, תרגום ממוחשב, מערכות לזיהוי קול. לאחרונה, חוקרים התעמקו בסוגיית הביופסיה, של דגימת רקמות סרטניות, והם ביקשו ממחשב לקבוע באמצעות בחינת הנתונים ושיעורי התמותה, אם התאים הם באמת סרטניים. וכשהנתונים הוזנו למחשב, באמצעות אלגוריתם מכונה לומדת, המכונה הייתה מסוגלת לזהות את 12 הסימנים המחשידים שמנבאים הכי טוב שרקמה זו מתאי סרטן-שד היא אכן ממאירה. הבעיה: הספרות הרפואית הכירה רק תשעה מהם. שלושה מהסימנים היו כאלה שלא היה צורך שאנשים יחפשו, אבל המכונה איתרה אותם.

אך, ישנם גם צדדים אפלים ל-Big Data. הוא ישפר את חיינו, אבל יש גם בעיות שצריך להיות מודעים אליהן. הראשונה היא האפשרות שאנו עשויים לסבול מביצוע ניבויים. המשטרה למשל, עלולה להשתמש ב-Big Data למטרותיה – חקר פשיעה אלגוריתמי.

הרעיון הוא שאם לוקחים המון נתונים, לדוגמה היכן התרחשו פשעים בעבר, נדע לאן לשגר את סיורי המשטרה. זה נראה הגיוני, אבל הבעיה היא שזה לא ייעצר רק בנתוני המיקום, אלא זה יגיע גם לרמת הפרט. נשתמש בנתונים מתעודת התיכון של האדם? אולי עלינו להשתמש בנתונים כמו, אם האדם עובד או מובטל, רמת האשראי שלו, הרגלי גלישתו באינטרנט, אם הוא ער עד מאוחר בלילה. מכשיר הניטור הגופני, אם הוא מסוגל לזהות תגובות כימיות, יראה שיש לו מחשבות תוקפניות.

לשמור מכל משמר על הרצון החופשי

עשויים להיות אלגוריתמים שיכולים לנבא מה אנו עומדים לעשות, ואנו עלולים להיחשב לאחראים לדברים שטרם ביצענו בפועל. פרטיות היוותה אתגר מרכזי בעידן של נתונים מועטים. בעידן Big Data, האתגר יהיה לשמור מכל משמר על הרצון החופשי, על הבחירה המוסרית, על רצון האדם, על העצמאות האנושית.

ישנה בעיה נוספת: Big Data יגזול מאיתנו את עבודותינו.

Big Data והאלגוריתמים עומדים לקרוא תיגר על עבודות הצווארון הלבן המקצועיות של המאה ה-21, באותו אופן שהמיכון התעשייתי וקו הייצור קראו תיגר על עבודות הצווארון הכחול במאה ה-20. תחשבו על טכנאי מעבדה שמסתכל דרך מיקרוסקופ על רקמה סרטנית ומחליט אם היא ממאירה או לא.

אדונים ומשרתים

האדם למד באוניברסיטה. הוא קנה רכוש. הוא מצביע בבחירות. הוא בעל עניין בחברה. והעבודה של אותו אדם, כמו גם צי שלם של אנשי מקצוע כמו אותו אדם, ימצאו שהעבודות שלהם השתנו באופן ניכר או למעשה התחסלו כליל.

אנו אוהבים לחשוב שהטכנולוגיה יוצרת עם הזמן עבודות, לאחר תקופת-מעבר קצרה וזמנית, וזה נכון ביחס למציאות שאנו חיים בה, שהיא המהפכה התעשייתית, כי זה בדיוק מה שקרה. אבל אנו שוכחים משהו בניתוח זה: ישנם כמה תחומי עבודה שפשוט נמחקים ולעולם לא שבים. לכן יהיה עלינו להיזהר ולהתאים את Big Data לצרכינו, צרכינו האנושיים ביותר.

יהיה עלינו להיות אדוניה של טכנולוגיה זו, לא משרתיה. אנו נמצאים רק בתחילתו של עידן Big Data, והאמת היא שאנו לא מצטיינים בטיפול בכל הנתונים שאנו מסוגלים לאסוף כיום. זו לא רק בעיה הנוגעת לסוכנות לביטחון לאומי. חברות אוספות המון נתונים והן גם משתמשות בו לרעה, ועלינו להשתפר בתחום זה, וזה ייקח זמן. דומה לאתגר שניצב בפני האדם הקדמון עם האש. זהו כלי, אבל כלי שאם לא נהיה זהירים אתו, הוא ישרוף אותנו.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים