מיקרוסופט מפתחת מערכת זיהוי דיבור שלטענתה זהה ליכולת השמיעה האנושית

ענקית הטכנולוגיה טוענת כי השיגה פריצת דרך משמעותית בתחום הזיהוי הקולי שמבצעים מכשירים ניידים ● מומחי החברה לתחום מתגאים בהצלחה של 97.3% בתעתוק דיבור אנושי

אוזן קשבת. אילוסטרציה: BigStock

הכתבה וזיהוי קול ופקודות שניתנות למחשבים על ידי בני אדם הם מצרך נדרש במיוחד בעולם ההיי-טק, וזה הולך ותופס עניין וקדמה ככל שטכנולוגיית הבינה המלאכותית (AI) מתקדמת ופורצת דרך.

לאחרונה פרסמו חוקרים במיקרוסופט (Microsoft) פרטים אודות טכנולוגיית זיהוי דיבור חדשה שלטענתם מתעתקת דיבור לכדי טקסט כתוב, ממש כפי שעושה האדם.

"הגענו ליכולות האדם", אומר המדען הראשי של מיקרוסופט לתחום הדיבור, קסודונג הואנג בהצהרה. "זהו הישג היסטורי".

שוגה פחות מקצרנית

שיעור השגיאות המילוליות של המערכת שעליו דווח, לאחר המבחן האחרון שערכה החברה לטכנולוגיה שפיתחה, עומד על 5.9%, שמיקרוסופט טוענת שהוא "בערך שווה" ולעיתים אף יותר מדויק מתעתיקים שמבצעים אנשי מקצוע שתפקידם הוא לתמלל דיבור, כמו מתרגמים סימולטניים או קצרנים בבית משפט.

המערכת החדישה משתמשת במודלי שפה טבעיים שמקבצים מילים דומות יחד, מה שמאפשר לה לבצע הכללה יעילה. מיקרוסופט מתכננת להשתמש בטכנולוגיה ב-Cortana, העוזרת הקולית האישית שלה, וכן בעבור Windows וקונסולת Xbox One, כמו גם בתוכנת תמלול-דיבור-לטקסט (speech-to-text).

למרות התוצאות מרשימות, זה רחוק מלהיות סוף המשחק בתחום זיהוי הדיבור. הענקית עדיין צריכה לכוון את הטכנולוגיה שהיא מייצרת בכדי שתעבוד גם עם שיחות במגוון רחב יותר של מצבי חיים אמיתיים מאתגרים, ובמנעד רחב יותר של קולות אנושיים.

בעבור שימוש עם כלי עזר כמו Cortana, חלק גדול מהקושי מגיע מהאתגר ללמד את האינטליגנציה המלאכותית להבין את משמעותן של מילים ולבצע אותן, ולא רק לשמוע אותן במדויק.

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים