מיקרוסופט מפתחת מערכת זיהוי דיבור שלטענתה זהה ליכולת השמיעה האנושית

ענקית הטכנולוגיה טוענת כי השיגה פריצת דרך משמעותית בתחום הזיהוי הקולי שמבצעים מכשירים ניידים ● מומחי החברה לתחום מתגאים בהצלחה של 97.3% בתעתוק דיבור אנושי

אוזן קשבת. אילוסטרציה: BigStock

הכתבה וזיהוי קול ופקודות שניתנות למחשבים על ידי בני אדם הם מצרך נדרש במיוחד בעולם ההיי-טק, וזה הולך ותופס עניין וקדמה ככל שטכנולוגיית הבינה המלאכותית (AI) מתקדמת ופורצת דרך.

לאחרונה פרסמו חוקרים במיקרוסופט (Microsoft) פרטים אודות טכנולוגיית זיהוי דיבור חדשה שלטענתם מתעתקת דיבור לכדי טקסט כתוב, ממש כפי שעושה האדם.

"הגענו ליכולות האדם", אומר המדען הראשי של מיקרוסופט לתחום הדיבור, קסודונג הואנג בהצהרה. "זהו הישג היסטורי".

שוגה פחות מקצרנית

שיעור השגיאות המילוליות של המערכת שעליו דווח, לאחר המבחן האחרון שערכה החברה לטכנולוגיה שפיתחה, עומד על 5.9%, שמיקרוסופט טוענת שהוא "בערך שווה" ולעיתים אף יותר מדויק מתעתיקים שמבצעים אנשי מקצוע שתפקידם הוא לתמלל דיבור, כמו מתרגמים סימולטניים או קצרנים בבית משפט.

המערכת החדישה משתמשת במודלי שפה טבעיים שמקבצים מילים דומות יחד, מה שמאפשר לה לבצע הכללה יעילה. מיקרוסופט מתכננת להשתמש בטכנולוגיה ב-Cortana, העוזרת הקולית האישית שלה, וכן בעבור Windows וקונסולת Xbox One, כמו גם בתוכנת תמלול-דיבור-לטקסט (speech-to-text).

למרות התוצאות מרשימות, זה רחוק מלהיות סוף המשחק בתחום זיהוי הדיבור. הענקית עדיין צריכה לכוון את הטכנולוגיה שהיא מייצרת בכדי שתעבוד גם עם שיחות במגוון רחב יותר של מצבי חיים אמיתיים מאתגרים, ובמנעד רחב יותר של קולות אנושיים.

בעבור שימוש עם כלי עזר כמו Cortana, חלק גדול מהקושי מגיע מהאתגר ללמד את האינטליגנציה המלאכותית להבין את משמעותן של מילים ולבצע אותן, ולא רק לשמוע אותן במדויק.

מגרדת ידע בלי רשות: OpenAI השיקה GPTBot שסורק אתרי אינטרנט

אפל ו-TSMC סגרו עסקת שבבים שחוסכת ליצרנית ה-iPhone מיליארדי ד

אקזיט כחולבן: רובריק רוכשת את למינאר ברבע מיליארד דולרים

חשש מהתחלת מחסור בכרטיסי מסך

אפל החלה לבחון מעבד ממשפחת M3 – שתושק באוקטובר

רבעון טוב לפלייטיקה: הרווח הנקי עלה ביותר מפי שניים

מד וואן מקימה דאטה סנטרים ברמלה ב-1.5 מיליארד שקלים

"סבתא בישלה דייסה – ולסייבר במגזר הבריאות לא נשאר"

התייעלות אנרגטית: מהפכה בדאטה סנטרים לעתיד ירוק יותר

כיצד מומלץ לקבל החלטות בעידן ה-AI?

נשים ומחשבים: חן בעדני, גי אי דיגיטל

יוצאים לטייל? קחו אתכם תחנת כוח ניידת

מה חושבים המנהלים על הבינה המלאכותית היוצרת?

קבלת החלטות בעידן ה-AI

נשים ומחשבים: ליאור רוכברגר, פאלו אלטו נטוורקס

כיצד המנמ"ר מתכנן ומנהל תקציבים שנתיים?

מיקרוסופט מפתחת מערכת זיהוי דיבור שלטענתה זהה ליכולת השמיעה האנושית

ענקית הטכנולוגיה טוענת כי השיגה פריצת דרך משמעותית בתחום הזיהוי הקולי שמבצעים מכשירים ניידים ● מומחי החברה לתחום מתגאים בהצלחה של 97.3% בתעתוק דיבור אנושי

שוגה פחות מקצרנית

תגובות

כתיבת תגובה לבטל

אירועים קרובים

מגרדת ידע בלי רשות: OpenAI השיקה GPTBot שסורק אתרי אינטרנט

אפל ו-TSMC סגרו עסקת שבבים שחוסכת ליצרנית ה-iPhone מיליארדי ד

אקזיט כחולבן: רובריק רוכשת את למינאר ברבע מיליארד דולרים

חשש מהתחלת מחסור בכרטיסי מסך

אפל החלה לבחון מעבד ממשפחת M3 – שתושק באוקטובר

רבעון טוב לפלייטיקה: הרווח הנקי עלה ביותר מפי שניים

מד וואן מקימה דאטה סנטרים ברמלה ב-1.5 מיליארד שקלים

"סבתא בישלה דייסה – ולסייבר במגזר הבריאות לא נשאר"

התייעלות אנרגטית: מהפכה בדאטה סנטרים לעתיד ירוק יותר

כיצד מומלץ לקבל החלטות בעידן ה-AI?

נשים ומחשבים: חן בעדני, גי אי דיגיטל

יוצאים לטייל? קחו אתכם תחנת כוח ניידת

מה חושבים המנהלים על הבינה המלאכותית היוצרת?

קבלת החלטות בעידן ה-AI

נשים ומחשבים: ליאור רוכברגר, פאלו אלטו נטוורקס

כיצד המנמ"ר מתכנן ומנהל תקציבים שנתיים?

מיקרוסופט מפתחת מערכת זיהוי דיבור שלטענתה זהה ליכולת השמיעה האנושית

ענקית הטכנולוגיה טוענת כי השיגה פריצת דרך משמעותית בתחום הזיהוי הקולי שמבצעים מכשירים ניידים ● מומחי החברה לתחום מתגאים בהצלחה של 97.3% בתעתוק דיבור אנושי

שוגה פחות מקצרנית

תגובות

כתיבת תגובה לבטל

אירועים קרובים

תוכן פרסומי

תוכן פרסומי

תוכן פרסומי

תוכן פרסומי

שמנו לב שחוסם הפרסומות שלך מופעל