מיקרוסופט: ה-AI שלנו יודע לתאר תמונות טוב יותר מאנשים

במקרה המסוים מדובר בבינה מלאכותית הפועלת בתחום ראיית המחשב ומסייעת בזיהוי תמונות ומה שמופיע בהן, והפיכת המראה לתיאור כתוב או מוקרא באודיו - מה שמשמש רבות בהנגשת תכנים לאנשים עם מוגבלויות

פיתוח פורץ דרך בתחום ראיית המחשב וההנגשה לאנשים עם מגבלת ראייה. צילום אילוסטרציה: BigStock

מיקרוסופט השיקה אתמול (ד') שירות ראיית מחשב חדש, שלטענתה יכול ליצור כיתוב אוטומטי לתמונות (המכונה alt text), בחלק מהמקרים, באופן מדויק יותר מזה שמגיע מתיאוריהם של בני אנוש. החברה מתארת את השירות כ"פריצת דרך מחקרית משמעותית".

ענקית התוכנה פרסמה פרטים אודות היכולת החדשה בבלוג שלה וטענה בנוסף בפוסט כי ככלל מערכת כיתוב התמונות החדשה טובה פי שניים מהגרסה הקודמת שלה, המשמשת במוצרי ושירותי מיקרוסופט מאז שנת 2015, זאת על פי השוואה שערכו החוקרים.

סרטון יוטיוב שעלה לערוץ מיקרוסופט ומדגים את היכולת החדשה

הענקית מרדמונד טוענת שהיכולות הללו שחוקריה פיתחו מעידות על המחויבות שלה לפתח AI מיוחדת שתסייע להנגשה של תוכן לאנשים עם מוגבלויות, וזאת משום שלכיתוב תמונות אוטומטי יש אמנם מספר אופני שימוש, אך המרכזי שבהם הוא סיוע בהנגשת התכנים המצולמים לגולשים ולמשתמשים עם מוגבלויות.

על פי ארגון הבריאות העולמי, מספר האנשים בכל הגילאים שהם לקויי ראייה מוערך בכ-285 מיליון בני אדם, מתוכם 39 מיליון הם עיוורים. השירות הזה, לכשיאומץ בעוד ועוד פלטפורמות, עשוי להפוך עבורם תוכן להרבה יותר זמין ונגיש.

בפוסט ציינה החברה כי "כיתוב תמונות אוטומטי מסייע לכל המשתמשים לגשת לתוכן החשוב בכל תמונה, מתמונה המוחזרת כתוצאת חיפוש ועד תמונה הכלולה במצגת. פריצת דרך מחקרית כמו זו יכולה לשפר את התוצאות הללו, אם כי אין זה אומר שהמערכת תחזיר תוצאות מושלמות בכל פעם".

השירות החדש זמין כעת ללקוחות, כך לדברי החברה, באמצעות Azure Cognitive Services Computer Vision, המהווה חלק מ-Azure AI, אשר מאפשר למפתחים להשתמש ביכולת כדי לשפר את הנגישות בשירותים שלהם.

כמו כן היכולת כבר משולבת ב-Seeing AI – האפליקציה של מיקרוסופט למשתמשים עיוורים ולקויי ראייה, שיודעת "לספר" למשתמשים את המתרחש בעולם שסביבם – ויגיע בהמשך השנה גם ליישומים וורד, ואאוטלוק, בחלונות וב-Mac, לפאוור פוינט בעבור שתי מערכות ההפעלה הללו וכן בשימוש באינטרנט.

תגובות

(0)

מגרדת ידע בלי רשות: OpenAI השיקה GPTBot שסורק אתרי אינטרנט

אפל ו-TSMC סגרו עסקת שבבים שחוסכת ליצרנית ה-iPhone מיליארדי ד

אקזיט כחולבן: רובריק רוכשת את למינאר ברבע מיליארד דולרים

חשש מהתחלת מחסור בכרטיסי מסך

אפל החלה לבחון מעבד ממשפחת M3 – שתושק באוקטובר

רבעון טוב לפלייטיקה: הרווח הנקי עלה ביותר מפי שניים

מד וואן מקימה דאטה סנטרים ברמלה ב-1.5 מיליארד שקלים

"סבתא בישלה דייסה – ולסייבר במגזר הבריאות לא נשאר"

התייעלות אנרגטית: מהפכה בדאטה סנטרים לעתיד ירוק יותר

כיצד מומלץ לקבל החלטות בעידן ה-AI?

נשים ומחשבים: חן בעדני, גי אי דיגיטל

יוצאים לטייל? קחו אתכם תחנת כוח ניידת

מה חושבים המנהלים על הבינה המלאכותית היוצרת?

קבלת החלטות בעידן ה-AI

נשים ומחשבים: ליאור רוכברגר, פאלו אלטו נטוורקס

כיצד המנמ"ר מתכנן ומנהל תקציבים שנתיים?

מיקרוסופט: ה-AI שלנו יודע לתאר תמונות טוב יותר מאנשים

סרטון יוטיוב שעלה לערוץ מיקרוסופט ומדגים את היכולת החדשה

תגובות

כתיבת תגובה לבטל

אירועים קרובים

מגרדת ידע בלי רשות: OpenAI השיקה GPTBot שסורק אתרי אינטרנט

אפל ו-TSMC סגרו עסקת שבבים שחוסכת ליצרנית ה-iPhone מיליארדי ד

אקזיט כחולבן: רובריק רוכשת את למינאר ברבע מיליארד דולרים

חשש מהתחלת מחסור בכרטיסי מסך

אפל החלה לבחון מעבד ממשפחת M3 – שתושק באוקטובר

רבעון טוב לפלייטיקה: הרווח הנקי עלה ביותר מפי שניים

מד וואן מקימה דאטה סנטרים ברמלה ב-1.5 מיליארד שקלים

"סבתא בישלה דייסה – ולסייבר במגזר הבריאות לא נשאר"

התייעלות אנרגטית: מהפכה בדאטה סנטרים לעתיד ירוק יותר

כיצד מומלץ לקבל החלטות בעידן ה-AI?

נשים ומחשבים: חן בעדני, גי אי דיגיטל

יוצאים לטייל? קחו אתכם תחנת כוח ניידת

מה חושבים המנהלים על הבינה המלאכותית היוצרת?

קבלת החלטות בעידן ה-AI

נשים ומחשבים: ליאור רוכברגר, פאלו אלטו נטוורקס

כיצד המנמ"ר מתכנן ומנהל תקציבים שנתיים?

מיקרוסופט: ה-AI שלנו יודע לתאר תמונות טוב יותר מאנשים

סרטון יוטיוב שעלה לערוץ מיקרוסופט ומדגים את היכולת החדשה

תגובות

כתיבת תגובה לבטל

אירועים קרובים

תוכן פרסומי

תוכן פרסומי

תוכן פרסומי

תוכן פרסומי

שמנו לב שחוסם הפרסומות שלך מופעל