מיקרוסופט: ה-AI שלנו יודע לתאר תמונות טוב יותר מאנשים
במקרה המסוים מדובר בבינה מלאכותית הפועלת בתחום ראיית המחשב ומסייעת בזיהוי תמונות ומה שמופיע בהן, והפיכת המראה לתיאור כתוב או מוקרא באודיו - מה שמשמש רבות בהנגשת תכנים לאנשים עם מוגבלויות
מיקרוסופט השיקה אתמול (ד') שירות ראיית מחשב חדש, שלטענתה יכול ליצור כיתוב אוטומטי לתמונות (המכונה alt text), בחלק מהמקרים, באופן מדויק יותר מזה שמגיע מתיאוריהם של בני אנוש. החברה מתארת את השירות כ"פריצת דרך מחקרית משמעותית".
ענקית התוכנה פרסמה פרטים אודות היכולת החדשה בבלוג שלה וטענה בנוסף בפוסט כי ככלל מערכת כיתוב התמונות החדשה טובה פי שניים מהגרסה הקודמת שלה, המשמשת במוצרי ושירותי מיקרוסופט מאז שנת 2015, זאת על פי השוואה שערכו החוקרים.
סרטון יוטיוב שעלה לערוץ מיקרוסופט ומדגים את היכולת החדשה
הענקית מרדמונד טוענת שהיכולות הללו שחוקריה פיתחו מעידות על המחויבות שלה לפתח AI מיוחדת שתסייע להנגשה של תוכן לאנשים עם מוגבלויות, וזאת משום שלכיתוב תמונות אוטומטי יש אמנם מספר אופני שימוש, אך המרכזי שבהם הוא סיוע בהנגשת התכנים המצולמים לגולשים ולמשתמשים עם מוגבלויות.
על פי ארגון הבריאות העולמי, מספר האנשים בכל הגילאים שהם לקויי ראייה מוערך בכ-285 מיליון בני אדם, מתוכם 39 מיליון הם עיוורים. השירות הזה, לכשיאומץ בעוד ועוד פלטפורמות, עשוי להפוך עבורם תוכן להרבה יותר זמין ונגיש.
בפוסט ציינה החברה כי "כיתוב תמונות אוטומטי מסייע לכל המשתמשים לגשת לתוכן החשוב בכל תמונה, מתמונה המוחזרת כתוצאת חיפוש ועד תמונה הכלולה במצגת. פריצת דרך מחקרית כמו זו יכולה לשפר את התוצאות הללו, אם כי אין זה אומר שהמערכת תחזיר תוצאות מושלמות בכל פעם".
השירות החדש זמין כעת ללקוחות, כך לדברי החברה, באמצעות Azure Cognitive Services Computer Vision, המהווה חלק מ-Azure AI, אשר מאפשר למפתחים להשתמש ביכולת כדי לשפר את הנגישות בשירותים שלהם.
כמו כן היכולת כבר משולבת ב-Seeing AI – האפליקציה של מיקרוסופט למשתמשים עיוורים ולקויי ראייה, שיודעת "לספר" למשתמשים את המתרחש בעולם שסביבם – ויגיע בהמשך השנה גם ליישומים וורד, ואאוטלוק, בחלונות וב-Mac, לפאוור פוינט בעבור שתי מערכות ההפעלה הללו וכן בשימוש באינטרנט.
תגובות
(0)