תוכן שיווקי
בעקבות אירוע יבמ

Embeddable AI – הפעלת מודלים של שפה

29/03/2023 12:22
שילה אופק-קויפמן, חוקרת בכירה במעבדות המחקר של יבמ בחיפה.

מאת שילה אופק-קויפמן

 

בשנים האחרונות, תחום עיבוד שפה טבעית מתפתח ומתקדם בקצב מסחרר הודות להתקדמות האדירה בטכנולוגית מודלי שפה, המאפשרת הבנה ויצירה של שפה טבעית, שבבסיסה עומדת טכנולוגיית הטרנספורמרים.

הייחודיות של מודלים אלה היא יכולתם להתאמן על כמויות גדולות מאוד של דטה לא מתויגת, כלומר אימון ללא פיקוח, ולבצע מספר משימות, למשל קטלוג, סיכום וגם יצירת טקסט.

כולנו קוראים חדשות לבקרים על עוד מודלים ועוד יכולות שהם מביאים עימם, והיות שחלקם מונגשים למשתמשים שאינם חוקרים או מדעני נתונים, לאנשים רבים כבר יצא להתנסות ולהתרשם מהיכולות המתקדמות הללו.

כאשר רוצים להשמיש מודלים כאלה במערכות ארגוניות, כאלה שנמצאות בשימוש במערכות הבנקים, חברות הביטוח, חברות התקשורת וכו', שחלקן נמצאות תחת רגולציה כבדה, נכנסים שיקולים ואילוצים נוספים למשוואה, שלעיתים יוצרים אתגר בשימוש ישיר במודלים הזמינים היום.

האתגר הראשון קשור בדאטה שעליה אומן המודל – מאיפה הגיעה? האם חוקי להשתמש בה? האם היא מכיל שפה לא נאותה?

אתגר נוסף הוא האם המודל אומן על דטה שתואמת את סוג הדטה שבה משתמש הארגון? האם הוא מבין את המושגים שבהם משתמש הארגון? האם המשימות שעליהן אומן מתאימות למשימות שאותן הארגון צריך לבצע?  איך הוא נבדק?

לעיתים יש צורך ביותר ממודל אחד או יכולת אחת, ואז נוצר קושי של בחירה בין אפשרויות שונות, אחידות ותאימות של מודלים שונים במרחב הקוד הפתוח.

היבט נוסף שמעניין את הארגונים הוא קלות השימוש בטכנולוגיה, ביצועי זמן הריצה שלה, דרישות החומרה ותשתית התוכנה הדרושה על מנת להשמישה במערכת הארגונית, שדורשת ידע נוסף שלא תמיד קיים בארגון. דרישות אלו משפיעות גם על העלויות והכדאיות הכלכלית של השימוש במודלים.

על כל השאלות האלה ועוד, בא לתת מענה מוצר ה-Embeddable AI של יבמ (IBM).

המוצר מבוסס על טכנולוגיות קוד פתוח וטכנולוגיות שפותחו על ידי קבוצות המחקר של יבמ, המשלבות את היכולות המתקדמות ביותר הקיימות היום, כולל מודלי שפה מבוססי טרנספורמרים, שאומנו על משימות נפוצות שארגונים זקוקים להן, כגון ניתוח וסיווג סנטימנטים וחילוץ ישויות, ובאים לתת מענה לצרכים הארגוניים.

המודלים הללו אומנו על דטה שעברה בדיקה של התאמתה לשימוש ארגוני, סוננה ועברה פילטור של תכנים שאינם ראויים. המודלים אומנו והגיעו לביצועים גבוהים מאוד בבדיקות על נתונים שמתאימים לסוגי הנתונים שלקוחות ארגוניים נתקלים בהם ומטפלים בהם. בנוסף, המודלים הללו עברו אופטימיזציות שמאפשרות להקטין את המודלים ככל שניתן מבלי לפגוע באיכות ביצועיהם, וגם להאיץ את ביצועיהם בזמן הריצה, כך שדרישות החומרה שלהם יהיו מינימליות ויצמצמו את עלויות השימוש וההרצה שלהם.

המוצר גם מספק סביבת הרצה נוחה, המותאמת לכל שרת או ענן ציבורי או פרטי שהלקוח רוצה לעבוד בו, ומאפשר אינטגרציה קלה ונוחה של היכולות שהחבילה מספקת לתוך המוצר שאותו בונה הלקוח.

המוצר ימשיך להתפתח ולהרחיב את מגוון יכולותיו עם המיטב שמגיע מחטיבת המחקר של יבמ.

 

הכותבת היא חוקרת בכירה במעבדות המחקר בחיפה.

אירועים קרובים