תוצאות מעודכנות מדגישות את היכולות של פתרונות ה-AI של אינטל
מעבדי ה-Gaudi2 של הבאנה לאבס והדור הרביעי של מעבדי ה-Xeon Scalable של אינטל הציגו במבחנים עדכניים ביצועים מרשימים וחיסכון מיטבי בעלויות לאימון תרחישי בינה מלאכותית
מדד ביצועי הבינה המלאכותית של התעשייה, MLPerf Training 3.0 של MLCommons, שפורסם באחרונה הציג תוצאות מרשימות של שבב האצת הלמידה המעמיקה Gaudi2 מבית הבאנה לאבס, ושל מעבדי ה-Xeon Scalable מבית אינטל.
התוצאות הללו מוכיחות כי סל פתרונות הבינה המלאכותית של אינטל מספק אפשרויות תחרותיות ללקוחות שמחפשים אקו-סיסטם פתוח, שלא מגביל את היעילות ואת הגודל של תרחישי הבינה המלאכותית היוצרת ושל מולים של שפות גדולות (LLMs). כמו כן, הן מוכיחות שלא חייבים כרטיסים גרפיים של אנבידיה כדי להפעיל את התרחישים הללו.
בנוסף, מדגישות התוצאות הללו את הביצועים של מוצרי אינטל בעת הרצת מודלים של למידה מעמיקה, ואת הבשלות של התוכנות והמערכות המבוססות על Gaudi2 לאימון הוכחה באמצעות מודל השפה הגדולה, GPT-3. יש לציין ש-Gaudi2 הוא אחד משני פתרונות השבבים היחידים שעומד ברף הנדרש לאימון GPT-3, שהיה מבוסס במבחן על 175 מיליארד משתנים, והתוצאות מהוות אימות לביצועי המעבד מבית הבאנה לאבס, כמו גם ליכולת התאמות הגודל שלו.
בשילוב עם יתרון העלויות, בצד השרת ובצד המערכת כאחד, ויחד עם התוצאות המוכחות בהיבטים של ראייה ממחושבת ועיבוד שפה טבעית, ה-Gaudi2 מספק חלופה הולמת ביחס של מחיר לביצועים ל-H100 של אנבידיה.
במקביל, ביצועי הלמידה המעמיקה של מעבדי ה-Xeon Scalable מהדור הרביעי, עם מנועי הבינה המלאכותית המובנים, הוכיחו שלקוחות יכולים לבנות שרתים המבוססים על מעבדים אלה כמערכת בינה מלאכותית אחודה לעיבוד מקדים של נתונים ועבור אימון של מודלים בפריסה מאוזנת של ביצועי AI, יעילות, דיוק ויכולת לצמוח.
דבר נוסף שהתוצאות הראו הוא שמעבדי ה-Xeon של אינטל מספקים לארגונים יכולות פריסת מערכות בינה מלאכותית היישר מהקופסה למטרות כלליות, וכך אפשר להימנע מהעלות ומהמורכבות הנדרשות בעת בניית מערכות AI ייעודיות. בנוסף, מספר קטן של לקוחות שמאמנים לסירוגין דגמים גדולים מאפס יכולים להשתמש במעבדים למטרות כלליות, ולעתים קרובות בשרתים מבוססי אינטל שכבר פרוסים אצלם כדי לנהל את העסקים שלהם. עם זאת, רוב הלקוחות משתמשים במודלים מאומנים מראש, שמכווננים עבור מערכי הנתונים הקטנים יותר שלהם. התוצאות שפורסמו מוכיחות שוב שעם הפתרונות של אינטל ניתן לבצע את הכוונון העדין הזה בתוך דקות בלבד, באמצעות תוכנת Intel AI ותוכנות קוד פתוח סטנדרטיות בתעשייה.
תוצאות מרשימות בכל ההיבטים
שבבי ה-Gaudi2 השיגו, כאמור, כמה תוצאות מרשימות במבחנים, כגון מבחן זמן האימון של ה-GPT-3, שנמשך 311 דקות בלבד (כלומר: קצת יותר מחמש שעות). זה קרה באמצעות 384 יחידות האצה. כן הושגו תוצאות אימון מצוינות בתרחישי הראייה הממוחשבת ResNet-50 ו-Unet3D עם שמונה מאיצים, ומודל עיבוד השפה הטבעית BERT עם שמונה ו-64 מאיצים, שיפור של 10% ו-4%, בהתאמה, הושג במבחני ה-BERT וה-ResNet לעומת ההגשה הקודמת, בחודש נובמבר האחרון.
בעת שימוש במעבדי ה-Xeon Scalable מהדור הרביעי של אינטל לאימון של BERT ו-ResNet-50, האימון הסתיים לאחר 47.93 דקות ו-88.17 דקות, בהתאמה, כאשר מדובר היה בבדיקה בחטיבה סגורה, ואילו בחטיבה הפתוחה התקצר הזמן של מבחן ה-BERT ל-31.06 דקות בלבד, עם הגדלה ל-16 צמתי מחשוב. במבחן עם המודל הגדול יותר, RetinaNet, השיג המעבד זמן של 232 דקות (פחות מארבע שעות) בהרצה של 16 צמתי מחשוב – זמן שמראה שהלקוחות יכולים ליהנות מגמישות גבוהה במיוחד ולהשתמש במחזורי Xeon מחוץ לשעות השיא כדי לאמן את הדגמים שלהם.
MLPerf, שנחשב בדרך כלל כאמת מידה מוסכמת לביצועי בינה מלאכותית, מאפשר השוואה הוגנת וניתנת לשחזור בין פתרונות. אינטל הגיעה לציון דרך של יותר מ-100 הגשות למבחני המדד, והיא נותרה הספקית היחידה שחשפה באופן ציבורי תוצאות של מעבד עם תוכנת למידה מעמיקה ברמה שמקובלת באקו-סיסטם של התעשייה.
לדברי סנדרה ריברה, סגנית נשיא ומנכ"לית קבוצת הדטה סנטר והבינה מלאכותית של אינטל, "התוצאות של המבחנים הללו מאמתות את ערך עלות הבעלות הכוללת שמעבדי ה- Xeon ומאיצי הלמידה המעמיקה Gaudi שלנו מספקים ללקוחות בתחום ה-AI. המאיצים המובנים של Xeon הופכים אותו לפתרון אידיאלי להרצת עומסי בינה מלאכותית על מעבדים למטרות כלליות, בעוד שמעבדי ה-Gaudi מספקים ביצועים תחרותיים עבור מודלים של שפות גדולות ובינה מלאכותית יוצרת. המערכות הניתנות להרחבה של אינטל, עם תוכנת קוד פתוח ממוטבת וקלה לתכנות, מנמיכות את החסמים עבור לקוחות ושותפים, שיכולים לפרוס מגוון רחב של פתרונות מבוססי בינה מלאכותית בדאטה סנטר – מהענן ועד לקצה החכם".
תגובות
(0)