אנבידיה: AI לכולם, יצירת תוכן תלת ממדי מטקסט וכל מה שביניהם
הכנס השנתי של אנבידיה היה הבמה להכרזת שורה של חידושים, בהם שירות DGX Cloud לבינה מלאכותית מקוונת, DGX Quantum, המשלב מחשוב קוונטי עם מחשוב מואץ קלאסי, Picasso ליצירת תמונות, וידיאו ותוכן תלת ממדי ועוד
כנס GTC 2023, כנס מחשוב-העל והבינה מלאכותית השנתי של אנבידיה, יצא אתמול דרך. כמו בכל שנה, הנאום המרכזי הראשון היה של מנכ"ל ומייסד החברה, ג'נסן הואנג, שהציג שורה של חידושים. כזכור, לאנבידיה מרכז פיתוח משמעותי מאוד בישראל, עם למעלה מ-3,000 עובדים, שאחראי גם השנה באופן ישיר לחלק מהחידושים שמציגה החברה.
אחד מאותם חידושים הוא מעבד גרפי חדש בשם NVIDIA H100, שהוא דור ההמשך ל-A100, שלפי החברה נחשב לפופולרי במיוחד בסביבות של מחשוב על עתיר ביצועים. הכרטיס החדש, כך סיפרה יעל אסף שנהב, סמנכ"לית תחום BlueField DPU & NIC, מציע את האפשרות לתשתיות בינה מלאכותית להתמודד עם הדרישות ההולכות וגדלות לעוצמה ומהירות בחישובים, ואחרי שכבר הוצג לאחרונה הוא כבר נכנס לייצור סדרתי.
אחד הדברים החדשים שיסתמכו על היכולות של ה-H100, בשילוב עם מעבדי ה-A100 הקודמים לו, הוא DGX Cloud. באנבידיה לוקחים את היבט האימון של הבינה המלאכותית והופכים אותו לשירות מקוון לפי שימוש. זהו שירותי מרובה עננים, שמנוהל בידי אנבידיה, אבל בשילוב עם ספקיות ענן. הראשונה שתשלב את DGX Cloud היא אורקל, שתשתמש במה שמכונה "אשכול על" עם גישה לעד 32,000 מעבדים גרפיים בו זמנית. ובחברה יודעים לספר שגם גוגל ומיקרוסופט בדרך.
"המטרה היא להביא יכולת פיתוח בינה מלאכותית לכל חברה בעולם תמורת דמי מנוי חודשיים. יש צורך ביכולות מחשוב עוצמתיות שלא כל חברה יכולה להקים ולתפעל בעצמה, והשירות יאפשר גישה לתשתית על באמצעות הענן של DGX עם גישה לאלפי GPU שעובדים ביחד כאחד, וזה כולל גישה לתוכנה של אנבידיה, הכוללת את כל מה שצריך לתרחישי אימון של בינה מלאכותית. הכל מוצע בגישה ישירה, מהירה ופשוטה ישירות מהדפדפן, עם אפשרות התאמת גודל בהתאם לדרישות המשתנות של הלקוח", סיפרה שנהב.
לפי הואנג, מדובר ברגע מכונן. "זהו רגע ה-iPhone של תעשיית הבינה המלאכותית. סטארט-אפים נמצאים במרוץ לבנייה של מוצרים ומודלים עסקיים משבשי-שוק, ובוחנים כיצד לפעול ולהגיב. DGX Cloud יאפשר ללקוחות שנמצאים במרוץ בנייה של יישומי בינה מלאכותית יוצרת גישה ישירה למחשוב על דרך הענן ובקנה מידה רחב וגלובלי", הוא אמר.
שיתוף פעולה עם סטארט-אפ ישראלי
עוד פעילות חדשה שהוצגה היא פעילות החברה במרחב המחשוב הקוואנטי. החברה הציגה מערכת חדשה בשם DGX Quantum, שפותחה בשיתוף פעולה עם סטארט-אפ ישראלי בשם קוואנטום משינס. זו המערכת הראשונה בעולם המחשוב הקוואנטי, המציעה האצה על ידי שימוש במעבדים גרפיים. המערכת תאפשר לשלב יישומים באופן היברידי עם שילוב של מחשוב-על מסורתי לצד מחשוב קוואנטי כדי להציע את הטוב בשני העולמות.
המערכת מבוססת על השבב Grace Hopper Superchip של אנבידיה ועל פלטפורמת התוכנה בקוד פתוח CUDA Quantum, בשילוב עם פלטפורמת בקרה קוונטית מתקדמת, OPX, שאותה מציעה חברת קוואנטום משינס, וכן של שפת התכנות המתקדמת QUA. "השילוב בין הפלטפורמות יאפשר לחוקרים לבנות יישומים חזקים באופן יוצא דופן, שמשלבים מחשוב קוונטי עם מחשוב מואץ קלאסי מהמתקדמים בעולם, לצד יכולת כיול, תיקון שגיאות בחישובים קוונטיים ופיתוח אלגוריתמים היברידיים", אמר איתמר סיוון, מייסד שותף ומנכ"ל חברת הסטארט-אפ.
הוא סיפר, כי המקום הראשון שבו תוצב המערכת היא מרכז המחשוב הקוונטי הישראלי שהושק לפני מספר חודשים. "אנו מובילים אותו באמצעות רשות החדשנות. יוצבו בו חמש פלטפורמות שונות שכוללות שלושה סוגים של מחשבים קוונטיים, אשכול של מחשוב-על וגם סביבת מחקר לחברות ישראליות – הוא יהיה הראשון בעולם שמשלב את כל הפלטפורמות הללו ביחד עם קישוריות מהירה במיוחד באמצעות DGX Quantum. זה צפוי לקראת סוף 2023", הוא הוסיף.
פלטפורמה יוצרת
באנבידיה הכריזו גם על NVIDIA AI Foundation, אוסף של כלי בינה מלאכותית יוצרת, המבוססים על מודל שפה גדול. מדובר בשלושה מודלים מאומנים מראש, שמספקים את הבסיס לחברות באקוסיסטם של אנבידיה לבנות יישומי בינה מלאכותית משלהם – על בסיס השימוש ב-DXG Cloud.
NeMo הוא שירות ענן למודלי שפה ממשפחת ה-GPT, עם הבנה על בסיס טקסט. המודל שהציגה החברה בכנס מיועד ללמוד מידע קנייני של ארגונים בזמן אמת, ולא רק מהאינטרנט, על מנת להימנע מיצירת נתונים לא מעודכנים ולא מדויקים. NeMo תומך ב-100 שפות כולל עברית. הכלי השני הוא נגזרת בשם BioNeMo להבנת שפה ביולוגית, שמיועד בעיקר לתחום של פיתוח תרופות, ולפי החברה מסייע מאוד לקצר תהליכים.
הכלי השלישי הוא Picasso ליצירת תמונות, וידיאו ותוכן תלת ממדי ישירות מטקסט. ארגונים יוכלו להזין את הדטה שבאמצעותה הם רוצים לאמן את המודל בר ההתאמה, כשניתן לבצע התאמות שונות כדי ליצור שפה חדשה המשלבת את מה שאנבידיה מציעה עם המודלים של החברות.
תגובות
(0)