הכירו את הסטארט-אפ הישראלי שמשנה את הדרך ליצירת וידיאו

D-ID הוא סטארט-אפ המתמחה ביצירת וידיאו על בסיס תמונת סטילס, שבו המצולם נע ומדבר ● "המערכת שלנו כיום מסוגלת לייצר סרטון שלם על בסיס תמונת פנים בודדת, בתוך שניות", סיפר יניב לוי, סמנכ"ל השיווק של החברה

יניב לוי, סמנכ''ל השיווק של D-ID.

D-ID – ששמה מבוסס על קיצור המילים 'אי-זיהוי', או De-identification – הוקמה בתחילת שנת 2017. עד היום היא גייסה 48 מיליון דולר.

את החברה הקימו היזמים גיל פרי, המשמש כמנכ"לה, סלע בלונדהיים, סמנכ"ל התפעול, ואלירן קוטה, סמנכ"ל הטכנולוגיות של D-ID. פרי וסלע שירתו יחדיו בסיירת מובחרת, שם נולד הרעיון להקמת החברה, ואילו קוטה שירת במשך כעשור בתפקיד פיקודי ביחידה 8200. השלושה הם בוגרי תוכנית היזמות של יוצאי 8200, EISP, והאקסלרטור הנחשב Y Combinator.

"עברנו תהליך של שינוי מיקוד, עם פתרון טכנולוגי שבשנתיים האחרונות מצא שוק חדש לחלוטין, שלא היה בתוכנית המקורית שלנו", כך סיפר יניב לוי, סמנכ"ל השיווק של D-ID.

לדברי לוי, "המייסדים פיתחו טכנולוגיה שמאפשרת להציג תמונת פנים של בן אדם, אשר שינויים שלא גלויים לעין האנושית מונעים זיהויו על ידי מערכות זיהוי פנים. עם הזמן צברנו המון ידע בנושא של לימוד פנים ותנועות של אנשים, ואז החלטנו לשנות מגמה ולקחת את החברה לכיוון של יצירת וידיאו על בסיס תמונות בלבד. המערכת שלנו כיום מסוגלת לייצר סרטון שלם על בסיס תמונת פנים בודדת, בתוך שניות".

לפי לוי, "ישנן חברות היודעות לייצר וידיאו מתמונות, אבל התמונות דורשות סריקה מלאה, או שימוש במצלמות ייחודיות ויקרות. הטכנולוגיה שלנו מאפשרת להעלות תמונה אחת של פנים, ועל בסיסה אנחנו יכולים ליצור סרטון שלם של בן אדם מקריא טקסט. בהמשך פיתחנו עוד יכולות ואנו בדרך להציג גוף אנושי שלם – על בסיס תמונה אחת".

נוסטלגיה עמוקה בתנועה

החברה ערכה קמפיין עם MyHeritage. "זו חברה ישראלית נהדרת, העוסקת במחקר גנאלוגי, ומאפשרת לכל אחד ליצור ולנהל את האילן יוחסין שלו", אמר לוי. "יחד יצרנו את Deep Nostalgia, בה המשתמשים יכלו להעלות תמונה ישנה ולהפיק ממנה סרטון קצר בתנועה. זו הייתה אחת מהתופעות הוויראליות של 2021, עם יותר מ-103 מיליון סרטונים שנוצרו עד היום, וחשיפה מטורפת בתקשורת העולמית. בהמשך השקנו יחד גם אפשרות ליצירת סרטון בצירוף קול, בה הדמות בתמונה מדברת – וגם היא הפכה לפופולרית".

לדבריו, "יש לנו את היכולת לקחת את הדמות שנוצרה ולאפשר לה להקריא טקסט. זה יכול להתבצע בעזרת כל מנוע קול שקיים בשוק. אפשרות אחרת היא להקליט את הקול בנפרד ולשלבו בסרטון. אפשרות שלישית היא ליצור דוגמית קול פרטנית, בתהליך שאורך כשעה-שעתיים, ואז ניתן להלביש את חתימת הקול הייחודית לכל טקסט שנבחר".

"הפתרון שלנו", סיפר לוי, "מיועד לכל מי שזקוק להעברת מסרים באמצעות וידיאו, שניתן לייצור במהירות ובקלות. אנחנו מכוונים לעולמות ההדרכה בכלל וההדרכה הארגונית בפרט, תקשורת פנים-ארגונית, וכל הקשור ל-E-Learning. מידע שמועבר בווידיאו זוכה לתשומת לב רב יותר של הצופה לעומת טקסט בלבד. הפתרון שלנו גם מאפשר ללקוחות ליצור סרטונים מותאמים עם מדריך לבחירתם, המשתייכים לכל מגדר, לאום, שפה או העדפה אחרת. מחקרים מוכיחים שאחוז קליטת המסרים עולה כשהצופה מזדהה עם מי שמעביר לו את התכנים".

D-ID - סטארט-אפ המתמחה ביצירת וידיאו מתמונות סטילס, שבו המצולם נע ומדבר.

D-ID – סטארט-אפ המתמחה ביצירת וידיאו מתמונות סטילס, שבו המצולם נע ומדבר. צילום: לכידת מסך מאתר החברה

"קרובים לייצר סרטון וידיאו של גוף שלם מתמונה בודדת"

לדבריו, "בעתיד אנחנו רואים את הפתרון שלנו כחלק מעולם המטאברס. אנחנו קרובים לייצר סרטון וידיאו של גוף שלם מתמונה בודדת".

"מההתחלה אנו מסתייעים בפלטפורמת הענן של AWS", סיכם לוי. "הטכנולוגיה שלנו מורכבת ודורשת בניית מודלים ואימון שלהם באופן קבוע. השירותים של AWS, כמו SageMaker מאפשרים לנו לקצר את הזמן של פיתוח מודל הבינה המלאכותית בצורה משמעותית. יחד עם שירותים כמו Amazon Rekognition, או Amazon Polly, אנחנו יכולים לחסוך זמן רב בפיתוח של זיהוי תמונה וקול, ולהתמקד בפתרון שלנו. זה משתלב, כמובן, עם שאר השירותים שמשמשים אותנו לתפעול השוטף של הפלטפורמה כמו Amazon S3, או ניהול עומסים עם Amazon ECS שמנהל את כל הקונטיינרים של האפליקציה שלנו".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים