ליישר את העולם ולהפוך אותו לדיגיטלי
יואל בר-אל, מייסד-משותף ומנכ"ל Trax, מסביר כיצד ניתן לתרגם צילום מדפים בחנויות למידע דיגיטלי מועיל ליצרנים ולקמעונאים
לא אחת, כשאנחנו עושים את הקניות בסופרמרקט, אנחנו רואים סוקרים שעוברים בין המדפים ורושמים מה קורה עליהם – כמות המוצרים, האם כל אחד מהם נמצא במקום הנכון, האם מודבקים עליהם המחירים כמו שצריך ועוד. אלה יכולים להיות עובדים של הסופרמרקט או רשת המרכולים עצמה, אבל גם סוקרים מטעם חברות מזון.
אלא שאפשר גם אחרת: הסטארט-אפ הישראלי-סינגפורי Trax, או, בשמו המלא, Trax Image Recognition, פיתח פתרון שמאפשר לאיש השטח של חברת המזון לצלם תמונה של המדפים הרלוונטיים עבורו ולשלוח את התמונה לעיבוד בשרת המרכזי של Trax. שם מותקנת מערכת ראייה מלאכותית שמסוגלת לקחת תמונות ממרחקים שונים, מזוויות שונות, בתאורה שונה וברזולוציה נמוכה, ולמרות זאת "ליישר" אותה ולזהות כל פריט ופריט, עד רמת המק"ט. היא יכולה גם לאחד תמונת פנורמה מתמונות שצולמו תוך כדי הליכה.
יואל בר-אל, מייסד-משותף ומנכ"ל Trax, אמר לאנשים ומחשבים כי "בהיסטוריה האנושית היו הרבה מהפכות – הדיבור, החקלאות, הדפוס, התעשייה והמחשוב. כעת אנחנו נמצאים בעידן הדיגיטלי, שבו לוקחים פרטים בעולם האנלוגי והופכים אותם לדברים ברי חיפוש, שאפשר להוציא מהם תובנות. אנחנו מתמקדים בעולם הקמעונות. הטכנולוגיה שלנו יודעת לקחת שטחי מדף ולהפוך אותם ממשהו שהוא אופליין, שאי אפשר לתקשר איתו מחוץ לחנות, למשהו שהוא אונליין – ובזמן אמת".
Trax הוקמה ב-2010 בסינגפור על ידי קבוצת יזמים, ובהם שני ישראלים: בר-אל, שחי עם משפחתו במדינה זו כבר 18 שנים, ודרור פלדמן, מנהל הטכנולוגיות הראשי של החברה. "יש לחברה הרבה מה-DNA הסינגפורי, שהוא לא רחוק מזה הישראלי", אמר בר-אל.
מרכז הפיתוח של Trax נמצא בתל אביב ומעסיק כ-110 עובדים בתחומי הראייה הממוחשבת, הבינה המלאכותית ומדעי הנתונים. עוד מועסקים שם תוכניתנים שמתמחים בכל הממשקים מול הלקוחות.
"ההתחלה הייתה כשפרוקטר אנד גמבל (P&G) באה אלינו עם בעיה ספציפית: הם לא היו מסוגלים לדעת מה נמצא על המדף", כך בר-אל. "הם ציינו שלוש סיבות מדוע הם רוצים לדעת זאת: כדי לבדוק שאנשי המכירות מטעמם בחנויות עושים את מלאכתם; לוודא שהחנויות מקיימות את ההסכם עבורו שילמה החברה כסף רב (יצרנים ברחבי העולם משלמים יותר מ-70 מיליארד דולר בשנה להבטחת שטחי מדף – א"ב); ולקבל מידע תחרותי על המתחרים על שטח המדף, כדי לזהות חוזקות או נחיתות חולם, ובהתאם לקבוע אסטרטגיות מחיר".
לדבריו, "אנחנו פונים לשלושה סוגי לקוחות: היצרנים, כגון קוקה קולה (Coca Cola), היינקן (Heineken) ונסטלה (Nestle), ובארץ – תנובה; הקמעונאים – לדוגמה, טסקו הבריטית; והלקוחות, שבקרוב נשיק אפליקציה שתאפשר להם לדעת היכן נמצא כל מוצר ולצלם את המדף. הם יוכלו לחפש, למשל, פריטים ללא גלוטן והאפליקציה תפנה אותם למוצרים הרלוונטיים. בעצם, אנחנו הופכים בכך את המסחר הרגיל למסחר אלקטרוני".
"כיום ניתן לראות תמונת מצב, אבל לא מה גרם לה. פיתחנו אלגוריתם שיודע לנתח תמונות ברזולוציה נמוכה, של 500 קילו-בייט, ולמרות זאת לזהות ב-99% ודאות כל מוצר, ברמת המק"ט. העיבוד בענן נמשך מספר דקות והאיש בחנות מקבל את כל המודיעין הדרוש, כדי לדאוג שהמוצרים של אותו יצרן יהיו על המדף. את הנתונים אוספים לפורטל שבו היצרן יכול להסתכל על שווקים שלמים ורשתות שלמות".
"אנחנו מזהים כרבע מיליארד מוצרים בחודש"
"עולם הקמעונות מגוון ומשתנה ללא הרף ומגוון המוצרים עצום. בסופרמרקט גדול ממוצע יש בין 40 אלף ל-100 אלף פריטים שונים. לכן, כשמסתכלים על תמונה וצריך לזהות מוצר במדויק, זו משימה קשה מאוד. אין עוד אף חברה בעולם שהצליחה לפתח יכולת כזו, והרבה ניסו", אמר בר-אל.
הוא הסביר על תהליך הזיהוי: "בתמונות רואים מדפים שלמים ואי אפשר לקרוא את הכיתוב שמופיע על גביהם. ולכן, בקבוק קולה של ליטר וחצי ובקבוק של חצי ליטר נראים דומים. המחשב צריך לקחת טביעת רגל של כל מוצר ולזהות אותו גם כשהוא מסובב או שוכב".
לדבריו, "זו בעיה רב ממדית וצריך ליישר את התמונות כדי לנתח אותן, להבין את ההקשר של המוצרים ולהבדיל בין תמונה של מוצר בפרסומת למוצר כפי שהוא נראה על המדף. כמו כן, צריך ללמד את המערכת גיאומטריה ולבצע זיהוי אותיות – וכל זה ברמה גלובלית וסקלבילית. המערכת שלנו עושה את כל זה. כיום היא מזהה כרבע מיליארד מוצרים בחודש – שווה ערך לשמונה מיליון תמונות".
"כדי לעשות זאת", אמר, "אנחנו משתמשים בלמידה עמוקה (Deep Learning). אנחנו מאמנים את המחשב לזהות דפוסי התנהגות בתוך ים הנתונים ובכל צילום שמגיע אליו הוא יכול לשפר את יכולת הזיהוי".
בהמשך הרחיב בר-אל על העובדים המועסקים בחברה: "יש לנו מומחים בראייה מלאכותית ובאלגוריתמיקה, מדעני נתונים שמפיקים מהם תובנות ומתכנתים רבים, שעוסקים גם בתשתיות שלנו, שיודעות לטפל במיליוני תמונות בזמן אמת ולהחזיר תשובות בזמן אמת. לשם כך נדרשים בסיסי נתונים וכלי ניטור ובקרה. אנחנו עובדים 24/7 ב-45 מדינות בעולם, כאשר בכל אחד מהמקומות עומד אדם ליד מדף ומחכה לתשובה".
תגובות
(0)