איך לטפל בעשרות מיליארדי אירועים ביום ולהישאר בחיים

אריאל פיסצקי, סגן נשיא ל-IT בטאבולה, תיאר כיצד ניתן לשרוד בעולם ה-Big Data ולהפיק תובנות מושכלות עבור הלקוחות

אריאל פיסצקי, סגן נשיא ל-IT, טאבולה. צילום: ניב קנטור

"אנו מטפלים במיליארדי דפי אינטרנט ביום, ובעשרות מיליארדי אירועים ביום. כל דף שכזה מייצר אירועים וטלמטריה – עלינו להכניסם למנועים שלנו על מנת שנוכל להפיק מהנתונים הללו תובנות ומידע מושכל", כך אמר אריאל פיסצקי, סגן נשיא ל-IT, טאבולה (Taboola).

פיסצקי דיבר בכנס לקוחות שערכה ורטיקה  (Vertica) ישראל. הכנס, בהפקת אנשים ומחשבים, התקיים אתמול (ג'), במרכז פרס לשלום וחדשנות, יפו. את הכנס הנחה אילן נימני, מנהל אזורי בחברה.

לדברי פיסצקי, "טאבולה עוזרת לכמיליארד משתמשים למצוא תוכן שנמצא בחוץ. סיימתם לקרוא כתבה, ואתם רוצים לקרוא עוד משהו הקשור אליה? אנו עוזרים לכם למצוא את פיסת התוכן הבאה".

התוכן ימצא אתכם

מדובר, אמר פיסצקי, "בעוד התפתחות של עולם האינטרנט: מעולם הפורטלים לעולם החיפוש ומשם לחיקור, לגילוי – משמע שהתוכן 'ימצא' אתכם".

"עלינו לאסוף נתונים ממקומות רבים", ציין. "אנו מחפשים 'אותות', רמזים, על כוונת המשתמש. לכן, אנו מקבצים את המידע, על מנת להבין מה הוא התוכן המיטבי עבורו – גם ביחס לאתר בו הוא נמצא כעת".

לבסוף, אמר, "אנו עוזרים למוציאים לאור להגיע ליותר קהל, ושהקהל יהיה יותר אינטראקטיבי באתר שלהם. חברות עוברות למוצר שלנו – כי אנו מסייעים להם להביא ערך עבורם". לדברי פיסצקי, "אנו עושים היוון לאתר החינמי שאתם נמצאים בו, אנו יודעים לייצר את מירב הערך מה'נדל"ן' החינמי – עבור המו"ל". הוא ציין כי בין השאר, על לקוחות החברה נמנים PC World ,InternetWorld ואתר הרכילות והבידור TMZ.

פעילות נוספת של טאבולה, אמר פיסצקי, היא בעולם התוכן הממומן: "חברה מייצרת קמפיין ומנסה להגיע לאוכלוסייה הרלוונטית אליו. טאבולה נדרשת למנוע חכם, המייצר המלצת תוכן, כזו שתביא להקלקה, שלאחריה מישהו יבקר באתר – ולבסוף תתבצע רכישה".

פרוסים ביותר מענן אחד

לטאבולה, אמר, "יש כמיליארד משתמשים ייחודיים בחודש בעולם, עם אחוז חדירה שני בהיקפו אך ורק לגוגל (Google). מחצית מהמשתמשים עושים זאת עם מחשב נייח ומחציתם – בנייד".

לגבי הטמעת בסיס הנתונים האנליטי של ורטיקה בטאבולה, אמר פיסצקי, "אנו נדרשים לטפל בעשרות מיליארדי פריטי מידע ביום, ולעשות ביניהם קשרים והקשרים, כדי להפיק ידע ותובנות אודות המשתמשים והרגלי הקריאה שלהם. יש לנו אלפי שרתים, חלקם בענן. אנו פרוסים ביותר מענן אחד".

וריטקה, הסביר "עובדת 'מאחור'. היא מסייעת לנו להנפיק מידע ללקוחות, העורכים העובדים באתרים של המוציאים לאור. הם יכולים לדעת נתונים על שתי כתבות לדוגמה, מי הנקראת יותר, מי פחות, ובהתאם – לשים אחת באופן בולט ובשנייה להחליף כותרת, או תמונה, או פונט. בדרך זו הם יכולים להגדיל את כמות ההקלקות על כתבות. המטרה היא למקסם את פעילות הגולש בתוך האתר. באופן דומה, ורטיקה מסייעת להגדיל הכנסות מקמפיין".

"עלינו לעבור על מיליארדי דפי אינטרנט", הסביר פיסצקי, "על מנת למצוא קמפיין ספציפי של מפרסם. עלינו למצוא המון חיוויים על אותו סוג מידע. מאוד בעייתי לעשות זאת על גבי בסיס נתונים מסורתי. היתרון המרכזי של ורטיקה מבחינתנו, הוא ביכולת להנגשת הנתונים, לטובת דיווחים מהירים. ככזו, היא עוזרת לנו לייצר עוד דו"חות. עלינו להכניס עשרות טרה-בייט של נתונים מדי יום – ולוודא שהנתונים אמינים".

"אנו אוספים את הנתונים לשני אשכולות (cluster) של שרתים – בשני דטה סנטרים שונים", סיכם פיסצקי. "הצלחנו לייצר יכולת איכותית בשניהם ולהגיע לזהות כמעט מוחלטת בין הנתונים. בנוסף, קיבלנו יכולת DR מלאה. ערכנו מיכון מלא לדו"חות. בתוך חודשים בודדים העברנו את הדו"חות ממקום אחד לשני, עם השוואות בזמן אמת – וכעת הם רצים מהר יותר".

תגובות

(0)

כתיבת תגובה

האימייל לא יוצג באתר. שדות החובה מסומנים *

אין לשלוח תגובות הכוללות דברי הסתה, דיבה, וסגנון החורג מהטעם הטוב

אירועים קרובים