פיני כהן, STKI: "ה-Big Data מהווה איום על פרדיגמות האחסון הקיימות"
"מזה עשור אנחנו מדברים על אחסון מרכזי, אבל הטכנולוגיות החדשות, שמגיעות מהעולם האינטרנט, צפויות לגרום שינוי בתצורה זו ולהביא לאחסון מבוזר", אמר כהן, סגן נשיא ואנליסט בכיר בחברה ● לדבריו, הטיפול ב-Big Data ייעשה על ידי שימוש בבסיס הנתונים בתחום ה-noSQL, "שהדור הקודם של בסיסי הנתונים אינו יכול לספק להם מענה"
"אנחנו מבחינים בהמשך המגמות ה-'רגילות' בעולם האחסון – הגידול האקספוננציאלי בנפחי המידע, ה-'הצטרכנות' של רכיבי האחסון ואחרות, אבל המגמה המעניינת, על אף שטרם בשלה, היא כניסת ה-Big Data. מגמה זו מאיימת לשנות את הפרדיגמה של עולם האחסון כפי שהכרנו עד היום", אמר פיני כהן, סגן נשיא ואנליסט בכיר ב-STKI.
כהן דיבר בפתח כנס Storage2012, שהופק על ידי אנשים ומחשבים ונערך היום (ד') במלון דיוויד אינטרקונטיננטל בתל אביב בהשתתפות מאות מקצוענים מעולמות התשתיות והאחסון. הנחה את הכנס יהודה קונפורטס, העורך הראשי של הקבוצה.
לדברי כהן, "מזה עשור אנחנו מדברים על אחסון מרכזי, אבל הטכנולוגיות החדשות, שמגיעות מהעולם האינטרנט, צפויות לגרום שינוי בתצורה זו ולהביא לאחסון מבוזר". הוא הוסיף, כי הגדרת ה-Big Data נוגעת לכמה היבטים: היקף של עשרות טרה בייט; באיזו מהירות הנתונים מתעדכנים; מגוון סוגי המידע – מובנה ולא מובנה, כאשר "העלייה הגדולה היא במידע הלא מובנה"; עושר המידע; והאפשרות לעבוד עם סכמות משתנות.
טכנולוגיות לעולם ה-Big Data
הוא אמר, כי הטיפול ב-Big Data ייעשה על ידי שימוש בבסיס הנתונים בתחום ה-noSQL, "שהדור הקודם של בסיסי הנתונים אינו יכול לספק להם מענה". לדבריו, מימוש פתרון זה מיועד לעוצמות מיחשוב גדולות, עם מחשבים ונתונים רבים, שלא ניתן לעשות בבסיסי הנתונים הקנייניים. בסיסי הנתונים הללו, אמר, הם בעלי סכמה גמישה וניתנת לשינוי ולגידול. כהן ציין כמה מהפתרונות בעולם ה-noSQL, ביניהם קסנדרה (Cassandra) ו-MongoDB. הוא הוסיף, כי "שימוש בבסיסי נתונים אלה, לצד טכנולוגיית Hadoop, יביא לכך שלא תהיה הסתמכות על אחסון מרכזי אלא על אחסון מבוזר בשרתים. זו פנייה של 180 מעלות ממה שהיינו רגילים לו בעשור האחרון. רוב מנהלי התשתיות לא מכירים את התחום החדש ועליהם להתוודע אליו, כי Big Data הוא דבר מהותי לעולם האחסון".
צילום ועריכת וידיאו: עדי רמלר
כך, אמר, חברה בשם אורביטז (Orbitz), נעזרה בטכנולוגיית Hadoop לטיפול בנפחי האחסון שלה, בהיקף 750 טרה-בייט, תוך שאנשי התשתיות עובדים על מערכת אחסון אחת.
"Hadoop היא טכנולוגיה אשר תומכת בעד 4,000 שרתים העובדים יחד ועד 20 פטה-בייט נפח על אשכול אחד", אמר כהן. הוא ציין, כי לשימוש בטכנולוגיה זו יש מחיר: "הבעיה היא שבעזרתה לא נעשה עדכון מלא ומהיר לנתונים הנמצאים במקומות שונים, כי זה לוקח זמן. לכן, הטכנולוגיה אינה מתאימה, למשל, לטיפול ביתרות בחשבון עובר ושב".
לצד הטכנולוגיות הללו, ציין כהן, יש בעולם ה-Big Data מכונות בסיסי נתונים לנפחים גדולים – של יבמ (IBM), אורקל (Oracle), סאפ (SAP) ו-EMC.
מגמות נוספות אותן הוא ציין הן Scale Out Storage – "לקחת מכונות אחסון עובדות ולחבר ביניהן"; ההצטרכות של האחסון; ו-וירטואליזציה של האחסון, עליה הוא אמר ש-"אף על פי שזו טכנולוגיה מבטיחה, היא טרם נכנסה לשוק המקומי".
כהן סיים בהציגו מחקר שערכה החברה ממנו עולה, כי כל עובד ומנהל תשתיות ואחסון טיפל ב-2011 ביותר נפח אחסון לעומת ב-2010. "מצד אחד, עולם האחסון כמנהגו נוהג, "ומצד שני, אנחנו מבחינים באופק במגמות שישנו את האחסון באופן מהותי", סיכם.
תגובות
(0)