דגשים בבחירת מערכת Cloud Data Warehouse חדשה
מאת: טל נועם, מנהל חטיבת פתרונות Data Warehouse & Analytics בי.א. מיטווך ובניו
מערכות Cloud Data Warehouse & Data Lake מודרניות מהוות את הנדבך המרכזי המספק דטה גולמי ומנותח, שבאמצעותו מתקבלות החלטות טקטיות ואסטרטגיות כאחד: ממידע עדכני ביותר על הלקוח, המחושב ומונגש בזמן אמת במערכת ה-Call Center, ועד עיבודים סטטיסטיים מורכבים שמבצעים ה-Data Scientists לקביעת מגמות. אנליזות אלו מספקות מידע קריטי, המאפשר קבלת החלטות מושכלות מבוססות דטה.
בשל חשיבותן של מערכות ה-Cloud Data Warehouse & Data Lake, הן הופכות למערכות תוכנה קריטיות, אשר חייבות להיות זמינות כל הזמן, גם באירועי קיצון. על כן קיימת חשיבות בבחירת פתרון Cloud Data Warehouse & Data Lake שנותן את הגמישות המירבית להפעלה שלו על עננים ציבוריים שונים, וגם ב-On-Prem, כולל בארכיטקטורה היברידית.
מערכת ה-Vantage – Teradata Cloud Analytics – אשר דורגה על ידי גרטנר בסוף שנת 2021 כפלטפורמת מספר 1 בעולם של בסיס הנתונים לאנליטיקה בענן, בכל הקטגוריות שנבחנו, עונה בין היתר גם על הצורך הזה.
גמישות, פתרון PaaS וניצול אופטימלי של משאבי המחשוב בארגון
פתרון ה-Teradata Cloud Data Warehouse המוזכר לעיל מאפשר הקמה אוטומטית, תוך שעה-שעתיים, של סביבת אנליטיקה חדשה בכל אחד משלושת העננים הציבוריים הנפוצים (Azure, AWS, GCP), ואף מאפשר לבצע שאילתות משולבות עם סביבת ה-On-Prem וסביבת Azure Blobs או AWS S3, בטכנולוגיה ייחודית הקרויה QueryGrid. גמישות זו גם מאפשרת לארגון להחליט האם ליישם את פרויקט האנליטיקה הבא על Azure, או לחלופין ליישמו על AWS או GCP, על פי המחיר התחרותי ביותר באותו הזמן. עוד יתרון של גמישות זו הוא בכך שהיא מאפשרת לארגון לפצל במידת הצורך ולשמור סוגי דטה יותר סודיים בסביבת ה-On-Prem בעוד שאת שאר הדטה – לשמור ולנתח בענן.
יתרון נוסף מובהק של Teradata Cloud Analytics הוא האפשרות להיות פתרון PaaS (ר"ת Platform As A Service) אמיתי, כלומר: בניגוד לשחקנים אחרים בתחום, זהו פתרון שימנע את הצורך לחלוק ולהתחרות על משאבים עם לקוחות Data Warehouse & Data Lake אחרים בסביבת הענן, או להיות יותר חשופים לדליפת מידע, בשל העובדה שהמערכת לא תותקן בסביבת הענן המוגנת, שמוקצת לארגון שלך בלבד. ארכיטקטורת פתרון ה-PaaS של Teradata Cloud Data Warehouse מאפשרת לעבוד בתוך סביבת הענן הציבורי שמוקצית לארגון, הקיימת כבר כיום, על ידי כך שמצרפים לתוכה גם התקנה אוטומטית של סביבת Data Warehouse & Big Data, תוך התממשקות לשאר המערכות של הארגון בענן או ב-On-Prem.
בנוסף לכך, מאפשר ה-Teradata Cloud Analytics ניצולת אופטימלית של משאבי המחשוב של הארגון הקיימים כבר בענן, לפני שיידרש להגדיל אותם.
כמובן שקל מאד (ומדליק) בפתרונות חלופיים (וגם ב- Teradata כמובן) להראות כיצד עושים Scale Up לשרת גדול יותר, או Scale Out למספר שרתים נוספים במקביל, אולם כשיגיע החשבון בסוף החודש, כנראה שיידרשו הסברים. על כן, קיים יתרון בבחירה בפתרון Cloud Data Warehouse מודרני, כדוגמת Teradata, שכולל גם את ה-Adaptive Optimizer החדשני והבשל, אשר יודע "לסחוט" למקסימום את הביצועים מהחומרה הקיימת בתצורה הנוכחית בענן, לפני שהארגון יאלץ להגדיל את משאבי המחשוב שלו בענן, תמורת תשלום נוסף.
בדומה לכך, תמיד נישאף לכך שכל האנליסטים, צרכני ה-BI, ה-Data Scientists ואפליקציות זמן האמת שניזונות מהדטה, יתחברו ל-Cloud Data Warehouse אחד ויקבלו את השירות בהתאם ל-SLA הנדרש להם. כלומר, תמיד נשתדל להימנע מפיצול מתודי ל-Data Warehouses/Data Marts נפרדים, רק בכדי להבטיח את הביצועים הנדרשים לכל סוג משתמש או אפליקציה. פיצול כזה ל-Data Warehouses נפרדים בכדי להבטיח זמני תגובה מהירים, אינו אופטימלי כלל, מכיוון שברגע נתון חלק ממשאבי החומרה "יעבדו קשה" בעוד שחלקם יהיו "מובטלים". גם על הצורך הזה עונה מערכת ניהול והקצאת המשאבים המיוחדת והבשלה של Teradata, אשר מאפשרת להבטיח על Data Warehouse אחד ויחיד, חלוקה והקצאה של המשאבים בצורה אופטימלית, כזו שתבטיח את ה-SLA הנדרש לכל סוג של משתמש, מבלי לבזבז משאבים.
לפרטים נוספים: [email protected]