הנתונים: הנפט של העידן הדיגיטלי – חלק ו'
איכות הנתונים המגיעים מצד ג' משתנה בהתאם למקור הנתונים ● ישנם מקורות ברורים ומזוהים הנהנים מרמת איכות גבוהה, אולם ישנם גם מקורות שהם ברמת איכות לא ברורה ולכן יש לנקוט לגביהם זהירות רבה יותר
באופן טבעי, הנתונים שייכים לארגון שאוסף ומנהל אותם. אלה גם הנתונים הנמצאים ברמת איכות הגבוהה ביותר מאחר והארגון אחראי עליהם ומכיר אותם.
במשך שנים רבות התפיסה הרווחת הייתה לא לחלוק נתונים אלה עם ארגונים או אנשים אחרים מסיבות די ברורות – זהו נכס של הארגון ויש להגן עליו מפני חשיפה, שיקולי פרטיות וצנעת הפרט, שמירה על מידע רגיש מבחינה עסקית וכד'. הארגונים נטו לשמור על הנתונים שלהם מאחורי חומות גבוהות.
בשנים האחרונות אנו עדים לשינוי משמעותי גם בתחום זה. נציין שתי תופעות חדשות יחסית: א) פתיחת וחשיפת מאגרי נתונים של ארגונים ממשלתיים וציבוריים, תופעת ה-Open Data; ב) פתיחת וחשיפת נתונים של ארגונים עסקיים באמצעות ממשקי תכנות (Application Programming Interfaces) המאפשרים לארגונים שונים לשלוף ולשתף ביניהם יישומים ונתונים.
בהקשר זה, חשוב להדגיש שאיכות הנתונים המגיעים מצד ג' משתנה בהתאם למקור הנתונים – ישנם מקורות ברורים ומזוהים הנהנים מרמת איכות גבוהה אולם ישנם גם מקורות שהם ברמת איכות לא ברורה ולכן יש לנקוט לגביהם זהירות רבה יותר.
נפרט בקצרה שתי תופעות חשובות אלה.
פתיחת מאגרי נתונים ממשלתיים – Government Open Data
הרעיון של פתיחת וחשיפת מאגרי מידע של ארגונים לשימוש על ידי גורמים מחוץ לארגון למטרות שונות וללא מגבלות על זכויות יוצרים, הוא רעיון שקיים כבר שנים רבות.
ניתן לראות רעיון זה כחלק מהמגמה שצברה פופולריות ומקדמת את אי הגבלת השימוש (open) בתוכנה (open source).
מגמה זו זכתה לחיזוק משמעותי בשנת 2013 כאשר הממשל של הנשיא אובמה פרסם את המדיניות ואוסף של הנחיות לכל הרשויות הפדרליות בדבר פרסום ופתיחת מאגרי מידע ממשלתיים וציבוריים.
מגמה זו יצאה מתוך ההנחה שהמידע המנוהל על ידי הרשויות הממשלתיות והמקומיות שייך בסופו של דבר לאזרחים ולמשלמי המיסים. הממשלות מחזיקות מאגרים אלה בשם האזרחים שלהן ולכן עליהן לחלוק אותם ולחשוף את מה שניתן לחשוף כדי לעודד פתיחות ושקיפות וכן כדי לעודד יצירת חדשנות וערך חדש.
הרעיון של חשיפת מאגרי נתונים ממשלתיים התפשט במהירות למדינות אחרות וכיום קיימים מיזמי Open Data במספר רב של מדינות, כולל בישראל. המדינות המובילות בתחום זה הן ארצות הברית עם אתר ה-Data.gov והבריטים עם Data.gov.uk. גם בישראל פותח אתר Data.gov.il המכיל עשרות מאגרים ממשלתיים הפתוחים וזמינים לציבור ולארגונים.
ההגדרה של Open Data היא שאלה נתונים שניתן להשתמש בהם באופן חופשי ומותר לכל אחד להפיץ אותם בהגבלות מינימליות (לעיתים רק של אזכור המקור).
הרעיון העומד מאחורי מגמה זו הוא שמאגרי הנתונים הם נכס שניתן למנף למטרות שונות – לתועלת הציבור וגם לתועלות עסקיות.
רשימת המאגרים הממשלתיים שניתן לפתוח היא עצומה – מאגרי נתונים של NASA המתקבלים מחלליות המחקר, מאגרי מפות, מאגרים עם מידע רפואי (כמו למשל של הגנום האנושי), מאגרי נתונים על איכות הסביבה ועוד.
למשל פתיחת מאגר הנתונים של השירות המטאורולוגי מאפשר לכל אחד לשלוף את נתוני מזג האוויר שהצטברו במשך שנים רבות ולעשות בהם שימושים שונים ומגוונים. ארגונים העוסקים בחקלאות ובתיירות יכולים לעשות שימוש בנתוני המשקעים בחודשי השנה השונים באזורים בארץ ולפתח יישומים הממליצים לחקלאים מתי לזרוע ולקצור יבולים מסוימים או יישומים תיירותיים המציגים לתיירים את מזג האוויר באתרים בהם הם מבקשים לבקר.
במהלך השנים אף התפתחה פלטפורמת תוכנה (המבוססת על קוד פתוח כמובן) בשם CKAN המאפשרת לארגונים וממשלות לפתוח מאגרים במהירות וביעילות ומאפשרות איתור נוח של המאגרים על ידי הגורמים המעוניינים. מערכת זו אף מנהלת את ה-Meta Data כדי לאפשר את הבנת מבנה הנתונים ואת הגישה אליהם.
פתיחת מאגרים ממשלתיים אפשרה לחברות שונות לפתח יישומים חדשניים. למשל Moovit שהחלה את פעילותה בארץ עם פתיחת המאגרים של משרד התחבורה על קווי האוטובוסים והתחבורה הציבורית, כולל כל התחנות להורדת והעלאת נוסעים.
על בסיס מידע זה החברה פיתחה יישום המאפשר לכל אחד לתכנן את מסלול הנסיעה שלו באמצעות התחבורה הציבורית ממקום כלשהו ליעד כלשהו. משימוש בסיסי זה החברה הוסיפה מגוון רחב וגדול של אפשרויות ופונקציות תוך הצגת מפות של העיר ומסלולי הנסיעה, רשימת התחנות הקרובות, יכולת לשלב בין אמצעי תחבורה שונים. החברה מספקת כיום שירותים כאלה ביותר מ-1,200 ערים ברחבי העולם.
גם מדלן הישראלית שפיתחה יישום השואב חלק מהמידע ממאגרי מידע ממשלתיים כדי להציג למשתמש נתונים על עסקאות המכירה/קניה ומחירי הדירות בסביבה, על בתי ספר וגני ילדים בשכונה והמרחק שלהם מהדירה שהמשתמש מתעניין בה, על מיקום האנטנות הסלולריות בשכונה, על מיקום חנויות הסופרמרקט באזור ועוד.
משרד הבריאות בארץ יצא לאחרונה לדרך עם פרויקט של הקמת מאגר לאומי של נתונים רפואיים שיאוחסן על גבי הענן של אמזון (Amazon), כמובן לאחר שכל פרטי הזיהוי מותממים (עוברים תהליך חכם של אנונימיזציה שאינה פוגמת בקשרים הלוגיים והתוכן הסטטיסטי הטמון בנתונים). בכוונת משרד הבריאות לאפשר לגופי מחקר של קופות החולים, באקדמיה, בחברות לייצור תרופות ועוד, לבצע מחקרים על בסיס הנתונים הרפואי הלאומי וכל זאת מתוך מטרה לקדם את איכות הרפואה בארץ.
קיימות דוגמאות רבות נוספות לחברות שידעו לנצל את חשיפת המאגרים הממשלתיים ולפתח על בסיסם יישומים חדשניים שהביאו לערך רב לציבור.
פתיחת מאגרי נתונים של ארגונים עסקיים
התופעה של חשיפת מאגרי נתונים החלה להתפתח גם בקרב ארגונים עסקיים, כמובן מתוך סיבות אחרות. ארגונים עסקיים עושים זאת על מנת לפתח את עסקיהם ולכן ארגונים אלה בדרך כלל מאפשרים זאת תמורת תשלום. יש גם ארגונים הרואים בפתיחת הנתונים שלהם לקבוע עובדות וסטנדרטים ולייצר הכנסות באופן עקיף ולא רק ישיר.
הדרך לגשת לנתונים היא על ידי ממשק תכנות (API), שזו השיטה הרווחת, או על ידי העברות קבצים שזו שיטה פחות פופולרית. להבדיל ממאגרי הנתונים הממשלתיים שמסופקים לגורמים המעוניינים ללא תמורה, החברות העסקיות מפתחות מודלים עסקיים שונים ובחלק מהמקרים גובות תשלום בגין הגישה לנתונים שלהן.
נתבונן לרגע ב-Waze. החברה מספקת ערכת תכנות (SDK) המאפשרת גישה למאגרי הנתונים שלה ומאפשרת למפתחי יישומי צד ג' לשלב מידע של Waze בתוך היישומים שלהם, כולל נתונים, מפות וחישובים.
באמצעות ערכת התכנות ניתן לקבל מידע על זמן הגעה צפוי ליעד כלשהו (ETA – Expected Time of Arrival) בהתבסס על נתוני עומס התנועה כפי שיודעים ומנוהלים על ידי Waze. החברה מאפשרת גם גישה לנתוני ניווט וחישוב המסלול המהיר ביותר בין שתי נקודות ולשלב את התוצאות בתוך יישום צד ג'. זו למעשה גישה לשכבה אפליקטיבית ולא ישירות לנתונים.
מודל עסקי מעניין שחברות מפתחות נקרא החלפת נתונים (data swapping). במקום לגבות כסף בגין השימוש בנתונים, החברות מחליפות ביניהן נתונים, נתונים בעלי ערך לשתי החברות, למשל, Waze מאפשרת זאת לרשויות מקומיות.
העירייה מקבלת נתוני מצב תנועה, תאונות, מהירות התנועה של מכוניות ועוד מתוך מאגרי Waze ובסיוע נתונים אלה מסוגלת לנהל בצורה טובה יותר את התנועה בעיר (Traffic Management). בתמורה לנתונים אלה, העירייה מספקת ל-Waze נתונים כגון צילומים מהמצלמות, נתונים של רמזורים וסנסורים שונים המותקנים על הכבישים ומופעלים על ידי העירייה.
גם ל-Moovit יש מודל עסקי דומה המספק לרשות מקומית מידע על היקפי ויעדי הנסיעות ובתמורה הרשות המקומית מספקת ל-Moovit מידע בזמן אמיתי על אוטובוסים ורכבות והיא יכולה גם לספק התראות למשתמשי Moovit על עומסי תנועה, עיכובים בתנועת האוטובוסים והרכבות וכד'.
Strava שבנתה יישום מובייל של רשת חברתית של ספורטאים במקצועות שונים (למשל רוכבי אופניים, ריצה וכד'), ממנפת את מאגר הנתונים שלה. למשל היא גובה מרשויות מקומיות 80 סנט עבור כל רוכב אופניים רשום ומאפשרת להן ללמוד את הרגלי הרכיבה בעיר. הנתונים המועברים לרשויות מקומיות הם ללא נתוני זיהוי.
גוגל (Google) מאפשרת גישה באמצעות ממשק תכנות (API) לנתוני Google Maps ולשלב אותם ביישומי צד ג'. יבמ (IBM) מספקת ממשק תכנות למערכת הקוגניטיבית שלה, Watson הפועלת בענן, ומאפשרת למפתחי יישומים לנצל את העוצמה והחוכמה של Watson.
Cognitoys פיתחה צעצוע בצורת דינוזאור קטן וחמוד ובאמצעות ממשק התכנות ל-Watson מאפשרת לילדים ללחוץ על כפתור ולשאול שאלות בנושאים רבים ומגוונים. צעצוע שעלותו כ-150 דולר מאפשר גישה ומשתמש באחד מהכלים הרב-עוצמתיים ביותר הקיימים כיום.
כפי שניתן לראות מהדוגמאות הנ"ל, הנתונים הנאגרים על ידי הארגון הם לא רק נכס שנועד לשימוש פנימי אלא נכס שיכול להביא לתועלת רבה לארגונים אחרים. ארגונים יכולים לפתח ולמנף את הנתונים שהם אוגרים ומנהלים וליצור זרם חדש של הכנסות, כלומר להפוך את הנתונים לכסף (Monetizing the Data) ובמקרה של ארגונים ציבוריים להביא תועלת לציבור.
תגובות
(0)