מאמרים

הדרך הקלה לBig Data

עם הגידול בכמויות המידע כיום, גם איסוף ועיבוד המידע מערוצים חיצוניים כדוגמת רשתות חברתיות הופך למשמעותי ביותר. עם זאת במרבית הארגונים הפלטפורמות הקיימות לנושא זה אינן מספיקות. איזה מענה יוכל לאפשר פתרון פשוט, מהיר ואיכותי לנושא?

אסף שפר, מנהל לקוחות אסטרטגיים, תחום אינפורמטיקה, קבוצת אמן

Big Data הוא כינוי שניתן למגמה של הצטברות של כמויות ענק של מידע בארגון, שרובו הגדול בלתי מובנה. מעבר לבעיות האחסון של מידע זה, מדובר על מידע עסקי, משאב יקר ערך הקיים בארגון ואינו מנוצל, עקב הקושי הפרקטי לסנן, למיין, לקטלג ולארגן ובעיקר, לנתח ולהפיק ממנו תובנות בעלות ערך לקידום הארגון. הגדרה נוספת של Big Data מסתכלת על ההשפעה ההדדית שיש להעברה, לאינטראקציה ולעיבוד כמויות גדולות של מידע. לפי אינפורמטיקה, מדובר בהעברת כמויות הולכות וגדלות של מידע בארגון, התפוצצות מידע אינטראקטיבי המגיע מרשתות חברתיות (פייסבוק, לינקדאין, טוויטר) ועיבודו.
אם ניקח, לדוגמא, ארגון גדול שעד היום אסף בעיקר מידע ממערכותיו הפנימיות בעוד גוף ה-BI סיפק את החיתוכים, התובנות והדוחות הנדרשים, כיום אותו ארגון נדרש להפיק הרבה יותר מאותו מידע וכן לאסוף מידע זמין נוסף על מנת לקבל את ערך מוסף הנדרש בצד העסקי. כך למשל אותו ארגון יוכל לדעת הרבה יותר ובאופן ממוקד יותר על נושאים שונים כגון: מכירות, שיווק, שירות ועוד. קיימות אין ספור דוגמאות לשימוש ב-Big Data לשיפור רווחיות ושירות בארגונים. למשל, רשת גדולה של חנויות אשר מנתחת את תפוסת החניונים שלה לשם הגברה או הפחתה של קופאיות. דוגמא אחרת הנה שימוש של חברת אנרגיה בנתונים שהיא אוספת ממכונות (Machine Data) לשם בחינה של עומסים ותקלות בזמנים שונים.
במקביל, עם הגידול בכמויות המידע, גם איסוף ועיבוד מידע מערוצים חיצוניים כדוגמת רשתות חברתיות הופך למשמעותי ביותר עבור ארגונים. למשל, בנק אשר לקוחותיו הצטרפו לדף הפייסבוק שלו, יכול לראות היכן הלקוחות עובדים ולהציע להם מבצעים ייחודיים. לקוח ש"צייץ" בחשבון הטוויטר שלו על תקלה במכשיר כספומט קרוב לביתו יידע את הבנק שיוכל לטפל בבעיה ואף להגיב ישירות על מנת למנוע מהפרסום השלילי שלו להתעצם ברשתות החברתיות.
על פניו, הקונספט של Big Data משרת את כולם באופן חיובי, אך בפועל ארגונים לא מודעים למשמעויות, בעיקר הטכניות של הדברים. רוב הארגונים וחברות ה-Big Data מתרכזות בשני רבדים בלבד. הראשון הוא תוצאות ניתוח המידע והשני הוא איסוף המידע (בפתרונות כגון Hadoop). ארגונים רבים שוכחים כי החלק המרכזי והחשוב ביותר בפרויקטי Big Data הוא למעשה הרובד "האמצעי", כלומר החלק המאפשר את איסוף המידע, ניהולו וכן תחזוקתו לאורך זמן כדי לאפשר את הפקת הערך המוסף ממנו. כך למשל, בנק גדול אשר הקים מערך על בסיס Hadoop וגייס 3 מפתחי JAVA יקרים אשר מכירים ויודעים לעבוד בסביבה זו, מצא עצמו לאחר שנת עבודה שלמה על הפרויקט כשכל התקציב, אשר הוקצה בראשית הפרויקט עבור מתן דוחות וניתוחי מידע החכמים, מוקצה בסופו של דבר לתחזוקה הפעילות הטכנית ולעמידה בקצב העדכונים של רכיבי ה-Hadoop (שכאמור מורכב מהרבה מאוד "חלקים" ב-Open Source), בעוד צוות הפרויקט גדל כבר ליותר מ-10 אנשים.
אינפורמטיקה זיהתה בעיה זו עוד בראשיתה ופיתחה מענה אשר יאפשר פתרון פשוט, מהיר ואיכותי לנושא. החברה פיתחה גרסת Big data Edition למנוע ה-Power Center הוותיק והאיכותי שלה, כך שהיום ניתן לעבוד בסביבת העבודה המוכרת של אינפורמטיקה על Hadoop. למעשה, דרך עבודה חכמה זו מאפשרת עבודה בממשקי GUI פשוטים ומוכרים באופן שקוף על Hadoop היות ואינפורמטיקה מחוללת את הקוד מאחורי הקלעים. בנוסף להורדת התלות בפיתוח קשה ויקר התווספו גם קונקטורים לעולמות התוכן הרלוונטיים כגון רשתות חברתיות, DB-ים של NO SQL ואף מימוש יכולות של כלי אינפורמטיקה נוספים כגון טיוב נתונים על Hadoop שהפכה לאקוטית באיסוף המידע הרב, עקב ריבוי אנומליות וכפילויות של מידע. המסקנה המתבקשת היא שאם לא יתבצע טיפול באיכות הנתונים בפרוייקטי Big Data, הרי שיהיה מאוד קשה בסופו של דבר לייצר תובנות על בסיס הנתונים.
תרשים תפיסת הפתרון של אינפורמטיקה:
סקר עולמי שנערך לאחרונה מצא כי יותר משני שליש מהחברות הגדולות בעולם רואות במגמת ה-Big Data כהזדמנות עסקית ממעלה ראשונה, יותר מאשר אתגר טכנולוגי למחלקת ה-IT. ארגונים אלה שוקלים, מתכננים, או כבר מבצעים פרויקטים בתחום זה. הגיע השעה שגם ארגונים בארץ ישקלו זאת בכובד ראש לשיפור פעילותם העסקית.
אם כן, לסיכום, אין ספק שאנו על סף מהפכת המידע הבאה (Internet of things) וארגונים ש'יאחרו את הרכבת' ולא ידעו כיצד להתמודד טכנית ועסקית עם מהפכת המידע הזו, יאבדו מהר מאוד את היתרונות התחרותיים שלהם. בשונה מאשר בתחומים אחרים, דווקא כאן, ארגונים אשר יאמצו מהר את פתרו



לפרטים נוספים