לקראת אירוע | מהי איכות נתונים וכיצד משיגים אותה?
מאת לרום בר, יועץ טכני בכיר בתחום אינפורמטיקה, קבוצת אמן
נתונים ומידע נחשבים באיכות גבוהה אם הם מייצגים ומשקפים נאמנה את המבנה של "העולם האמיתי" אליו הם מתייחסים. איכות נתונים (Data Quality) מהווה פרמטר קריטי ביכולותיו של ארגון לנתח את פעילויותיו השונות ועל בסיס ניתוח זה לקבל החלטות עסקיות נכונות ומדויקות ככל האפשר. עם העליה בכמות ובנפח הנתונים אשר נאגרים בארגונים השונים, בעיקר בתחום קשרי הלקוחות ותחום הנתונים הפיננסיים, אשר כפופים לרגולציות רבות וכן בתחום הבינה העסקית, איכות הנתונים הופכת לבעלת חשיבות עליונה עבור כל ארגון. טיוב נתונים מתייחס לזיהוי של חלקי נתונים שאינם שלמים או מדויקים, נתונים שגויים או לחלופין נתונים שאינם רלוונטים. לאחר הזיהוי של הנתונים יחל בבסיס הנתונים תהליך של השבחת נתונים הכולל תהליכים של שינוי, החלפה, איחוד או מחיקה של נתונים.
לאינפורמטיקה כלי יעיל לטיוב נתונים (Data Quality) אשר משתלב באופן אחוד עם פתרונותיה השונים כגון MDM ואינטרגציית נתונים.
טיוב הנתונים מחולק לארבעה שלבים:
Profiling Data – אפיון וניתוח הנתונים, הבנה וקטלוג הנתונים: האם השדה מכיל ערך בוליאני, תאריך, טקסט, מספר וכו'
Data Cleansing – "ניקיון" הנתונים האגורים בבסיסי הנתונים: טעויות הקלדה, מילים נרדפות, קיצורים וכו'
Data Matching – התאמה בין מספר ישויות דומות אך לא זהות כמו "יוסי" ו" יוסף".
Data Enrichment – תהליך בו נתונים במקורות שונים אינם זהים, לדוגמה כתובת הלקוח קיימת במערכת ה- CRM אך אינה קיימת במערכת ה-ERP. אינפורמטיקה מאפשרת להשלים את הנתון במערכת בה חסרים אותם נתונים חשובים.
התוצרים המתקבלים מטיוב נתונים מספקים ללקוח שיפור משמעותי של היעילות והאיכות של מערכות המידע, בסיס נתונים איכותי יותר, צמצום טעויות הנובעות מנתונים שאינם מדויקים וכן תחזוקה משופרת ופשוטה יותר לבסיס הנתונים. פרויקט הטיוב למערכות השונות בארגון עשוי להיות קצר או ארוך טווח ומצריך הבנה עסקית כוללת ומיומנויות תפעוליות. חברת אינפורמטיקה מספקת ניסיון מגוון ועשיר במתן פתרונות כוללים למערכות וארגונים שונים תוך שימוש בכלים טכנולוגים חדשניים, יעילים ובעלי התממשקות גבוהה.
הסבות נתונים – מקור נוסף לבעיות הנתונים הינו במקרה של הסבות נתונים למערכות חדשות או במקרים של מיזוגים ורכישות. לקבוצת אמן מתודולוגיה סדורה של טיפול בנתונים. על פי רוב לא יעשו התיקונים במערכת המקור אלא בעיקר במערכות היעד. כך המערכת החדשה תוכל ליהנות ממהימנות רבה יותר של הנתונים, תוך כדי מזעור הנזקים הפיננסים, התדמיתיים והרגולטוריים בארגון.