עיבוד ידע

סינון וסיווג - איך עושים את זה נכון?

עיבוד ידע מורכב משני חלקים: סינון המידע ומיון וסיווג משפטי מפתח.

סינון המידע

לאחר איסוף הנתונים, השלב הקריטי הבא בעיבוד ידע הוא סינון. סינון מידע הוא התהליך הקריטי של זיקוק המידע לצורה הניתנת לעיבוד וגיבוש תובנות, ומאפשר למקבלי החלטות להתמקד בתובנות הרלוונטיות והחשובות ביותר תוך ביטול "רעשי רקע" והסחות.

שלב זה נועד לחדד ולחלץ תובנות יקרות ערך על ידי בחירה וארגון המידע הרלוונטי ביותר. סינון עוזר להפוך נתונים גולמיים למידע בר-פעולה, הניתן לעיבוד, גיבוש תובנות וקבלת החלטות.

מספר דברים לשים לב אליהם בעת הסינון

  • רלוונטיות: המידע המסונן צריך להיות מורכב מתוכן הנוגע ישירות לנושא או לסוגייה שעל הפרק, כדי להבטיח שאתם מתמקדים במה שחשוב ביותר.
    לדוגמה נשאלת שאלת שיתוף הציבור הבאה: כיצד לדעתך הקמת מרכז קהילתי חדש תשפיע על תחושת הקהילה והרווחה הכללית של השכונה שלנו? התשובה- "אני בעד לבנות שבילי אופניים בנוסף למרכז הקהילתי". התשובה אינה עונה על השאלה ובכך לא מספקת לנו מידע מהותי לעבוד אתו. שימו דגש על המהות של השאלה לכל אורכה, החל מהתמונה, דרך הרקע והמידע הנוסף.
  • מידע בלתי הולם: במידה ואתם משתמשים בנתונים הכוללים טקסט חופשי,המידע המסונן צריך להיות מורכב מתוכן הולם, הכולל שימוש בשפה נאותה ולא כולל מילים פוגעניות, גזעניות וכדומה.
    לדוגמה "השאלה צריכה להיות מופנית לראש העיר שלא ממלא את תפקידו כראוי ויש להחליפו בדחיפות".

מלכודות פוטנציאליות בעת הסינון:

  • סינון מוטה: סינון מידע המושפע מהטיות אישיות, דעות קבועות מראש או אינטרסים כאלו ואחרים, עלול להוביל לניתוח מוטה של המידע וגיבוש תובנות לא יעיל.
    לדוגמה - בתהליך שיתוף ציבור שמטרתו לקבל פידבק על התנהלות העירייה במהלך משבר הקורונה, מידע שלילי הדן בליקויים בניהול המשבר מסונן ונמחק בכדי לא לחשוף דעות שליליות כלפי ראש העיר.
    יש ליישם ולקבוע קריטריונים לסינון ולערב מספר בעלי עניין שונים בתהליך הסינון בכדי למזער הטיה. היזהרו מסינון יתר, סינון מוגזם או "אגרסיבי" מדי עלול לגרום להשמטת מידע חשוב ונקודות מבט שונות, ולהוביל לגיבוש תובנות חלקיו.
  • תת סינון: סינון מינימלי עלול לגרום לעומס מידע, מה שהופך את זה למאתגר לזהות תובנות קריטיות.
    מה ניתן לעשות? הערכת ושיפור מתמיד של קריטריוני סינון כדי להבטיח רלוונטיות מבלי להציף את העיבוד מידע בנתונים מיותרים.
  • סינון מידע סותר: סינון מידע שסותר את האמונות או הציפיות הרווחות והפופולריות יותר המתבטאות בנתונים שנאספו, יכול להפריע לניתוח אובייקטיבי וגיבוש תובנות הכוללות נקודות מבט שונות. בנוסף, פעולה זו עלולה למחוק רעיונות מקוריים עליהם לא חשבנו.
    לדוגמה תהליך שיתוף ציבור שמטרתו לקבל פידבק על התנהלות העירייה במהלך משבר הקורונה, תשובות שהן אינן "פופולריות" ואין מספר רב של תושבים שענו את אותה תשובה, נמחקות.
    מה ניתן לעשות? עודדו דיאלוג ואת השימוש במידע סותר ופחות "פופולרי" ונתונים סותרים, כדי לתמוך בקבלת החלטות אפקטיביות.
  • סינון ידני בלבד: הסתמכות על סינון ידני בלבד יכולה לגזול זמן יקר ונוטה לטעות אנוש.
    מה ניתן לעשות? תאמצו כלי אוטומציה ואלגוריתמים לסינון המידע , אך וודאו שהם מנוטרים באופן קבוע ומדוייקים.
    לדוגמה אימוץ כלים של בינה מלאכותית אשר עברו למידה של כיצד לסנן מידע ואיזה סוג מידע, כך שיסננו ויעירו תשומת לב על מידע שלא עונה לקריטריונים שציינו בשלב של איסוף נתונים.

מיון וסיווג באמצעות משפטי מפתח

עליכם לחקור ולבחון את המידע שאספתם על מנת לחפש דפוסים, מגמות והקשרים החוזרים על עצמם. כלומר, נתמקד בנתונים המעלים רעיונות וסוגיות שחוזרים על עצמם בנתונים נוספים, וכך נקבל תמונת מצב רחבה יותר ונגלה קבוצות של נתונים השמים דגש על סוגייה ורעיונות ספציפיים.

ראשית, עלינו לזהות משפטי מפתח:

  • קראו את התשובות וזהו ביטויי מפתח או מונחים המייצגים נושאים, רעיונות או סנטימנטים חשובים בתוך התשובה. ביטויים ומשפטים אלו צריכים לתפוס את המהות של מה שאנשים אומרים.
  • חפשו מילים, ביטויים ומשפטים שחוזרים על עצמם ומופיעים לעתים קרובות בתשובות וגם רעיונות חריגים שלא הופיעו עד כה.
  • במידה ומתאפשר, תשתמשו בכלים או בטכניקות בינה מלאכותית של עיבוד שפה טבעית (NLP) כדי לחלץ משפטי מפתח, ביטויים בצורה אוטומטית.

לדוגמה בשאלה "פתחנו עבורך את מזא"ה 9,בית הצעירים בתל אביב-יפו. עכשיו הזמן לקבוע מה יהיה בו. מה דעתך?" שנשאלה על ידי עיריית תל אביב-יפו ראינו מספר תשובות: