יום שלישי, 8 ביולי 2014

פסיכואינפורמטיקה - תמונת מצב 2012

להלן סיכום מאמרו היפהפה של ד"ר ירקוני מאוני' קולורדו מ2012 לגבי פסיכואינפורמטיקה כאופק חדש של שילוב מדעי חישוב ופסיכולוגיה. (הערותיי בסוגריים ובסוף).

  • פרוייקטים גדולים כמו מחקר הגנום נסמכים על טכנולוגיות מיצוי מידע כדי לאסוף כמויות גדולות של מידע, לנהל אותו במאגרים, ולעשות לו סינתיזה מדעית. תחת שדה האינפורמטיקה, ביואינפורמטיקה, אקואינפורמטיקה ונוירואינפורמטיקה הן כבר תתי-תחומים מחקריים מבוססים. עם זאת פסיכואינפורמטיקה לא מופיעה, לפחות לא לפי גוגל שכולר שנותן רק 18 מופעים של המילה (זאת כמובן כי אני כתבתי על פסיכואנליטיקס ולא על פסיכואינפורמטיקה בבלוג שלי, ולא כי זה רק בלוג). המאמר מציג את העשייה שכבר קיימת בתחום הפסיכואינפורמטיקה, גם אם לא מזוהה ככזו בשלב הנוכחי, ומציע להכיר רשמית בתחום מחקר זה. 
  • עד לאחרונה איסוף תצפיות לגבי משתתפים בניסויי מעבדה פסיכולוגיים נעשו פיזית במעבדה אוניברסיטאית, אולם בשנים האחרות, חוקרים רבים מגייסים מדגמי בדיקה גם דרך האינטרנט. כך מושג מדגם מגוון יותר (לא רק סטודנטים לפסיכולוגיה שמבצעים מטלה תמורת נקודות זכות או 10 ש"ח), גדול יותר, וזול יותר (כי אנשים משועממים פשוט ממלאים שאלונים). גם אם עדיין לא ניתן למדוד דברים מסויימים דרך האינטרנט בשלב זה, כמו זמן תגובה מדוייק לגירויים. ניתן לבנות שאלונים ברמה גבוהה דרך SurveyMonkey או Qualtrics ולגייס נבדקים בתשלום נמוך מאוד דרך Amazon’s Mechanical Turk.
הרצאונת של טד על שימוש יצירתי במכניקל טורק:

  • לרוב האוכלוסיה בעולם המערבי יש סמארטפונים, ובהם יש אפליקציות שעושות כל דבר. ישנם מחקרים פסיכולוגיים שעשו שימוש באפליקציות כדי למדוד התנהגויות כגון חלימה בהקיץ (Killingsworth and Gilbert,(2010, להעביר מטלות ברירת מילים (Dufau et al., 2011, lexical decision task), אפליקציה בשם EAR המאפשרת להקליט קטעוני קול באופן אוטומטי מאינטראקציות יומיומיות של משתתפי ניסוי (Mehl, Pennebaker, Crow, Dabbs, & Price, 2001). ונראה כי בעתיד איסוף מידע באמצעות מכשירים ניידים עומד להיות מרכזי במחקר פסיכולוגי (Miller, 2012). 
הנה איזה בלופרינט לאפליקציית יומן ניטור טקסים לOCD, בשם OCD Manager ששרטתי לפני שלוש שנים:


  • ניתן גם לכרות את המידע שבני אדם משתפים לגבי חייהם, בהתכתבויות מקוונות, בעדכוני מיקום GPS, בהעלאת תמונות, ובסרטים והמוזיקה שאנחנו בוחרים. מידע זה מאפיין אותנו וזמין לכרייה ועיבוד בחשבונות של רשתות חברתיות וכד' (צפצוף של מערכת האתיקה של הבלוג). לדוגמא נחקר הקשר בין הסנטימנט החיובי או השלילי של מיליוני אנשים שכתבו בטוויטר לפי יום השבוע (Golder & Macy, 2011), וירקוני (2010) בדק קשר בין שאלוני אישיות שחילק ל700 בלוגרים לבין בחירת המילים שלהם בבלוגים שניהלו בבלוגר. השימוש הזה בביג דאטה (big-data) היה בלתי אפשרי לפני עשור או שניים. לא מדובר רק במחקרים אנלוגיים (שיובאו מעולם האופליין לעולם האונליין), אלא גם למחקרים שנולדו בסביבה הזו (native) כגון שימוש במידע GPS או סנסורים של ביופידבק המחוברים לסמארטפון בבלוטות'. 
הנה לדוגמא סנסור מאוד מעניין, אסלה שבודקת את רמת ההורמונים בהפרשות, קטע יפני:
Japanese toilet sensors that transmit hormonal analysis to your PC
  • קנה המידה העצום של מחקרי ביג דאטה, מייתרים את ההנחות המחקריות המסורתיות של מחקרים סטטיסטיים במדעי החברה. זה כבר לא משנה אם אוכלוסיית המקור מתלפגת נורמלית, ואין צורך להקפיד על סולם מדידה בדרגת רווח). תוכנות מאפשרות לעבד ולהציג את המידע בצורה גמישה ביותר, לדוגמא התוכנה R לה יש תורמים עצמאיים רבים. 
  • ניתן למצוא כלים רלבנטיים בתחום הלמידה הממוכנת (machine learning), שמשמש כיום לקידוד מצבים מנטליים לפי מידע על פעילות מוחית (Pereira, Mitchell, & Botvinick, 2009). ניתן ליישם כלים אלו גם קלינית בסיווג של הפרעות נפשיות. באופן זה ניתן להתגבר על overfitting, בעיה נפוצה של התאמת המודל הסטטיסטי לאפקט ולטעות בבת אחת (יעני מפריד את הרעש כפקטור נפרד). מידול של הסימפטומים בDSM-IV-TR באופן ממוכן הראה שלמרות ההנחה שהסימפטומים נפרדים זה מזה (דיסקרטיים), הרי שרוב הסימפטומים קשורים זה לזה דרך סימפטומים שכיחים במיוחד המרכזים את רוב ההפרעות הנפשיות  (Borsboom, Cramer, Schmittmann, Epskamp, & Waldorp, 2011) (ובניסוח המקורי: a small-world network structure in which the majority of nodes are connected to each other through a small proportion of highly connected hubs). וירקוני ושות' (2008) פיתחו כלי למדידת המרחק/דימיון הוויזואלי בין המראה של מילים. ירקוני (2010) פיתח גם כלי אוטומטי לקיצור שאלונים על ידי אלגוריתם "אבולוציוני" פרוגרסיבי (שמתאים את עצמו לתשובות שכבר ניתנו ולשאלות שעולות מהן). הנקודה העיקרית היא שאין צורך בפיתוח טכנולוגי חדש, אלא רק בנכונות ליישום אינטרדיסציפלינרי של טכנולוגיות מוכרות ומבוססות מתחומי מחקר אחרים. 
הנה תמונה שאיכשהו מסבירה משהו על מבנה small-world:
  • חלק ניכר מהמחקר בתחומי אינפורמטיקה אחרים עוסק באיסוף מידע בקנה מידה ענק, ובהבניית הגישה אליו. גם בפסיכולוגיה יש דוגמאות למגה-מחקרים (Balota, Yap, Hutchison, & Cortese, 2012). לדוגמא באתר YourMorals.Org, פלטפורמת איסוף מידע בנושא פסיכולוגיה של המוסר שאספה תשובות לשאלונים מיותר מ200 אלף משתתפים. (אנשים אוהבים quizes, ומבחנים פסיכולוגיים.. בייחוד אם הם מקבלים מעט משוב בסוף.. זה כלי משיכה מוכר בפרסום באינטרנט). דאטה זה זמין באופן חסר תקדים למחקר פסיכולוגי בנושא. כמו כן יש בסיסי מידע שזמינים להורדה ממאגרי מידע שקשורים בפסיכולוגיה, כמו מאגר המידע של מדעי החברה בהרווארד, או מאגר מידע של מחקרי fMRI
  • כדי להנות מהמידע הזמין להם, פסיכולוגים יצטרכו לפתח אונטולוגיות ברורות ומקיפות של קונסטרוקטים פסיכולוגיים, לפיהם ניתן לארגן את המידע בארכיונים ולשלוף אותו. כך לדוגמא פרויקט האטלס הקוגניטיבי  מנסה כבר בסיס ידע קולבורטיבי של המטלות הקוגנטיביות והקונספטים שהן בודקות, כדי לאפשר איסוף וארגון חכם יותר מידע מחקרי.  אונטולוגיה מסוכמת של כלל מדעי הפסיכולוגיה עוד רחוקה, אך גם כאלו חלקיות יכולות להיות מאוד שימושיות בארגון והפצה של מידע כבסיס לעבודה קולבורטיבית.
  • בלי קשר לאופן בו המידע נאסף ומאורגן, הסינתיזה של המידע גם יכולה להרוויח מכלי מיצוי מידע קיימים, גם אם לדאטה הפסיכולוגי אופי בלתי מובנה. ירקוני ושות' (2010) יצרו כלי אוטומטי שלוקח מושג המתאר מצב מנטלי, כמו כאב, סורק מאמרים בתחום הנוירופסיכולוגיה שהתייחסו אליו, מוצא בהם התייחסויות לאיזורים במוח שהופעלו בקשר לכאב, ומייצר מטה-אנליזה של איזורים הפעילים במוח לפי סריקות fMRI בהקשר של כאב. (נשמע שלא שונה בהרבה השימוש ההפוך בכלי זה: כדי להבין איזה מצב מנטלי הfMRI הנתון של פציינט מבטא). 
  • אבל פריצת הדרך הגדולה באמת היא הצעה של היפותיזות חדשות. כלומר, במקום לבדוק היפותיזות על דאטה רב (שמקל למצוא אפקט), הרי שניתן למצוא קשרים שלא יכולנו לדמיין בעבר, ועולים מהדאטה (data-driven). אם מאשימים פסיכולוגים בconfirmatory bias, הרי שעתה ניתן להשתחרר מההיפותיזות המקובלות (ולעבור לfishing). מחקר מסוג זה נעשה על ידי brainSCANr, בו חיפוש טקסטואלי (במאמרים) משמש כדי לזהות קשרים בלתי צפויים בין מושגים נוירוביולוגיים  (Voytek & Voytek, 2012).
  • האתגר החדש שיעלה מול כלים אקספלורטיביים מסוג זה, הוא הצורך לתקן אלפי קורלציות סטטיסיסטיות מקבילות, ושאלות אתיות לגבי השימוש במידע מרשתות חברתיות של משתמשים שלא הסכימו במפורש להשתתף במחקר. הפוטנציאל החיובי הוא בזיהוי אפקטים קאונטר-אינטואיטיביים, שלא ניתן לזהות בשיטה המדעית המבוססת על הפרכת היפותיזות. כך לדוגמא ממצא בלתי מוסבר, לפיו לג'ינג'ים סיבולת כאב שונה מהאוכלוסיה הכללית, שהוביל למחקר בנושא כאב והגן האחראי על ייצור מלטונין (Mogil et al., 2005). 

  • פרוצדורות מחקר בפסיכולוגיה מקבלות ביקורת על אי יכולת לשחזר ניסויים, סטנדרטים רופפים לאיסוף ודיווח על מידע, וחוסר מהימנות בביקורת הדדית על ידי עמיתים. לכן יש צורך בפלטפורמה שתאפשר את הביקורת המחקרית. ניתן לפתח פלטפורמת סינון קולבורטיבית לסקירה של מאמרים לאחר פירסומם (כמו דירוג תשובות בquora). כמו כן ניתן לאגור מידע ממחקרים בהם אין אפקט, שלא פורסמו (הו!!! שינוי פני המדע!!!) כמו  האתר  PsychFileDrawer המתעד ניסיונות רפליקציה של מחקרים. כך ניתן גם לפתח כלים מטה-סטטיסטיים למדידת מהימנות של מחקר או חוקר, כמו יותר מדי תוצאות מובהקות ( cherry picking), או לייצר מערכות רקומנדר להפניות הרלבנטיות לחוקר או למחקר. 
  • יש גם עיסוק בשיפור התקשורת בין פסיכולוגים, ובינם לבין הציבור. הAPA קרא לפסיכולוגים לסייע בשיוף ודיוק של הערכים הפסיכולוגיים בוויקיפדיה, מתוך הכרה בחשיבות המידע העובר לציבור. ישנם גם אתרים קולגיאיליים המאפשרים שיתוף מחקרי כגון ResearchGATE, ו-Mendeley.
  • ירקוני מסכם כי ההתקדמות הגדולה ביותר היא מתודלוגית ולא תיאורטית, וכי הטכנולוגיה מאפשרת התקדמות מתודולוגית ענקית בפסיכולוגיה כעת. הוא קורא לייסוד הפסיכואינפורמטיקה כתחום מחקר הזוכה לתמיכה ממסדית. הוא קורא לעבור מSPSS השייך לIBM, לתוכנות שיתופיות כגון R. הוא קורא לפסיכולוגים ללמוד כישורים חישוביים. הוא מציע לפסיכולוגים עם כישורים טכניים לחפש מימון לעבודה בתחום זה בלשכת הcyberinfrastructure של הNSF, או בפייסבוק וטוויטר (אוי ואבוי). לדידו, התפתחות התחום תלוי ביצירת תוכניות דוקטורט המאפשרות למידה פסיכולוגית וחישובית (אינפורמטיקה/מדעי המחשב). תוכניות אלו יצטרכו להרחיב את ההכשרה המחקרית מסטטיסטיקה ותכנון מחקר, לתכנות, איסוף מידע מקוון, machine learning, ואנליטיקס של מידע בקנה מידה רחב. זאת כדי להרחיב את היכולת לסקור מידע רב ולצמצם את הסיכוי להטייה אנושית, וכדי למצוא דרכים חדשות להפיץ את הידע לקהילה המחקרית ולציבור. אם משווים לדיבידנדים שהגיעו מהשקעה בביואינפורמטיקה ונוירואינפורמטיקה הוא רואה פוטנציאל רב להשקעה בכיוון צמיחה זה. 
הערותיי:

  • המאמר הזה יפהפה בעיניי כי הוא סוקר מצב קיים מפרספקטיבה עתידית, של היעד אליו הוא שואף להגיע. הוא גם נוגע בקצה ההתפתחות בכל תחום, ומעודד את הכיוון אליו יש להתפתח.
  • המאמר אינו מפרט לגבי יישומים קליניים, שהם עיקר ענייני. הכותב מגיע מעולם המחקר של מדעי המוח הקוגניטיביים, ולכן עיקר עניינו במחקר. המשפט היחידי שמתאר יישומים קליניים נוגע לסיווג סימפטומים להפרעות, יעני בסיוע בקיטלוג ואבחון של אנשים. זה לא מה שאני חשבתי בדיוק. היות ואני מגיע מעולם הטיפול והפסיכואנליזה, אותי מעניין יותר הפן האינטראקציוני שבו תוך כדי טיפול במטופל מסויים המטפל לומד על האפקטים של ההתערבויות שלו, ומקבל המלצות פרוגרסיביות לגבי התערבווית שפעלו עם האוכלוסיה הספציפית ביותר אליה שייך המטופל. לדוגמא, ברגע מסויים הקטגוריה הדומיננטית לניבוי יכולה להיות האבחנה, אבל ברגע אחר פקטור אחר כמו מספר הפגישה או זמן ההמתנה או הטון של המטופל בפגישה יכול להיות יותר משמעותי לניבוי ההתערבות האפקטיבית הבאה. זהו מעבר ממבט קטגורי למבט פרטיקולרי על המטופל וריבוי הקורלציות שלו עם קבוצות מטופלים אחרות. 
  • אני מוצא בכלים מסוג זה המקפצה הגדולה ביותר שיכולה להיות לטיפול כעת. כלים מסוג זה יכולים להפוך את הדיון העדכני לגבי עדיפות שיטות מבוססות מחקר סטטיסטי על פני שיטות המבוססות על תיאוריות אינטואיטיביות למגוחכים. ריבוי המדדים והיכולת להתייחס למקרה הנוכחי באופן מתמשך (אונליין במובן המתהווה ולא דרך האינטרנט דווקא), בנויים בדיוק לניואנסים האנושיים הדקים, והאופי הדיאלקטי של הטיפול הדינאמי.





אין תגובות:

פרסום תגובה