כיצד טוויטר נותן למדענים חלון לאושר ובריאות האדם

מאז השקתו הציבורית לפני 10 שנים, שימשה טוויטר כפלטפורמת רשת חברתית בקרב חברים, שירות מסרים מיידיים למשתמשי סמארטפונים וכלי קידום מכירות לתאגידים ופוליטיקאים.

אך זה היה גם מקור נתונים יקר ערך לחוקרים ומדענים - כמוני - שרוצים ללמוד כיצד בני האדם מרגישים ומתפקדים בתוך מערכות חברתיות מורכבות.

על ידי ניתוח ציוצים הצלחנו להתבונן ולאסוף נתונים על האינטראקציות החברתיות של מיליוני אנשים "בטבע", מחוץ לניסויים במעבדה מבוקרת.

זה אפשר לנו לפתח כלים לניטור ה- רגשות קולקטיביים של אוכלוסיות גדולות, למצוא את ה המקומות הכי שמחים בארצות הברית ועוד הרבה יותר.

אז איך, בדיוק, הפכה טוויטר למקור ייחודי כל כך עבור מדעני החברה החישוביים? ומה זה איפשר לנו לגלות?


גרפיקת מנוי פנימית


המתנה הגדולה ביותר של טוויטר לחוקרים

ב- 15 ביולי 2006, טוויטר (כפי שהיה ידוע אז) בפומבי הושק כ"שירות סלולרי המסייע לקבוצות חברים להקפיץ מחשבות אקראיות באמצעות SMS. " היכולת לשלוח טקסטים קבוצתיים בני 140 תווים בחינם גרמה למאמצים מוקדמים רבים (כולל אותי) להשתמש בפלטפורמה.

עם הזמן, מספר המשתמשים התפוצץ: מ -20 מיליון בשנת 2009 ל -200 מיליון בשנת 2012 ו -310 מיליון כיום. במקום לתקשר ישירות עם חברים, המשתמשים פשוט היו מספרים לעוקבים שלהם איך הם מרגישים, מגיבים לחדשות בצורה חיובית או שלילית, או מפצחים בדיחות.

עבור החוקרים, המתנה הגדולה ביותר של טוויטר הייתה אספקת כמויות גדולות של נתונים פתוחים. טוויטר הייתה אחת הרשתות החברתיות הגדולות הראשונות שסיפקו דוגמאות נתונים דרך משהו שנקרא ממשקי תכנות יישומים (API), המאפשרים לחוקרים לבצע שאילתות על טוויטר עבור סוגים ספציפיים של ציוצים (למשל ציוצים המכילים מילים מסוימות), כמו גם מידע על משתמשים .

זה הביא לפיצוץ של פרויקטים מחקריים המנצלים נתונים אלה. כיום, חיפוש Google Scholar אחר "טוויטר" מייצר שישה מיליון כניסות, לעומת חמישה מיליון עבור "פייסבוק". ההבדל בולט במיוחד בהתחשב בכך שיש בפייסבוק בערך פי חמישה משתמשים מאשר טוויטר (והוא מבוגר בשנתיים).

מדיניות הנתונים הנדיבה של טוויטר הביאה ללא ספק לפרסום חופשי מצוין של החברה, מכיוון שמדי המיינסטרים הוסיפו מחקרים מדעיים מעניינים.

לימוד אושר ובריאות

עם נתוני מפקד אוכלוסין מסורתיים איטים ויקרים לאיסוף, יש לעדכוני נתונים פתוחים כמו טוויטר לספק חלון בזמן אמת כדי לראות שינויים באוכלוסיות גדולות.

אוניברסיטת ורמונט מעבדת סיפור חישובית נוסדה בשנת 2006 ולומדת בעיות במתמטיקה שימושית, סוציולוגיה ופיזיקה. מאז 2008, מעבדת הסטורי אספה מיליארדי ציוצים באמצעות עדכון "Gardenhose" של טוויטר, ממשק API שמזרם מדגם אקראי של 10 אחוז מכל הציוצים הציבוריים בזמן אמת.

ביליתי שלוש שנים במעבדת הסיפור החישובי והייתי בר מזל להיות חלק ממחקרים מעניינים רבים המשתמשים בנתונים אלה. לדוגמא, פיתחנו א הדונומטר שמודד את האושר של הטוויטרספירה בזמן אמת. על ידי התמקדות בציוצים ממוקמים גיאוגרפיים שנשלחו מסמארטפונים הצלחנו מַפָּה המקומות המאושרים בארצות הברית. אולי באופן לא מפתיע, מצאנו הוואי להיות המדינה הכי מאושרת ונאפה שמגדלת יין היא העיר הכי מאושרת ל2013. 

מפה של 13 מיליון ציוצים אמריקאים ממוקמת גיאוגרפית משנת 2013, צבעוני אושר, עם אדום המעיד על אושר וכחול מעיד על עצב. PLOS ONE, סיפק המחברמפה של 13 מיליון ציוצים אמריקאים מאורגנים משנת 2013, צבעוניים באושר, עם אדום שמצביע על אושר וכחול מציין עצב. PLoS ONE, סופק המחבר.למחקרים אלה היו יישומים עמוקים יותר: מתאם השימוש בין מילים בטוויטר לדמוגרפיה עזר לנו להבין את הדפוסים הסוציו-אקונומיים הבסיסיים בערים. לדוגמה, נוכל לקשר בין שימוש במילים לבין גורמים בריאותיים כמו השמנת יתר, ולכן בנינו מד לקסיקוקליטר למדוד את "התוכן הקלורי" של הודעות ברשתות החברתיות. ציוצים מאזור מסוים שהזכירו מאכלים עתירי קלוריות הגדילו את "התוכן הקלורי" של אותו אזור, ואילו ציוצים שהזכירו פעילות גופנית הורידו את המדד שלנו. מצאנו כי המדד הפשוט הזה מתואם עם מדדי בריאות ורווחה אחרים. במילים אחרות, ציוצים הצליחו לתת לנו תמונת מצב, ברגע זמן מסוים, של הבריאות הכללית של עיר או אזור.

באמצעות העושר של נתוני טוויטר הצלחנו גם לעשות זאת לראות את דפוסי התנועה היומיומיים של אנשים בפרטים חסרי תקדים. הבנת דפוסי הניידות האנושיים, מצידם, יכולה לשנות את הדוגמנות למחלות, ולפתוח את התחום החדש של אפידמיולוגיה דיגיטלית.

למחקרים אחרים בדקנו האם מטיילים מביעים אושר גדול יותר בטוויטר מאשר אלו שנשארים בבית (תשובה: כן) ואם אנשים מאושרים נוטים להישאר יחד ברשת חברתית (שוב, הם כן). אכן, נראה כי חיוביות אפויה בשפה עצמה, במובן שיש לנו יותר מילים חיוביות מאשר מילים שליליות. זה לא היה המקרה רק בטוויטר אלא במגוון מדיות שונות (למשל ספרים, סרטים ועיתונים) ושפות.

מחקרים אלה - ואלפי אחרים כמוהם מרחבי העולם - היו אפשריים רק בזכות טוויטר.

עשר השנים הבאות

אז מה צפוי לנו ללמוד מטוויטר במהלך עשר השנים הבאות?

חלק מהעבודות המרגשות ביותר כרוכות בחיבור נתוני מדיה חברתית עם מודלים מתמטיים כדי לחזות תופעות ברמת האוכלוסייה כמו התפרצויות מחלות. החוקרים כבר זכו להצלחה מסוימת בהגדלת מודלים של מחלות עם נתוני טוויטר לחיזוי שפעת, בעיקר FluOutlook פלטפורמה שפותחה על ידי אוניברסיטת נורת'איסטרן והמכון למחלף מדעי.

ובכל זאת, מספר אתגרים נותרו. נתוני המדיה החברתית סובלים מ"יחס אות לרעש "נמוך מאוד. במילים אחרות, הציוצים הרלוונטיים למחקר מסוים נבלעים לעתים קרובות על ידי "רעש" לא רלוונטי.

לכן, עלינו להיות מודעים ללא הרף למה שכונה "היבריס נתונים גדולים"כשמפתחים שיטות חדשות ולא להיות בטוחים יתר על המידה בתוצאות שלנו. הקשורה לכך צריכה להיות המטרה לייצר חיזוי "קופסת זכוכית" מפרשים מנתונים אלה (בניגוד לתחזיות "קופסה שחורה", בה האלגוריתם מוסתר או לא ברור).

נתוני מדיה חברתית נמתחים לעתים קרובות (הוגן) על היותם קטנים מדגם לא מייצג של האוכלוסייה הרחבה יותר. אחד האתגרים העיקריים של החוקרים הוא להבין כיצד להסביר נתונים מוטים כאלה במודלים סטטיסטיים. בזמן יותר אנשים משתמשים מדיה חברתית מדי שנה, עלינו להמשיך ולנסות להבין את ההטיות בנתונים אלה. לדוגמא, הנתונים עדיין נוטים לייצג יתר על המידה אנשים צעירים יותר על חשבון אוכלוסיות מבוגרות.

רק לאחר פיתוח שיטות תיקון הטיה טובות יותר, יוכלו החוקרים לחזות בטוויטים ביטחון מלא.

על המחבר

לואיס מיטשל, מרצה למתמטיקה שימושית, אוניברסיטת אדלייד

מאמר זה פורסם במקור ב שיחה. קרא את מאמר מקורי.

ספרים קשורים

at InnerSelf Market ואמזון