באינטרנט שוכב 6 29

ישנם שלושה דברים שאתה יכול להיות בטוח בהם בחיים: מוות, מסים - ושקר. נראה שהאחרון הוכח על ידי משאל העם בנושא הברקזיט האחרון בבריטניה, עם א מספר של עזבו את הקמפיין שעבודים מסתכלים יותר כמו פשטידות חזיר מאשר אמיתות מוצקות.

אבל מפרסום באינטרנט, בקשות ויזה ומאמרים אקדמיים וכלה בבלוגים פוליטיים, תביעות ביטוח ופרופילי היכרויות, ישנם אינספור מקומות בהם אנו יכולים לספר שקרים דיגיטליים. אז איך אפשר לאתר את הסיבים המקוונים האלה? ובכן, סטפן לודוויג מאוניברסיטת ווסטמינסטר, קו דה רויטר מבית הספר לעסקים של קאס, אוניברסיטת סיטי בלונדון, מייק פרידמן מהאוניברסיטה הקתולית בלובין, ושלך באמת פיתחו גלאי שקר דיגיטלי - והוא יכול לחשוף שלל של שטויות באינטרנט. .

במחקר החדש שלנו, השתמשנו ברמזים לשוניים כדי להשוות בין עשרות אלפי הודעות דוא"ל שזוהו מראש כשקרים לבין אלה שנודעו כראויות. ומההשוואה הזו, פיתחנו אלגוריתם אנליטי טקסט שיכול לזהות הטעיה. זה עובד בשלוש רמות.

1. שימוש במילה

חיפוש מילות מפתח יכול להיות גישה סבירה כאשר מתמודדים עם כמויות גדולות של נתונים דיגיטליים. אז, חשפנו לראשונה הבדלים בשימוש במילים בין שתי קבוצות המסמכים. הבדלים אלה מזהים טקסט שעלול להכיל שקר. גילינו שאנשים שמשקרים משתמשים בדרך כלל בפחות כינויים אישיים, כמו אני, אתה, והוא/היא, ועוד תארים, כגון מבריק, חסר פחד ונשגב. הם גם משתמשים בפחות כינויים יחידים מגוף ראשון, כמו אני, אני, שלי, עם מילות אי התאמה, כמו שאפשר, צריך, היו, כמו גם כינויים מגוף ראשון (אתה, שלך) עם מילות הישג (הרוויח, גיבור , לנצח).

פחות כינויים אישיים מצביעים על ניסיון של מחבר להתנתק מדבריו, בעוד ששימוש בתארים נוספים הוא ניסיון להסיח את הדעת מהשקר באמצעות מבול של תיאורים מיותרים. פחות כינויים יחידים מגוף ראשון בשילוב עם מילות אי התאמה מעידים על חוסר עדינות ודימוי עצמי חיובי, בעוד יותר כינויי גוף שני בשילוב מילות הישג מצביעים על ניסיון להתחנף לנמענים. לכן כללנו שילובים של מונחי חיפוש באלגוריתם שלנו.


גרפיקת מנוי פנימית


2. בדיקת מבנה

חלק אחר של הפתרון טמון בניתוח השונות של מילות התהליך הקוגניטיביות, כגון סיבה, כי, דע וצריך - וזיהינו קשר בין מילות מבנה לשקרים.

שקרנים אינם יכולים ליצור מיילים מטעים מהזיכרון האמיתי, כך שהם נמנעים מספונטניות להתחמק מגילוי. אין זה אומר ששקרנים משתמשים במילות תהליך קוגניטיביות יותר באופן כללי מאשר אנשים שאומרים את האמת, אך הם כוללים את המילים הללו באופן עקבי יותר. לדוגמה, הם נוטים לחבר כל משפט למשפט הבא - "אנו יודעים שזה קרה בגלל זה, כי זה אמור להיות כך". האלגוריתם שלנו מזהה שימוש כזה במילות תהליך בתקשורת.

3. גישת דואר אלקטרוני חוצה

למדנו גם את הדרכים בהן שולח הודעת דואר אלקטרוני משנה את סגנונו הלשוני תוך החלפת מספר מיילים עם מישהו אחר. חלק זה של המחקר גילה שככל שהחלופה נמשכה, ככל שהשולח נוטה יותר להשתמש במילות הפונקציה בהן המקלט משתמש.

מילות פונקציה הן מילים התורמות לתחביר, או למבנה, אלא למשמעות של משפט - למשל a, am, to. ושולחים שיפנו את הסגנון הלשוני של המסרים שלהם כך שיתאימו לזה של המקבל. כתוצאה מכך, האלגוריתם שלנו מזהה ואוסף התאמה כזו.

יישומים מרגשים

כלבי שמירה לצרכנים יכולים להשתמש בטכנולוגיה זו כדי להקצות ציון "אולי משקר" לפרסומות בעלות אופי מפוקפק. חברות אבטחה וכוחות גבול לאומיים יכולים להשתמש באלגוריתם להערכת מסמכים, כגון בקשות ויזה וכרטיסי נחיתה, כדי לפקח טוב יותר על עמידה בכללי ותקנות הגישה והכניסה. מזכירות וועדות בחינות להשכלה גבוהה ועורכי כתבי עת אקדמיים יכולים לשפר את כלי ההגהה שלהם לבדיקה אוטומטית של עבודות גמר של תלמידים ומאמרים אקדמיים לגניבה.

למעשה, היישומים הפוטנציאליים ממשיכים ונמשכים. בלוגים פוליטיים יכולים לפקח בהצלחה על האינטראקציות שלהם ברשתות החברתיות לאיתור חריגות טקסטואליות, בעוד שאתרי היכרויות וסקירות יכולים לסווג הודעות שנשלחו על ידי משתמשים על בסיס הציון ה"אולי משקר "שלהם. חברות הביטוח יכולות לנצל טוב יותר את הזמן והמשאבים הזמינים לביקורת תביעות. רואי חשבון, יועצי מס ומומחים לזיהוי פלילי יכולים לחקור דוחות כספיים ותביעות מס ולמצוא אקדחי עישון מטעים באמצעות האלגוריתם שלנו.

בני אדם גרועים להפליא בזיהוי הונאה באופן מודע. אכן, הדיוק האנושי בכל הנוגע לאיתור שקר הוא רק 54%, בקושי יותר טוב מהסיכוי. גלאי השקר הדיגיטלי שלנו בינתיים מדויק ב -70%. ניתן להפעיל אותו להילחם בהונאה בכל מקום שהוא מתרחש בתוכן ממוחשב וככל שהטכנולוגיה מתפתחת, האזהרות של פינוקיו יכולות להיות אוטומטיות לחלוטין ודיוקו יגדל עוד יותר. כפי שאפו של פינוקיו סימן רפלקסיבית לשקר, כך גלאי השקר הדיגיטלי שלנו. סיבים היזהרו.

על המחבר

שיחהטום ואן לאר, מרצה בכיר לשיווק, אוניברסיטת סיטי בלונדון

מאמר זה פורסם במקור ב שיחה. קרא את מאמר מקורי.

ספרים קשורים

at InnerSelf Market ואמזון