דבר איתי מחשב: השליטה הקולית ממריאה

אם חבילות לא צפויות מתחילות להופיע ליד דלתך, כדאי לך לדבר עם אחד המכשירים החכמים שלך.

מוקדם יותר החודש שאלה ילדה בת שש בדאלאס את משפחת משפחתה אקו אמזון רמקול חכם לבית בובות. ואלקסה, העוזרת המלאכותית הדומה לסירי של אמזון, מיד הזמין אחד לביתם.

תוכנית חדשות בטלוויזיה בסן דייגו קלטה את הסיפור, וחזרה עליו מבלי כשאחד ממגישי החדשות הגיב: "אני אוהב את הילדה הקטנה ואמר 'אלקסה הזמינו לי בית בובות'". לאחר ששמיעה זאת, עוד כמה מכשירי אמזון בבתים ברחבי סן דייגו ניסה לרכוש בתי בובות נוספים.

דיווח חדשות CW6 בסן דייגו על רכישת בית הבובות בשוגג של אלכסה.

{youtube}oI2KLIULjXc{/youtube}

הסיפור עשוי להישמע מוכר להחריד לכל מי שניסה לנהל שיחה עם סירי של אפל או עם קורטנה של מיקרוסופט. המכשירים שלנו הפכו די טובים להאזין לנו, אבל זה לא תמיד אומר שהם מבינים.

חוקרים במיקרוסופט ציינו זאת לאחרונה כבעיה פוטנציאלית בממשקי הדיבור של ימינו: הם משווקים כעוזרים "אינטליגנטים", עם בדיחות חכמות וידע עולמי, אך לעתים קרובות הם מתסכלים אותנו מחוסר השכל הישר שלהם.


גרפיקת מנוי פנימית


ב מחקר קטןהחוקרים מצאו כי האנשים שהמשיכו לדבר עם העוזרים הדיגיטליים שלהם לאורך זמן הם אלה שהתחילו עם הציפיות הנמוכות ביותר.

מה בעצם עושה ממשק קולי?

כשאתה מדבר לממשק קולי, הוא חייב:

  • "שמע" את צליל קולך, והבדיל אותו מרעש רקע
  • להבין היכן כל מילה מתחילה ונגמרת, תוך התעלמות מה"אומס "ומה"אהס" שלך
  • להתאים את הצליל של כל מילה למילה במילון, ולבחור את המילה הנכונה מהקשר אם יש הומופונים
  • לפרש נכון את משמעות המשפט כולו
  • צור תגובה משמעותית ושימושית התואמת את בקשתך.

כל אחת מהן היא אתגר טכני מורכב, וחברות טכנולוגיה שונות התקדמו בתחומים שונים.

Google Now טוב במתן תגובות רלוונטיות למגוון רחב של בקשות מכיוון שהוא נהנה ממגוון הנתונים של Google על האינטרנט ומהפעילות האישית שלך, אם אתה משתמש בשירותי Google.

אמזון אקו טובה במיוחד בשמיעת הבקשות שלכם ממרווח בחדר רועש, הודות למערך מיקרופונים רחוק-שדה מבטל רעשים. כמובן שזה גם טוב ברכישות דרך אמזון.

במהלך השנים האחרונות, ממשקי הקול הפכו להיות הרבה יותר טובים בהבנת דיבור יומיומי או "טבעי" ולא רק פקודות מעוותות ומנוסחות בקפידה. הם עדיין טובים יותר בטיפול בשאלות פשוטות, כמו "מי משחק באליפות אוסטרליה הפתוחה?", ונוטים להיאבק בבקשות מסובכות יותר, כמו "מי משחק השנה בפעם הראשונה באוסטרליה הפתוחה?" ומעקב. שאלות, כמו "יירד גשם במהלך הגמר?".

המצב מעורב עוד יותר בשפות שאינן אנגלית: בעוד שסירי תומכת ביותר מ -40 שפות וניבים, עד כה Alexa זמינה רק באנגלית ובגרמנית. אך כל התכונות הללו משתפרות בהתמדה.

היכן שממשקי הקול מגמגמים

כך ממשקי הקול ישתלטו בקרוב על כל הטכנולוגיה שלנו, כפי שנחזה בסרט ספריה? גרטנר, חברת מחקר טכנולוגית, יש תחזית שבשנה הבאה, 30% מהאינטראקציות שלנו עם הטכנולוגיה יהיו שיחות עם ממשקים מותאמים לקול.

אך לממשקי הקול יש מגבלות, ולא ניתן לפתור את כולם באמצעות טכנולוגיה טובה יותר.

קול הוא אמצעי מרכזי להתממשקות עם הטכנולוגיה בסרטו של ספייק ג'ונז.

{youtube}ne6p6MfLBxc{/youtube}

זיהום רעש הוא מכשול אחד מרכזי. האם המכשיר שלך יכול להבחין בין מה שאתה אומר לבין רעשי הרקע סביבך? הטכנולוגיה יכולה לעזור בזה, כולל הפחתת רעש, זיהוי קול מותאם אישית וקריאת שפתיים.

אבל מה עם רעשי הרקע שאתה יוצר לאחרים באמצעות שיחה עם המכשיר החכם שלך? תארו לעצמכם אדם שיושב לידכם במשרד - או במטוס - משוחח עם סירי בזמן שאתם מנסים לקרוא, ותוכלו להבין מדוע ממשקי קול לא תמיד מקובלים חברתית.

מערך נושאים נוסף נובע מהדרישות המנטליות של ממשקי הקול. לימוד השימוש במערכת מבוססת קול יכול להיות קשה, במיוחד אם אין מסך, כמו באמזון הד.

אם פנית פעם לבנק או לחברת טלפונים, אתה מכיר את השילוב העלוב של ריכוז ושעמום שמקורו בהאזנה לרשימת קולות מסונתזת הכוללת את כל האפשרויות שלך בזמן שאתה ממתין לאחת הדרושה לך ומנסה לא לערבב אותן לְמַעלָה. ממשקים גרפיים מסורתיים נמנעים מבעיה זו על ידי הצגת האפשרויות הזמינות ומאפשרים לך להקיש במהירות על בחירתך.

לאחר שלמדת פקודות קוליות, השימוש בהן עלול להסיח את הדעת. חוקרים מצאו כי פקודות קוליות הורד את מסלול החשיבה שלך יותר מעכבר ומקלדת.

הדבר מסוכן במיוחד עבור ממשקי קול ברכב: צמד מחקרים מאוניברסיטת יוטה מצאו כי נהגים כן מוסחת עד 27 שניות לאחר שימוש בפקודות קוליות.

אוניברסיטת יוטה / קרן AAA למחקר בטיחות התעבורה בנושא הסחת דעת של הנהג.

{vimeo}108281698{/vimeo}

מוצא את קולה?

כך שממשקים קוליים לא ישתלטו לגמרי, אך הם ימצאו נישות שימושיות בחיינו. הם כבר נפוצים במכוניות, שם הם בתקווה שיהפכו פחות מפריעים ככל שהטכנולוגיה תשתפר.

במטבח, אתה יכול לבקש מאלקסה שתדריך אותך במתכון או תעדכן את רשימת הקניות שלך כשהידיים שלך עסוקות בבישול. במציאות מדומה וריאלית, ממשקי קול יכולים לאפשר לך לשלוט במערכת כאשר אינך יכול לראות את ידיך כלל.

בלימוד שפה, ניתן להשתמש בהם לתרגול הגייה. והכי חשוב, ממשקי הקול עוזרים למשתמשים עם ליקויים מוטוריים, RSI או דיסלקציה להתגבר על המוגבלויות שלהם.

ממשקי קול הם טכנולוגיה המיוחלת, ויש סיבות טובות לחשוב שהגיע הזמן סוף סוף. רק זכור שאולי הם עדיין לא חכמים כמו שהם נשמעים. ואולי תרצה לשים קוד PIN על רכישות קוליות אם ילדים נמצאים בסביבה.

שיחה

על המחבר

פרייזר אליסון, מועמד לתואר שלישי באינטראקציה בין אדם למחשב, אוניברסיטת מלבורן

מאמר זה פורסם במקור ב שיחה. קרא את מאמר מקורי.

פריטים קשורים

{amazonWS:searchindex=KindleStore;keywords=AmazonEcho" target="_blank" rel="nofollow noopener">InnerSelf Market ואמזון