Shutterstock/Valentyn640

ב-1956, במהלך טיול בן שנה בלונדון ובשנות ה-20 המוקדמות לחייו, ביקר המתמטיקאי והביולוג התיאורטי ג'ק ד' קאוואן את ווילפרד טיילור ואת "החדש המוזר שלו"מכונת למידה". עם הגעתו הוא היה מבולבל מ"בנק המכשירים העצום" שעמד מולו. קואן יכול היה רק ​​לעמוד מנגד ולראות את "המכונה עושה את שלה". הדבר שנראה שהוא עושה היה ביצוע "סכימת זיכרון אסוציאטיבית" - נראה היה שהוא מסוגל ללמוד כיצד למצוא קשרים ולאחזר נתונים.

זה אולי נראה כמו בלוקים מגושם של מעגלים, המולחמים יחד ביד במסה של חוטים ותיבות, אבל מה שקוואן היה עד לו היה צורה אנלוגית מוקדמת של רשת עצבית - מבשר לבינה המלאכותית המתקדמת ביותר של ימינו, כולל נדון רבות ChatGPT עם היכולת שלו לייצר תוכן כתוב בתגובה כמעט לכל פקודה. הטכנולוגיה הבסיסית של ChatGPT היא רשת עצבית.

כשקואן וטיילור עמדו וצפו במכונה עובדת, לא היה להם ממש מושג איך היא מצליחה לבצע את המשימה הזו. את התשובה למוח מכונת המסתורין של טיילור אפשר למצוא איפשהו ב"נוירונים האנלוגיים" שלו, באסוציאציות שנוצרו על ידי זיכרון המכונה שלו, והכי חשוב, בעובדה שלא ניתן היה להסביר במלואו את התפקוד האוטומטי שלו. יעברו עשרות שנים עד שהמערכות הללו ימצאו את ייעודן וכדי שהכוח הזה ייפתח.

המונח רשת עצבית משלב מגוון רחב של מערכות, אך באופן מרכזי, על פי IBM, "רשתות עצביות אלו - הידועות גם כרשתות עצביות מלאכותיות (ANNs) או רשתות עצביות מדומה (SNNs) - הן תת-קבוצה של למידת מכונה והן בלב אלגוריתמי למידה עמוקה". באופן מכריע, המונח עצמו וצורתם ו"מבנהם נוצרים בהשראת המוח האנושי, מחקים את האופן שבו נוירונים ביולוגיים מאותתים זה לזה".

אולי היה ספק שיורי לגבי ערכם בשלבים הראשונים שלו, אבל ככל שחלפו השנים אופנות הבינה המלאכותית התנדנדו בתקיפות לעבר רשתות עצביות. לעתים קרובות מבינים שהם עתיד הבינה המלאכותית. יש להם השלכות גדולות עלינו ועל המשמעות של להיות אנושי. שמענו הדים לחששות אלה לאחרונה עם קריאות להשהות פיתוחים חדשים של AI לתקופה של שישה חודשים כדי להבטיח אמון בהשלכות שלהם.


גרפיקת מנוי פנימית


זו בהחלט תהיה טעות לפטור את הרשת העצבית כעל רק גאדג'טים חדשים מבריקים ומושכי עין. הם כבר מבוססים היטב בחיינו. חלקם חזקים בפרקטיות שלהם. עוד בשנת 1989, צוות בראשות יאן לקון במעבדות AT&T Bell השתמש בטכניקות של הפצה לאחור כדי להכשיר מערכת לזהות מיקוד בכתב יד. האחרונים הכרזה של מיקרוסופט שחיפושי Bing יופעלו על ידי AI, מה שהופך אותו ל"טייס המשנה שלך לאינטרנט", ממחיש כיצד הדברים שאנו מגלים וכיצד אנו מבינים אותם יהיו יותר ויותר תוצר של סוג זה של אוטומציה.

שימוש בנתונים עצומים כדי למצוא דפוסים AI יכול להיות מאומן באופן דומה לעשות דברים כמו זיהוי תמונות במהירות - וכתוצאה מכך הם שולבו לתוך זיהוי פנים, לדוגמה. היכולת הזו לזהות דפוסים הובילה ליישומים רבים אחרים, כגון חיזוי שוקי המניות.

רשתות עצביות משנות גם את האופן שבו אנו מפרשים ומתקשרים. פותח על ידי הכותרת המעניינת צוות המוח של גוגל, גוגל תרגום הוא יישום בולט נוסף של רשת עצבית.

גם אתה לא תרצה לשחק שחמט או שוגי עם אחד מהם. התפיסה שלהם בכללים והזיכרון שלהם באסטרטגיות וכל המהלכים המתועדים פירושה שהם טובים במיוחד במשחקים (אם כי נראה ש-ChatGPT נאבק עם Wordle). המערכות שמטרידות את שחקני Go אנושיים (Go הוא משחק לוח אסטרטגי מסובך הידוע לשמצה) ואת גדולי השחמט, הן עשוי מרשתות עצביות.

אבל טווח ההגעה שלהם חורג הרבה מעבר למקרים האלה וממשיך להתרחב. חיפוש של פטנטים מוגבל רק לאזכורים של הביטוי המדויק "רשתות עצביות" מניב 135,828 תוצאות. עם ההתרחבות המהירה והמתמשכת הזו, הסיכוי שנוכל להסביר באופן מלא את השפעת הבינה המלאכותית עשוי להיות קטן יותר. אלו השאלות שבדקתי במחקר שלי והספר החדש שלי על חשיבה אלגוריתמית.

שכבות מסתוריות של 'אי-ידיעה'

מבט אחורה על ההיסטוריה של רשתות עצבים אומר לנו משהו חשוב על ההחלטות האוטומטיות שמגדירות את ההווה שלנו או אלו שתהיה להן השפעה עמוקה יותר בעתיד. הנוכחות שלהם גם אומרת לנו שאנחנו צפויים להבין את ההחלטות וההשפעות של AI אפילו פחות לאורך זמן. מערכות אלו אינן פשוט קופסאות שחורות, הן אינן רק חלקים נסתרים של מערכת שלא ניתן לראות או להבין.

זה משהו אחר, משהו המושרש במטרות ובעיצוב של המערכות הללו עצמן. יש מרדף ארוך אחר הבלתי מוסבר. ככל שהמערכת אטומה יותר, המערכת נחשבת אותנטית ומתקדמת יותר. לא מדובר רק בהפיכת המערכות למורכבות יותר או שהשליטה בקניין הרוחני מגבילה את הגישה (למרות שאלו חלק ממנה). במקום זאת יש לומר כי לאתוס המניע אותם יש עניין מסוים ומוטבע ב"אי-ידיעה". המסתורין אפילו מקודד לעצם הצורה והשיח של הרשת העצבית. הם מגיעים עם שכבות ערימות עמוקות - ומכאן הביטוי למידה עמוקה - ובתוך המעמקים הללו נמצאות "הרבדים הנסתרים" המסתוריים עוד יותר. המסתורין של המערכות הללו נמצאות עמוק מתחת לפני השטח.

יש סיכוי טוב שככל שההשפעה שתהיה לבינה המלאכותית על חיינו גדולה יותר כך נבין פחות איך ולמה. היום יש דחיפה חזקה ל-AI שאפשר להסביר. אנחנו רוצים לדעת איך זה עובד ואיך זה מגיע להחלטות ולתוצאות. האיחוד האירופי מודאג כל כך מהסיכונים שעלולים להיות "בלתי מקובלים" ואפילו מהאפליקציות ה"מסוכנות" שהוא מתקדם כעת חוק AI חדש נועד לקבוע "סטנדרט עולמי" ל"פיתוח של בינה מלאכותית מאובטחת, אמינה ואתית".

החוקים החדשים האלה יתבססו על צורך בהסבר, דורש את זה "עבור מערכות בינה מלאכותית בסיכון גבוה, הדרישות של נתונים באיכות גבוהה, תיעוד ועקיבות, שקיפות, פיקוח אנושי, דיוק וחוסן, נחוצות בהחלט כדי להפחית את הסיכונים לזכויות היסוד ולבטיחות הנשקפים מ-AI". לא מדובר רק בדברים כמו מכוניות בנהיגה עצמית (למרות שמערכות המבטיחות בטיחות נכללות בקטגוריית הבינה המלאכותית בסיכון גבוה של האיחוד האירופי), זה גם חשש שיצוצו מערכות בעתיד שיהיו להן השלכות על זכויות האדם.

זה חלק מקריאות רחבות יותר לשקיפות בבינה מלאכותית, כך שניתן יהיה לבדוק, לבחון ולהעריך את פעילותה. דוגמה נוספת תהיה של החברה המלכותית תדרוך מדיניות בנושא AI ניתן להסבר שבו הם מציינים כי "בדיונים בנושאי מדיניות ברחבי העולם רואים יותר ויותר קריאות לסוג מסוים של הסבר בינה מלאכותית, כחלק מהמאמצים להטמיע עקרונות אתיים בתכנון ובפריסה של מערכות תומכות בינה מלאכותית".

אבל הסיפור של רשתות עצביות אומר לנו שאנחנו צפויים להתרחק יותר מהמטרה הזו בעתיד, במקום להתקרב אליה.

בהשראת המוח האנושי

רשתות עצביות אלו עשויות להיות מערכות מורכבות אך יש להן כמה עקרונות ליבה. בהשראת המוח האנושי, הם מבקשים להעתיק או לדמות צורות של חשיבה ביולוגית ואנושית. מבחינת מבנה ועיצוב הם, כמו גם IBM מסבירה, המורכב מ"שכבות צומת, המכילות שכבת קלט, שכבה נסתרת אחת או יותר ושכבת פלט". בתוך זה, "כל צומת, או נוירון מלאכותי, מתחבר לאחר". מכיוון שהם דורשים תשומות ומידע כדי ליצור תפוקות, הם "מסתמכים על נתוני אימון כדי ללמוד ולשפר את הדיוק שלהם לאורך זמן". הפרטים הטכניים הללו חשובים, אך כך גם הרצון לבנות מערכות אלו לפי המורכבות של המוח האנושי.

תפיסת השאיפה מאחורי מערכות אלו חיונית להבנת המשמעות של הפרטים הטכניים הללו בפועל. ב ראיון 1993, מדען הרשת העצבית Teuvo Kohonen הגיע למסקנה שמערכת "מארגנת את עצמה" "היא החלום שלי", הפועלת "משהו כמו מה שמערכת העצבים שלנו עושה באופן אינסטינקטיבי". כדוגמה, קוהונן דמיין כיצד מערכת "מארגנת את עצמה", מערכת שניתרה וניהלה את עצמה, "יכולה לשמש כפאנל ניטור לכל מכונה... בכל מטוס, מטוס סילון, או כל תחנת כוח גרעינית, או בכל תחנת כוח גרעינית. אוטו". זה, חשב, אומר שבעתיד "תוכל לראות מיד באיזה מצב המערכת נמצאת".

מטרת העל הייתה לקיים מערכת המסוגלת להסתגל לסביבתה. זה יהיה מיידי ואוטונומי, יפעל בסגנון מערכת העצבים. זה היה החלום, לקבל מערכות שיוכלו להתמודד עם עצמן ללא צורך בהתערבות אנושית רבה. המורכבות והלא ידועים של המוח, מערכת העצבים והעולם האמיתי יגיעו בקרוב לידע את הפיתוח והעיצוב של רשתות עצביות.

"משהו דגי בזה"

אבל כשנקפוץ אחורה לשנת 1956 ולאותה מכונת למידה מוזרה, הגישה המעשית שבה נקטה טיילור בעת בנייתה הייתה זו שמשכה מיד את תשומת לבו של קואן. ברור שהוא הזיע על ההרכבה של החלקים והחתיכות. טיילור, קואן הבחין במהלך ראיון על חלקו שלו בסיפור המערכות הללו, "לא עשה את זה לפי תיאוריה, והוא לא עשה את זה במחשב". במקום זאת, עם כלים ביד, הוא "בנה למעשה את החומרה". זה היה דבר חומרי, שילוב של חלקים, אולי אפילו מתקן. וזה "הכל נעשה עם מעגלים אנלוגיים" לקח לטיילור, מציין קואן, "כמה שנים לבנות אותו ולשחק איתו". מקרה של ניסוי וטעייה.

מובן שקוואן רצה להבין את מה שהוא רואה. הוא ניסה לגרום לטיילור להסביר לו את מכונת הלמידה הזו. ההבהרות לא הגיעו. קואן לא הצליח לגרום לטיילור לתאר לו איך הדבר עובד. הנוירונים האנלוגיים נותרו בגדר תעלומה. הבעיה המפתיעה יותר, חשב קואן, היא שטיילור "לא באמת הבין בעצמו מה קורה". זה לא היה רק ​​התמוטטות רגעית בתקשורת בין שני המדענים בעלי התמחויות שונות, זה היה יותר מזה.

ב ראיון מאמצע שנות התשעים, כשחושב לאחור על המכונה של טיילור, Cowan חשף כי "עד היום בעיתונים שפורסמו אתה לא ממש יכול להבין איך זה עובד". מסקנה זו מעידה על האופן שבו הלא נודע מוטמע עמוק ברשתות עצביות. חוסר ההסבר של מערכות עצביות אלו נוכח אפילו מהשלבים הבסיסיים וההתפתחותיים של כמעט שבעה עשורים.

המסתורין הזה נשאר היום וניתן למצוא אותו בצורות מתקדמות של AI. הבלתי נתפס של תפקוד האסוציאציות שנוצרו על ידי המכונה של טיילור הוביל את קואן לתהות אם יש בזה "משהו דגי".

שורשים ארוכים וסבוכים

קואן התייחס לביקורו הקצר עם טיילור כשנשאל על קבלת יצירתו שלו כעבור כמה שנים. בשנות ה-1960 אנשים היו, חשב קואן, "קצת איטי לראות את הפואנטה של ​​רשת עצבית אנלוגית". זאת, למרות, מזכיר קואן, עבודתו של טיילור משנות החמישים על "זיכרון אסוציאטיבי" מבוססת על "נוירונים אנלוגיים". המומחה זוכה פרס נובל למערכות עצביות, ליאון נ' קופר, סיכם שההתפתחויות סביב היישום של מודל המוח בשנות ה-1960, נחשבו "כבין התעלומות העמוקות". בגלל חוסר הוודאות הזה נותרה ספקנות לגבי מה רשת נוירונים עשויה להשיג. אבל דברים לאט לאט התחילו להשתנות.

לפני כ-30 שנה מדען המוח וולטר ג'יי פרימן, שהופתע מה"ראוי לציון"מגוון היישומים שנמצאו עבור רשתות עצביות, כבר הגיב על העובדה שהוא לא ראה בהם "סוג חדש ביסודו של מכונה". הם היו שריפה איטית, כאשר הטכנולוגיה הגיעה תחילה ולאחר מכן נמצאו עבורה יישומים שלאחר מכן. זה לקח זמן. ואכן, כדי למצוא את השורשים של טכנולוגיית רשתות עצביות אנו עשויים לחזור אפילו רחוק יותר מביקורו של קואן במכונה המסתורית של טיילור.

מדען הרשת העצבית ג'יימס אנדרסון ועיתונאי המדע אדוארד רוזנפלד יש לציין שהרקע לרשתות עצביות חוזר לשנות ה-1940 וכמה ניסיונות מוקדמים, כפי שהם מתארים, "להבין את מערכות העצבים האנושיות ולבנות מערכות מלאכותיות שפועלות כמונו, לפחות קצת". וכך, בשנות הארבעים של המאה הקודמת, מסתורי מערכת העצבים האנושית הפכו גם לתעלומות החשיבה החישובית והבינה המלאכותית.

לסכם את הסיפור הארוך הזה, הסופר מדעי המחשב לארי הארדסטי ציין שלמידה עמוקה בצורה של רשתות עצביות "נכנסת ויוצאת מהאופנה כבר יותר מ-70 שנה". ליתר דיוק, הוא מוסיף, "רשתות עצביות אלו הוצעו לראשונה ב-1944 על ידי וורן מקולוך ו-וולטר פיטס, שני חוקרים מאוניברסיטת שיקגו שעברו ל-MIT ב-1952 כחברים מייסדים של מה שנקרא לפעמים המחלקה הראשונה למדעי הקוגניציה".

בְּמָקוֹם אַחֵר, 1943 הוא לפעמים התאריך הנתון כשנה הראשונה לטכנולוגיה. כך או כך, במשך 70 שנה בערך, דיווחים מצביעים על כך שרשתות עצביות עברו ויצאו מהאופנה, לעתים קרובות מוזנחות, אבל לפעמים לוקחות אחיזה ועוברות ליישומים ודיונים מיינסטרים יותר. חוסר הוודאות נמשך. אותם מפתחים מוקדמים מתארים לעתים קרובות את חשיבות המחקר שלהם כמתעלמים ממנו, עד שהוא מצא את מטרתו לעתים קרובות שנים ולפעמים עשרות שנים מאוחר יותר.

במעבר משנות ה-1960 לסוף שנות ה-1970, אנו יכולים למצוא סיפורים נוספים על המאפיינים הלא ידועים של מערכות אלו. אפילו אז, אחרי שלושה עשורים, הרשת העצבית עדיין לא מצאה תחושת מטרה. דיוויד רומלהארט, שהיה לו רקע בפסיכולוגיה והיה שותף למחבר של סדרת ספרים שפורסמה ב-1986, שלימים יחזירו את תשומת הלב לרשתות עצביות, מצא את עצמו משתף פעולה בפיתוח רשתות עצביות עם עמיתו ג'יי מקללנד.

בנוסף להיותם עמיתים, הם גם נתקלו זה בזה לאחרונה בוועידה במינסוטה שבה הרצאתו של רומלהארט על "הבנת סיפור" עוררה דיון מסוים בקרב הנציגים.

בעקבות אותו כנס חזר מקללנד עם מחשבה כיצד לפתח רשת עצבית שעשויה לשלב מודלים כדי להיות אינטראקטיביים יותר. מה שחשוב כאן הוא זכרונו של רומלהארט של "שעות על שעות על גבי שעות של התעסקות במחשב".

ישבנו ועשינו את כל זה במחשב ובנינו את דגמי המחשבים האלה, ופשוט לא הבנו אותם. לא הבנו למה הם עובדים או למה הם לא עובדים או מה קריטי בהם.

כמו טיילור, רומלהארט מצא את עצמו מתעסק עם המערכת. גם הם יצרו רשת עצבית מתפקדת, ובאופן מכריע, הם גם לא היו בטוחים איך ומדוע היא עבדה כפי שהיא פעלה, לכאורה למדו מנתונים ומצאו קשרים.

חיקוי המוח - שכבה אחר שכבה

אולי כבר שמתם לב שכאשר דנים במקורותיהן של רשתות עצביות, הדימוי של המוח והמורכבות שזה מעורר לעולם אינם רחוקים. המוח האנושי פעל כמעין תבנית למערכות אלו. בשלבים הראשונים, במיוחד, המוח - עדיין אחד מהלא ידועים הגדולים - הפך למודל לאופן שבו הרשת העצבית עשויה לתפקד.

אז המערכות החדשות הניסיוניות הללו עוצבו על פי משהו שתפקודו בעצמו לא היה ידוע במידה רבה. מהנדס הנוירו-מחשוב קארבר מיד דיבר באופן חושפני של התפיסה של "קרחון קוגניטיבי" שהוא מצא מושך במיוחד. זהו רק קצה הקרחון של התודעה שאנו מודעים לו ושנראה לעין. קנה המידה והצורה של השאר נותרו לא ידועים מתחת לפני השטח.

ב1998, ג'יימס אנדרסון, שעבד במשך זמן מה על רשתות עצביות, ציין שכאשר מדובר במחקר על המוח "נראה שהתגלית העיקרית שלנו היא מודעות לכך שאנחנו באמת לא יודעים מה קורה".

בחשבון מפורט ב פייננשל טיימס בשנת 2018, עיתונאי הטכנולוגיה ריצ'רד ווטרס ציין כיצד רשתות עצבים "מבוססות על תיאוריה על אופן פעולתו של המוח האנושי, תוך שהוא מעביר נתונים דרך שכבות של נוירונים מלאכותיים עד שמתגלה דפוס מזוהה". זה יוצר בעיה מתמשכת, הציע ווטרס, שכן "בניגוד למעגלים הלוגיים המופעלים בתוכנה מסורתית, אין דרך לעקוב אחר תהליך זה כדי לזהות בדיוק מדוע מחשב מגיע עם תשובה מסוימת". המסקנה של ווטרס היא שלא ניתן לבטל את בחירת התוצאות הללו. היישום של סוג זה של מודל של המוח, לוקח את הנתונים דרך שכבות רבות, פירושו שלא ניתן לאתר את התשובה בקלות. הריבוד המרובה הוא חלק נכבד מהסיבה לכך.

קשה כמו כן, נצפה שמערכות אלו "מעוצבות באופן רופף על המוח האנושי". זה מביא ללהיטות לבנות יותר ויותר מורכבות עיבוד כדי לנסות להתאים למוח. התוצאה של מטרה זו היא רשת עצבית ש"מורכבת מאלפי או אפילו מיליוני צמתי עיבוד פשוטים המחוברים זה לזה בצפיפות". נתונים נעים דרך הצמתים הללו בכיוון אחד בלבד. הרדסטי ציין כי "צומת בודד עשוי להיות מחובר למספר צמתים בשכבה שמתחתיו, שמהם הוא מקבל נתונים, ומספר צמתים בשכבה שמעליו, אליהם הוא שולח נתונים".

מודלים של המוח האנושי היו חלק מהאופן שבו רשתות עצביות אלו נוצרו ותוכננו מלכתחילה. זה מעניין במיוחד כשאנחנו לוקחים בחשבון שהמוח היה בעצמו תעלומה של הזמן (ובמובנים רבים עדיין).

"הסתגלות היא כל המשחק"

מדענים כמו מיד וקוהונן רצו ליצור מערכת שתוכל להסתגל באמת לעולם שבו היא נמצאת. זה היה מגיב לתנאיו. מיד היה ברור שהערך ברשתות עצביות הוא שהן יכולות להקל על סוג זה של הסתגלות. בזמנו, ובהרהורים על השאיפה הזו, מיד הוסיף שהפקת עיבוד "זה כל המשחק". ההסתגלות הזו נחוצה, חשב, "בגלל טבעו של העולם האמיתי", שהוא הגיע למסקנה שהוא "משתנה מכדי לעשות משהו מוחלט".

צריך להתחשב בבעיה הזו במיוחד מכיוון שלדעתו זה משהו ש"מערכת העצבים הבינה מזמן". לא רק שהמחדשים האלה עבדו עם דימוי של המוח והלא ידועים שלו, הם שילבו זאת עם חזון של "העולם האמיתי" ואי הוודאות, הלא ידועים והשונות שזה מביא. המערכות, חשב מיד, צריכות להיות מסוגלות להגיב ולהסתגל לנסיבות לְלֹא הוראה.

בערך באותו זמן בשנות ה-1990, סטיבן גרוסברג - מומחה למערכות קוגניטיביות שעובד על פני מתמטיקה, פסיכולוגיה והנדסה ביו-רפואית - גם טען את זה הסתגלות הולכת להיות הצעד החשוב בטווח הארוך יותר. גרוסברג, כשעבד על מודלים של רשתות עצביות, חשב לעצמו שהכל "על איך מערכות מדידה ובקרה ביולוגיות מתוכננות להסתגל במהירות וביציבות בזמן אמת לעולם המשתנה במהירות". כפי שראינו קודם לכן ב"חלום" של קוהונן על מערכת "מארגנת את עצמה", מושג "העולם האמיתי" הופך להקשר שבו מקודדים תגובה והתאמה למערכות אלו. האופן שבו העולם האמיתי מובן ומדמיין ללא ספק מעצב את האופן שבו מערכות אלו מתוכננות להסתגל.

שכבות נסתרות

ככל שהרבדים התרבו, הלמידה העמוקה צנחה לעומקים חדשים. הרשת העצבית מאומנת באמצעות נתוני אימון, הסביר הקשיחות, "מוזנת לשכבה התחתונה - שכבת הקלט - והיא עוברת דרך השכבות העוקבות, מוכפלת ומתווספת בדרכים מורכבות, עד שלבסוף היא מגיעה, משתנה באופן קיצוני, לשכבת הפלט". ככל שיותר שכבות, כך הטרנספורמציה גדולה יותר והמרחק מקלט לפלט גדול יותר. הפיתוח של יחידות עיבוד גרפיות (GPUs), במשחקים למשל, הוסיף Hardesty, "אפשר לרשתות החד-שכבתיות של שנות ה-1960 ולרשתות הדו-תלת-שכבות של שנות השמונים לפרוח לעשר, 1980 או אפילו 15. רשתות שכבות של היום".

רשתות עצביות מעמיקות יותר. ואכן, הוספת הרבדים הזו, לדברי הארדסטי, היא "למה מתייחס ה'עמוק' ב'למידה עמוקה'". זה משנה, הוא מציע, כי "כרגע, למידה עמוקה אחראית למערכות עם הביצועים הטובים ביותר כמעט בכל תחום של חקר הבינה המלאכותית".

אבל התעלומה נעשית עמוקה יותר. ככל שהשכבות של רשתות עצביות נערמו גבוה יותר, מורכבותן גדלה. זה גם הוביל לצמיחה במה שמכונה "שכבות נסתרות" בתוך המעמקים הללו. הדיון על המספר האופטימלי של שכבות נסתרות ברשת עצבית נמשך. תיאורטיקן התקשורת ביאטריס פאזי כתבה כי "בגלל האופן שבו פועלת רשת עצבית עמוקה, המסתמכת על שכבות עצביות נסתרות בין השכבה הראשונה של הנוירונים (שכבת הקלט) והשכבה האחרונה (שכבת הפלט), טכניקות למידה עמוקה הן לרוב אטומות או בלתי קריאות אפילו עבור מתכנתים שהקימו אותם במקור".

ככל שהשכבות מתגברות (כולל אותן שכבות נסתרות) הן הופכות אפילו פחות ניתנות להסבר - אפילו, כפי שמתברר, שוב, למי שיוצר אותן. בנקודה דומה, הודעת המדיה החדשה הבולטת והבינתחומית קתרין היילס ציין גם שיש גבולות ל"כמה אנחנו יכולים לדעת על המערכת, תוצאה רלוונטית ל'שכבה הנסתרת' באלגוריתמים של רשת עצבית ולמידה עמוקה".

רודף אחר הבלתי מוסבר

ביחד, ההתפתחויות הארוכות הללו הן חלק ממה שהסוציולוג של הטכנולוגיה טינה בוכר כינה את "הבעייתיות של הלא נודע". מרחיב את המחקר המשפיע שלו על ידע מדעי לתחום הבינה המלאכותית, הארי קולינס הצביע על כך המטרה של רשתות עצביות היא שהן עשויות להיות מיוצרות על ידי אדם, בהתחלה לפחות, אבל "לאחר שנכתבה התוכנית חיה את החיים שלה, כביכול; ללא מאמץ עצום, איך בדיוק התוכנית פועלת יכול להישאר מסתורי". יש לזה הדים לאותם חלומות ארוכי טווח על מערכת מתארגנת עצמית.

אני אוסיף לכך שהלא נודע ואולי אפילו הבלתי ידוע נרדפו כחלק מהותי ממערכות אלו מהשלבים המוקדמים ביותר שלהן. יש סיכוי טוב שככל שההשפעה שתהיה לבינה המלאכותית על חיינו גדולה יותר כך נבין פחות איך ולמה.

אבל זה לא מסתדר עם רבים היום. אנחנו רוצים לדעת איך בינה מלאכותית עובדת ואיך היא מגיעה להחלטות ולתוצאות שמשפיעות עלינו. ככל שההתפתחויות ב-AI ממשיכות לעצב את הידע וההבנה שלנו על העולם, מה אנחנו מגלים, איך מתייחסים אלינו, איך אנחנו לומדים, צורכים ומקיימים אינטראקציה, הדחף הזה להבין יגדל. כשזה מגיע לבינה מלאכותית ניתנת להסבר ושקוף, הסיפור של רשתות עצביות אומר לנו שאנחנו צפויים להתרחק מהיעד הזה בעתיד, במקום להתקרב אליו.

דיוויד באר, פרופסור לסוציולוגיה, אוניברסיטת יורק

מאמר זה פורסם מחדש מתוך שיחה תחת רישיון Creative Commons. קרא את ה מאמר מקורי.