Daboost / Shutterstock

עם פיטורין לאחרונה והעסקה חוזרת מהירה של סם אלטמן מאת OpenAI, ויכוחים סביב הפיתוח והשימוש בבינה מלאכותית (AI) שוב נמצאים באור הזרקורים. מה שיותר יוצא דופן הוא שנושא בולט בדיווח בתקשורת היה היכולת של מערכות בינה מלאכותית לעשות מתמטיקה.

ככל הנראה, חלק מהדרמה ב-OpenAI הייתה קשורה לפיתוח חדש של החברה אלגוריתם בינה מלאכותית בשם Q*. דובר על המערכת כעל התקדמות משמעותית ואחד המאפיינים הבולטים שלה היה היכולת להגיב בצורה מתמטית.

אבל האם מתמטיקה היא לא הבסיס של AI? איך מערכת בינה מלאכותית יכולה להיתקל בבעיות עם חשיבה מתמטית, בהתחשב בכך שמחשבים ומחשבונים יכולים לבצע משימות מתמטיות?

בינה מלאכותית אינה ישות אחת. זה טלאי של אסטרטגיות לביצוע חישוב ללא הוראה ישירה מבני אדם. כפי שנראה, כמה מערכות בינה מלאכותית מוכשרות במתמטיקה.

עם זאת, אחת הטכנולוגיות החשובות ביותר הנוכחיות, מודל השפה הגדול (LLMs) מאחורי צ'טבוטים של AI כגון ChatGPT, נאבקה עד כה לחקות חשיבה מתמטית. הסיבה לכך היא שהם תוכננו להתרכז בשפה.


גרפיקת מנוי פנימית


אם אלגוריתם Q* החדש של החברה יכול לפתור בעיות מתמטיות בלתי נראות, אז זה בהחלט עשוי להיות פריצת דרך משמעותית. מתמטיקה היא צורה עתיקה של חשיבה אנושית מודלים של שפה גדולה (LLMs) עד כה התקשו לחקות. LLMs הם הטכנולוגיה העומדת בבסיס מערכות כגון ChatGPT של OpenAI.

בזמן הכתיבה, הפרטים של אלגוריתם Q* ויכולותיו מוגבלים, אך מסקרנים ביותר. אז ישנן דקויות שונות שכדאי לקחת בחשבון לפני שקובעים את Q* כהצלחה.

לדוגמה, מתמטיקה היא נושא שכולם עוסקים בו בהיקפים שונים, ורמת המתמטיקה ש-Q* מוכשרת בה נותרה לא ברורה. עם זאת, פורסמה עבודה אקדמית המשתמשת בצורות חלופיות של AI כדי לקדם מתמטיקה ברמת המחקר (כולל כמה שנכתבו על ידי, ואחד שנכתב על ידי צוות של מתמטיקאים בשיתוף עם חוקרים ב-Google DeepMind).

ניתן לתאר את מערכות הבינה המלאכותית הללו כמוכשרות במתמטיקה. עם זאת, סביר להניח ש-Q* אינו משמש כדי לעזור לאקדמאים בעבודתם אלא מיועד למטרה אחרת.

אף על פי כן, גם אם Q* אינו מסוגל לפרוץ את גבולות המחקר החדשני, סביר מאוד להניח שיש משמעות מסוימת לאופן בנייתו שעלול להעלות הזדמנויות מפתות לפיתוח עתידי.

יותר ויותר נוח

כחברה, אנו מרגישים יותר ויותר בנוח עם AI מומחה המשמש לפתרון סוגי בעיות קבועות מראש. לדוגמה, עוזרים דיגיטליים, זיהוי פנים, ו מערכות המלצות מקוונות יהיה מוכר לרוב האנשים. מה שנשאר חמקמק הוא מה שנקרא "בינה כללית מלאכותית" (AGI) שיש לו יכולות חשיבה רחבות הדומות לאלו של אדם.

מתמטיקה היא מיומנות בסיסית שאנו שואפים ללמד את כל ילד בית ספר, ובוודאי תתאים כאבן דרך בסיסית בחיפוש אחר AGI. אז איך אחרת מערכות בינה מלאכותית מוסמכות מבחינה מתמטית יהיו לעזר לחברה?

הלך הרוח המתמטי רלוונטי להמון יישומים, למשל קידוד והנדסה, ולכן חשיבה מתמטית היא מיומנות חיונית להעברה עבור אינטליגנציה אנושית ומלאכותית כאחד. אירוניה אחת היא שבינה מלאכותית מבוססת, ברמה הבסיסית, על מתמטיקה.

לדוגמה, רבות מהטכניקות המיושמות על ידי אלגוריתמי בינה מלאכותית מסתכמות בסופו של דבר לאזור מתמטי המכונה אלגברה מטריצה. מטריצה ​​היא פשוט רשת של מספרים, שתמונה דיגיטלית היא דוגמה מוכרת לה. כל פיקסל הוא לא יותר מנתונים מספריים.

מודלים של שפה גדולים הם גם מתמטיים מטבעם. בהתבסס על מדגם ענק של טקסט, מכונה יכולה ללמוד את ההסתברויות למילים שהן סביר להניח שיעקוב אחר הנחיה (או שאלה) מהמשתמש לצ'אטבוט. אם אתה רוצה ש-LLM שעבר הכשרה מוקדמת להתמחות בנושא מסוים, אז ניתן לכוונן אותו על ספרות מתמטית, או כל תחום אחר של למידה. LLM יכול ליצור טקסט שנקרא כאילו הוא מבין במתמטיקה.

למרבה הצער, פעולה זו מייצרת LLM שהוא טוב בבלף, אבל גרוע בפרטים. הבעיה היא שהצהרה מתמטית היא, בהגדרה, כזו שניתן להקצות לה א ערך בוליאני חד משמעי (כלומר, נכון או שקר). חשיבה מתמטית מסתכמת בהסקת היגיון של הצהרות מתמטיות חדשות מאלה שנקבעו בעבר.

פרקליט השטן

באופן טבעי, כל גישה לחשיבה מתמטית הנשענת על הסתברויות לשוניות הולכת לנהוג מחוץ לנתיב שלה. דרך אחת לעקוף את זה יכולה להיות לשלב מערכת אימות פורמלית כלשהי בארכיטקטורה (בדיוק איך ה-LLM בנוי), שבודקת ללא הרף את ההיגיון מאחורי הקפיצות שמבצע מודל השפה הגדול.

רמז לכך שזה נעשה יכול להיות בשם Q*, שיכול להתייחס אליו באופן סביר אלגוריתם התפתח כל הדרך בשנות ה-1970 לעזור בהיגיון דדוקטיבי. לחלופין, Q* יכול להתייחס ל-Q-learning, שבו מודל יכול להשתפר עם הזמן על ידי בדיקה ותגמול של מסקנות נכונות.

אבל קיימים מספר אתגרים בבניית AIs בעלי יכולת מתמטית. לדוגמה, חלק מהמתמטיקה המעניינות ביותר מורכבת מאירועים מאוד לא סבירים. ישנם מצבים רבים שבהם אפשר לחשוב שקיים דפוס המבוסס על מספרים קטנים, אך הוא מתקלקל באופן בלתי צפוי כאשר בודקים מספיק מקרים. קשה לשלב את היכולת הזו במכונה.

אתגר נוסף עשוי להפתיע: מחקר מתמטי יכול להיות מאוד יצירתי. זה חייב להיות, כי מתרגלים צריכים להמציא מושגים חדשים ובכל זאת להישאר בתוך כללים פורמליים של נושא עתיק.

כל מתודולוגיית בינה מלאכותית שאומנה רק כדי למצוא דפוסים במתמטיקה קיימת, כנראה לא תוכל ליצור מתמטיקה חדשה באמת. בהתחשב בצנרת בין מתמטיקה לטכנולוגיה, נראה שהדבר מונע את התפיסה של מהפכות טכנולוגיות חדשות.

אבל בואו נשחק לרגע עורך דין השטן ונדמיין האם בינה מלאכותית אכן יכולה ליצור מתמטיקה חדשה. לטענה הקודמת נגד זה יש פגם, בכך שניתן גם לומר שגם מיטב המתמטיקאים האנושיים הוכשרו אך ורק על מתמטיקה קיימת. דגמי שפה גדולים הפתיעו אותנו בעבר, ויעשו זאת שוב.שיחה

טום אוליבר, מרצה, מדעי המחשב והנדסה, אוניברסיטת וסטמינסטר

מאמר זה פורסם מחדש מתוך שיחה תחת רישיון Creative Commons. קרא את ה מאמר מקורי.