אלפא גו - המחשב שהפך תוך 40 יום לאלוף עולם

כאשר המחשב "כחול עמוק" ניצח, לפני כמעט יותר מעשרים שנה, את אלוף העולם בשחמט גארי קספרוב, העולם היה כמרקחה. אך זו הייתה רק יריית הפתיחה לשורה של אתגרים שבהם המכונה התמודדה עם האדם במשימות שנחשבו לאנושיות, ואף הצליחה לגבור עליו. אך המשחק הסיני "גו" נחשב תמיד לפסגה הגבוהה והבלתי מושגת עבור תוכנות מחשב. למשחק הזה יש מספר חוקים פשוטים, אך דווקא החופשיות הרבה שלו הופכת אותו למורכב מאוד. למעשה, מספר ההשתלשלויות האפשריות של המשחק גדול יותר ממספר כל החלקיקים ביקום. אפילו המחשב הכי חזק בעולם לא יכול לחשב את כל המהלכים הללו (כפי ש"כחול עמוק" עשה), ולכן לקח למפתחים שנים רבות מאוד כדי להצליח להעמיד תוכנת מחשב ראוייה ברמה עולמית במשחק הגו. בשנה שעברה זה קרה, כשחברת DeepMind שבבעלות גוגל יצרה את התוכנה AlphaGoMaster, אשר ניצחה את אלוף העולם במשחק. זאת בניגוד לכל התחזיות, שהאמינו שהדבר לא יקרה בדורנו אנו.

אך זו, כאמור, הייתה רק ההתחלה…
חוזקתן של התוכנות הללו היא ביכולת הלמידה שלהן, אך הלמידה מתבצעת באמצעות קלט אנושי. לדוגמה, סיפרתי כאן בעבר על מחשבים המלחינים יצירות קלאסיות. מחשבים אלה נחשפים להרבה מאוד יצירות שנכתבו על ידי מלחינים אנושיים, ולומדים "כיצד צריכה להראות יצירה" לפני שהם מלחינים אחת כזו בעצמם. כמוהם AlphaGoMaster נחשפה ללמעלה ממאה אלף משחקי גו אנושיים כדי ללמוד ולהשתפר במשחק, ובסופו של דבר להפוך לאלופת העולם.

אך לא עברה אלא שנה, וכבר יצאו ב-DeepMind עם תוכנה חדשה. AlphaGoZero. בניגוד לתוכנה הקודמת, זירו לא ראתה ולו משחק אחד בין בני אדם, היא התחילה מאפס, בלי שום ידע על טקטיקות ורק באמצעות מהלכים אקראיים, היא שיחקה נגד עצמה ולמדה ממשחק למשחק. כעבור ארבעים יום ו-30 מליון משחקים, זירו הייתה מוכנה לאתגר האמיתי והתמודדה נגד אלופת העולם הטרייה, הלא היא אלפא-גו-מאסטר שניצחה את האלוף האנושי רק שנה קודם, הביסה אותה והפכה לאלופת העולם החדשה, כשהיא מציגה שורה של מהלכים לא צפויים שלא נראו מעולם במשחקים אנושיים.

הממצאים, שפורסמו בסוף השבוע, מסעירים את העולם. העובדה שמכונה מצליחה להגיע להישג כזה, ללמוד לבצע משימה בצורה מושלמת תוך פרק זמן קצר ובלי להחשף לקלט אנושי, היא לא פחות ממדהימה. הרי התלות בקלט אנושי מגבילה מאוד את המכונות. אך זירו הצליחה בתוך ארבעים ימים לחשוף ולפתח אסטרטגיות ומהלכים שכל המין האנושי לא גילה באלפי שנים שבהן הוא משחק גו. זהו שלב מבטיח מאוד בעולם הבינה המלאכותית, משום שמכונה דומה יכולה, לצורך ההשוואה, לגלות גם תרופות חדשות ותגליות שהמין האנושי לא מסוגל להגיע אליהן לבד בימנו.

עם זאת, ברגע שנצליח לנתק את המכונות הלומדות לחלוטין מתלות בקלט אנושי, אנחנו למעשה מאבדים את אחד המקומות הבודדים שבהם אנחנו עוד עולים עליהן, היכולת היצירתית להביא ולהוליד רעיונות מאפס (ככל הנראה בעיקר בזכות למידה בלתי מפוקחת). במידה וזה אכן נעשה, האפשרות להגיע למצב שבו מחשבים יידעו לבצע כל פעולה טוב יותר מאיתנו הופכת להיות קרובה וריאלית מתמיד, ועלינו לחשוב כיצד אנחנו מסוגלים להתמודד עם זה, והאם אנחנו מסוגלים להפיק מכך את הצדדים הטובים, ובמקביל להתמודד עם הבעיות שהתופעה הזו תביא איתה.

אלוף העולם לי סידול הקוראני משחק גו נגד אלפא-גו של גוגל

פוסטים

המחשב שהפך לאלוף עולם תוך ארבעים יום