利弗莫爾門下
2025-07-09 06:31:04

黑客帝國的由來(105) 戰略與戰術

面對架構師型人工智能,人類曾經認為圍棋是最后的關隘,是這種人工智能很難攻克的。人類為什么這么想呢?因為圍棋除了戰術上的復雜性以外,更需要戰略性思維。
然而當阿爾法狗戰勝了人類的圍棋冠軍后,人類十分沮喪,感覺自己好像要被這種人工智能超越了。
但崔尼蒂不以為然。仔細分析一下阿爾法狗是如何做到的,人類就不該妄自菲薄了。
阿爾法狗的背后是強大的計算機硬件支持。它能夠快速處理海量的數據。可以利用其強大的計算能力,在短時間內分析大量的棋局可能性。例如,在對局過程中,它可以在極短的時間內計算出各種落子選擇后的勝率,這是人類棋手難以做到的。人類棋手的計算能力是有限的,大腦在短時間內能處理的信息量遠不如計算機,而且在長時間對弈后還容易出現疲勞,導致計算失誤。
阿爾法狗在外算力支持下,可以窮舉遍歷幾乎無數種可能性,還可以利用蒙特卡洛樹進行暴力搜索,這種算法能夠通過隨機抽樣的方式,對棋局的未來可能發展進行模擬,阿爾法狗可以生成大量的模擬棋局,從而更準確地評估當前局面和各種落子選擇的價值。就像在一片未知的森林中尋找最佳路徑,蒙特卡洛樹搜索算法就像在森林中隨機撒下許多小旗幟,標記出可能的路徑,然后通過分析這些路徑來找到最優的那條。
阿爾法狗利用這種能力在比賽前,幾乎可以學習一切人類高手的對局數據,包括頂級棋手的棋譜。這些數據涵蓋了各種開局、中盤戰術和收官技巧。通過對這些數據的學習,阿爾法狗能夠掌握人類棋手的思維模式和習慣,包括戰略性思維,也可以利用算力,快速評估各種戰略選擇的勝率,與處理戰術性選擇是一樣的模式,同時還能發現一些人類棋手可能忽視的下法。
它還可以通過自我對弈產生數據,也就是說它可以自己自動進行蒙特卡洛測試,進一步加強其窮舉遍歷的能力。
它的工作模式類似于人類的戰術性思維,但人類的戰略性思維是這樣的嗎?
人類的戰略性思維是主動的對全局的系統性的把控,而且不是在遍歷所有可能性和精確計算勝率的前提下做出的,依靠的是一種有限經驗下的靈感與直覺,這與阿爾法狗的工作原理完全不同,兩者根本不在一個起跑線上。
就好比拳擊賽,兩者根本就不是一個量級的,甚至從事的不是一種運動。阿爾法狗的暴力遍歷所有可能性的做法,無異于作弊,好比兩個人類打游戲,一個有外掛,一個沒有外掛,這樣的比賽,如果按照叢林法則,那無話可說,按奧林匹克精神,那顯然是不公平的,如果人類棋手帶著一個算力堪比阿爾法狗的外掛上場,它還能贏嗎?
而安德森就相當于一個帶著外掛的人類,只有當安德森這樣的人工智能出現時,人類才真正到了該沮喪的時候,即使按照叢林法則,安德森也將是勝利者。