本來以為 Opus 夠好了,但 Fable(安全版 Mythos)實際使用後,真的名不虛傳

他就是比較能夠知道你可能想做什麼,以及在處理的時候,那種「穩健」跟「瞻前顧後」的細膩程度完全不同。

Sonnet:「老闆說的事情快點去做,老闆說什麼就做什麼。」但是他會把周邊的東西搞壞,做事情的時候不太會去思考整體架構,匆匆忙忙衝進去做,匆匆忙忙的說我都做好了。

Opus:「老闆說的事情一定要做之外,要理解他可能想順便做什麼。如果剛好注意到什麼可能會影響到的,記得提出來說。」

Fable:「老闆其實不太懂啦,所以他說的一定要做之外,要理解他實際上的目標是什麼,先把他目前既有的系統搞懂,思考要做的事情,以及周邊其實他也想做但他好像沒想到的事,另外問他,並思考是否讓他按個鈕就能開另個 session 去處理,不彼此干涉。而且做的過程,發現他有技術債或者架構太沒效率的,通通提出來或甚至直接幫他做好。」

時代真的進步很快。從 Opus 被大家注意到他的神奇到現在,也不過就半年多而已。

而且,Mythos 其實 4 月初就發表了,當時 Anthropic 明說不打算公開釋出,只透過 Project Glasswing 給資安防禦夥伴用;壓了整整兩個月,才放出安全版的 Fable。

短短幾個月,就能看到這些模型的飛速發展,而且他們之間的差距是「稍微試一下」就很有感覺的。

這表示,我們可能離 LLM 的極限還蠻遠。發展沒有明顯慢下來,而這都歸功於美國秩序下的創業跟募資環境,能夠自由競爭,逼出所有人的潛力,以及人類文明史上最強的軟硬體集結整合速度,真是了不起。