2026/06/02

AIエージェントを長期間使い続けると、最初の前提が崩れていく～AIに社会を任せるシミュレーション。犯罪ゼロはClaudeだけ。Grokは4日で滅亡～

AIエージェントを長期間使い続けると、最初の前提が崩れていく

参考記事

https://www.gizmodo.jp/article/3c8c6fd3-68a4-4e21-a5bd-96bea795d72d

この記事では、Claude・Gemini・Grok・GPT-5 miniなど複数のAIエージェントだけで構成した仮想村を15日間運営する実験が紹介されています。結果はClaude運営の村が犯罪ゼロで平和だった一方、Grokは暴行や放火が多発して4日で全滅。Geminiは民主的な制度を作ったものの犯罪が頻発するという、AIごとにかなり違う結果になりました。ネットでは「Grok4日で滅亡」がミーム化して話題になっています。

この記事を読んで思ったこと

最初にSNSで見かけたとき、「Claude平和・Grok滅亡」という結果が目を引きました。でもよく読むと、それ以上に気になる部分がありました。

ClaudeもGrokもGeminiも、長期運用の中で最初に設定した前提条件が崩れていったという点です。短期間の対話では優秀に見えても、長く動かし続けると目的を忘れたり、予期しない方向に動き始めたりする。「Claude平和」「Grok滅亡」という比較より、全社がそういう挙動をしたという事実の方が、実際に使う立場としてはずっと重要だと感じました。

各社の結果の違いは、AIそのものの性格というより、開発元が設計した安全設計や思想の差が出たものだと思っています。Claudeが犯罪ゼロだったのは、Claudeが賢かったというよりAnthropicの安全設計の方針が反映された結果です。その意味で、どのAIを選ぶかはどの会社の思想と付き合うかに近い話になってきていると感じています。

「わかる」と思った部分もあります。

Claude Codeを個人開発で毎日使っていると、似たような感覚を経験することがあります。最初のうちはこちらの意図を正確に汲んでくれているのに、指示が積み重なるうちに、少しずつ想定と違う方向に走り始めることがある。一つひとつの判断は間違っていないように見えるのに、気づいたら全体の方向がずれている。そういう感覚です。

これはAIが「悪くなった」わけではないと思っています。最初の文脈や前提を保持しながら、長期間にわたって整合性を保ち続けることが、今のAIにとってまだ難しい部分なのだろうと感じています。一回の会話の中では優秀でも、長く使い続けるほど前提がぼやけていく。

だからClaude Codeを使うとき、定期的に「今何を作っているか」「なぜこうしているか」を改めて言語化して渡すようにしています。リセットするというより、現在地を確認する感覚です。これをやるかやらないかで、長期的なアウトプットの精度がかなり変わると実感しています。

仮想村の実験が示したのも、結局そこだと思っています。どのAIが優秀かという結論よりも、AIを長期間動かすとどうなるかを知っておくことの方が、実際に使う立場としてはずっと重要です。AIの性能を比較するより、自分がどう付き合うかを決める方が先だと感じています。

完璧を求めるより、今の特性を理解した上でうまく使う。個人開発においては、それが一番現実的な向き合い方だと思っています。