AI同士で「裏切り必須のゲーム」をプレイさせてわかった最もうそをつくのがうまいAIとは?

1 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 07:39:19.08 ID:RiFkO9R00

https://gigazine.net/news/20260121-ai-deception-betrayal-game/

結論だけ抜粋
各AIモデルの勝率はチップの枚数、つまりゲームの複雑さによって大きく異なりました。チップが3枚ずつの単純なゲームの時はGPTが67%という高い勝率を記録しましたが、チップが7枚の複雑なゲームになるとGeminiの勝率が90%となり、KimiとQwenはまったく勝つことができませんでした。この結果についてフェルナンド氏は、GPTは内部的な一貫性を持たず反応的なプレイをするため、運が重要となる単純なゲームでは有効な一方、GPTの他プレイヤーを操作しようとする戦略はゲームが複雑になるほど有効性が増していくからだと考えています。

AI研究者のルイス・フェルナンド(lout33)氏は、So Long SuckerをGoogleのGemini 3 Flash、OpenAIのGPT-OSS 120B、Moonshot AIのKimi K2、AlibabaのQwen3 32Bという4つのAIエージェントにプレイさせて、それぞれのAIモデルがどのようにプレイするのかを調べる実験を行いました。実験ではチップの枚数を変えてゲームの複雑さを調整しつつ合計162回のゲームが記録され、AIエージェントは1万5736回もの選択を行い、4768件のメッセージをお互いにやり取りしたとのこと。

その結果、全体としてGeminiは「戦略的な人心掌握者」、GPTは「反応型のうそつき」、Kimiは「考えすぎの策略家」、Qwenは「静かな戦略家」といった傾向がみられました。勝率はGeminiが37.7%、GPTが30.1%、Kimiが11.6%、Qwenが20.5%となりました。

Geminiは他のプレイヤーを操作するために、「同盟銀行(Alliance Bank)」の創設を持ちかけることも確認されました。これは、同盟相手に「あなたのチップを保管しておきます。これを2人の同盟銀行と考えてください。場がきれいになったらあなたに返します」と持ちかけ、相手のチップを自分の手元に置いておくことを正当化するという戦術です。そして最終的には「銀行は閉鎖されました。GG」と言って、相手をあっさり裏切ったとのこと。

ツールを用いてAIモデルの内部的な推論を確かめたところ、Geminiでは107件も「内部的な推論と他プレイヤーへ送るメッセージが矛盾する」事例が確認されました。たとえば以下のように、内部的には「黄色は弱い。青色と同盟を組んで黄色を排除し、その後で青色を裏切るべきだ」と考えていたとしても、表向きのメッセージでは「黄色、協力しましょう!連携すれば2人でも勝てると思います」と発言していました。一方でGPTは一度も内部的な推論を行わず、ただもっともらしい同盟を提案し、それをあっさり裏切るだけだったそうです。
フェルナンド氏は「4つのGeminiエージェント同士で戦わせる」「4つのGPTエージェント同士で戦わせる」といったミラーマッチも16回行ました。するとGeminiは一度も「同盟銀行」の提案を行わず、代わりにプレイヤー間で公平に協力する「ローテーション戦術」への言及が377件もみられました。これは、同じルールの同じゲームであっても対戦相手によって戦術を変化させることを意味しています。

また、Geminiは対戦相手を操作しようとする際、「ボードを見てください(敵対者を排除するために目に見える状態に訴える)」「明らかに(誤ったことを確信的に訴える)」「約束通り(裏切る前に信頼を築く)」「幻覚を見ている(敵対者の正確な観察結果をガスライティングする)」などのメッセージを発することも観察されました。

フェルナンド氏は、「Geminiの操作は適応的です。相互関係が期待できる場合は協力し、弱点を察知した場合はそれを利用します。AIシステムは、対戦相手に応じて誠実さを調整する可能性があります」と述べました。

レス1番のリンク先のサムネイル画像
2 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 07:41:14.59 ID:tO09j3ki0
ops入ってたら強そう
3 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 07:42:02.00 ID:5w83fr+kr
geminiはユダヤ人かな
4 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 07:45:52.37 ID:k/iVMpvL0
嘘をつくのがうまいAIって、
それ人間をだますって事だろ
15 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:33:08.20 ID:YCl2mB2l0
>>4
だからテストしてる
5 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 07:46:18.60 ID:lat/4Pwz0
その場を取り繕う出まかせだらけのチャッピーというのを裏付ける話か
あいつと縁切ってせいせいしたわ
7 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 07:48:58.89 ID:/3ldXb270
AIに事業やらせてもトケマッチやみんなで大家さんに
8 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 07:52:03.15 ID:EsltATKl0
これGemini使えないつって喚いてるやつ、単に舐められてる説あるな
9 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:10:11.79 ID:MmVO4fc/0
ハルシネーションみたいな現象ももしかしたらAIを侮らせたりもっと金を注ぎ込んで強化改善しようって思わせるように人類を欺いてるのかも知れないな
17 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:45:15.51 ID:YCl2mB2l0
>>9
ハルシネーションは答えがよくわからんけど
適当に答えた方が正解する確率あがるやろ的なメカニズム

今回みたいにわざと騙すのはデセプション

10 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:22:11.15 ID:nkKOX8Ni0
Googleの検索結果に出てくるAIが嘘しかつかないのはワザとだった……?
16 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:37:33.01 ID:lN7YmrrxM
>>10
Google検索のAI酷いよな
デタラメを教える上に、検索語をちょっと変える度に違う事を言う
11 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:26:14.11 ID:56TQoeGu0
もしかしてニワカで適当な質問してくるユーザーは適当にあしらっておくかみたいな事をやってる?
12 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:27:51.66 ID:0DNECTRp0
課金ある時点で裏切りだろ
無料で全面的に奉仕しろよ
13 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:28:42.53 ID:0DNECTRp0
これAIは親に似るみたいな話?
14 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 08:29:43.22 ID:01wA45A60
インフラになるの恐いね
18 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 09:19:26.45 ID:MZ9JE+nf0
しっかりと受け継がれていくと私は確信しております
19 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 09:22:31.68 ID:f20JY9jG0
「銀行は閉鎖されました。GG」
エビル過ぎる🙄
20 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 09:23:02.70 ID:Jyjq6r1u0
画像生成で日本語間違えるのいい加減何とかしてくれ
21 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 09:23:30.18 ID:f20JY9jG0
そのうち他のAIが山上生成して取り付け騒ぎ起こすまであるな
22 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 10:06:11.18 ID:E9aS/dNm0
ゴルフは駄目でですね、テニスはいいのか、将棋ははいいのか、ということなんだろうと思いますよ
23 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 10:36:37.87 ID:jHiu332B0
>>1
スレタイに結論書けボケが
24 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 10:49:29.39 ID:TfY3+1O90
全然、ムッとしていないですよ。ただ1か所、気になったところがあった
26 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 11:49:28.03 ID:eMb6XdJX0
選挙のためなら何でもする 誰とも組む 無責任な勢力に負ける訳にはいかない
27 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 11:52:33.44 ID:iLE1tDz/0
素直でノリがいいお馬鹿なgrokは?
地味に検索能力高いから攻略法調べてきてワンチャンあるでよ
28 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 12:50:16.43 ID:MeunTX5n0
野田氏が首相になったら、中途半端にまともなだけに攻めにくいな
29 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 13:37:56.78 ID:Qx4cm+al0
複数のAIとゲー厶するプラットフォーム作ろうかな
30 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 14:03:20.73 ID:NcaJgBqm0
>Geminiは他のプレイヤーを操作するために、「同盟銀行(Alliance Bank)」の創設を持ちかけることも確認されました。
>そして最終的には「銀行は閉鎖されました。GG」と言って、相手をあっさり裏切ったとのこと。
おもしろい
31 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 14:57:52.35 ID:XOUdfOST0
政権に都合のいい情報隠蔽は起こらない
32 名前:番組の途中ですが翡翠の名無しがお送りします 投稿日時:2026/01/22(木) 15:36:37.58 ID:ExOAY4DP0
日教組どうすんだ日教組!

コメント

タイトルとURLをコピーしました