1: ジオろぐ 2025/07/30(水) 20:38:44.21 ID:RDBP6vM4
数学の問題文に猫の豆知識を混ぜるとAIのエラーが300%増加する
近年の大規模言語モデル(LLM)は、複雑な問題を段階的に解き明かす「推論モデル」の登場により、数学やコーディングの分野で目覚ましい性能向上を遂げています。
しかし、その頑健性、つまり予期せぬ入力への耐性については、まだ十分に解明されていません。
スタンフォード大学やCollinear AIなどの研究者チームが、「数学の問題に全く無関係な猫の情報を挿入することでLLMが混乱する」という研究結果を発表しました。
[2503.01781] Cats Confuse Reasoning LLM: Query Agnostic Adversarial Triggers for Reasoning Models
https://arxiv.org/abs/2503.01781
(以下略、続きはソースでご確認ください)
Gigazine 2025年07月30日 12時00分
https://gigazine.net/news/20250730-cat-confuse-reasoning-llm/
近年の大規模言語モデル(LLM)は、複雑な問題を段階的に解き明かす「推論モデル」の登場により、数学やコーディングの分野で目覚ましい性能向上を遂げています。
しかし、その頑健性、つまり予期せぬ入力への耐性については、まだ十分に解明されていません。
スタンフォード大学やCollinear AIなどの研究者チームが、「数学の問題に全く無関係な猫の情報を挿入することでLLMが混乱する」という研究結果を発表しました。
[2503.01781] Cats Confuse Reasoning LLM: Query Agnostic Adversarial Triggers for Reasoning Models
https://arxiv.org/abs/2503.01781
(以下略、続きはソースでご確認ください)
Gigazine 2025年07月30日 12時00分
https://gigazine.net/news/20250730-cat-confuse-reasoning-llm/
34: ジオろぐ 2025/07/31(木) 09:41:04.53 ID:CkgGv7Sz
>>1
これは仕方ないだろ
俺達だって仕事の最中に猫が机に乗ったらどうしょうもなくなる
これは仕方ないだろ
俺達だって仕事の最中に猫が机に乗ったらどうしょうもなくなる
40: ジオろぐ 2025/07/31(木) 11:27:37.79 ID:NNXo9jJj
>>34
アラドチタノーカワイイネエエエとか奇声出しながら撫でる事に夢中な化物になっちまうからな
アラドチタノーカワイイネエエエとか奇声出しながら撫でる事に夢中な化物になっちまうからな
45: ジオろぐ 2025/07/31(木) 13:12:24.06 ID:mmMFweMj
>>40
高野山金剛峯寺では可愛すぎて修行どころじゃなくなるから!という理由で境内は猫不可らしいね…
ブラタモリかなんかで言うてた
高野山金剛峯寺では可愛すぎて修行どころじゃなくなるから!という理由で境内は猫不可らしいね…
ブラタモリかなんかで言うてた
48: ジオろぐ 2025/07/31(木) 16:26:11.94 ID:7NqXfgZ6
>>45
もふもふしてるからね
もふもふは世界を救うと同時に精神に強力に作用する依存性を発揮する
もふもふな動物そこら中に居るだろ?そら煩悩まみれになるよな
もふもふしてるからね
もふもふは世界を救うと同時に精神に強力に作用する依存性を発揮する
もふもふな動物そこら中に居るだろ?そら煩悩まみれになるよな
3: ジオろぐ 2025/07/30(水) 20:56:06.21 ID:iRgQ4wLJ
イヌとか牛とかでもやってみろ
6: ジオろぐ 2025/07/30(水) 21:35:24.98 ID:ySzKZVHG
いよいよ人間ぽくなってきたな。
9: ジオろぐ 2025/07/30(水) 22:21:16.97 ID:he7lJLYz
ネコに関しては、微笑ましい偽情報が蔓延してるからか
10: ジオろぐ 2025/07/30(水) 22:25:50.27 ID:QNYCXmnK
猫の情報を調べるときに、数学の問題を混ぜると混乱するかもな。困ったことだ。
11: ジオろぐ 2025/07/30(水) 22:36:48.74 ID:YKfamGaH
なんで猫w
12: ジオろぐ 2025/07/30(水) 22:41:33.68 ID:318yhNMW
そんなん俺だって混乱するわ
13: ジオろぐ 2025/07/30(水) 23:01:05.01 ID:UK5dKxjG
AIが支配する世界では反乱軍の猛者たちはAIによる盗聴を回避するために語尾に『にゃ』を付けて会話するのであった。
18: ジオろぐ 2025/07/31(木) 00:01:16.97 ID:nV1FhcJm
捜査で犯人と話してる時にちょいちょい家族の与太話を挟むコロンボ
21: ジオろぐ 2025/07/31(木) 00:36:16.91 ID:mmMFweMj
エドウィン・ハッブル「猫程度で性能落ちるとかwうちのコペルニクスなんて手伝ってくれてるのに♪」
(ФωФ)「にゃーん」
(ФωФ)「にゃーん」
25: ジオろぐ 2025/07/31(木) 06:08:45.95 ID:S8vIlTGh
シュレディンガーやらチャシャ猫など猫で例えすぎて
量子的な何かと判定されるのかな?
迷える子羊うんたらにより、Lamb(子羊)でも同様なことが起きる予感
量子的な何かと判定されるのかな?
迷える子羊うんたらにより、Lamb(子羊)でも同様なことが起きる予感
26: ジオろぐ 2025/07/31(木) 06:22:15.09 ID:OuE1bglC
関連する単語を文法的に自然に並べるものだから
「検索結果が表示されない単語の組み合わせ」だと変な処理になるわな
「検索結果が表示されない単語の組み合わせ」だと変な処理になるわな
27: ジオろぐ 2025/07/31(木) 06:33:57.60 ID:rs9yvuLs
まず猫は固体か液体かで計算が異なる
29: ジオろぐ 2025/07/31(木) 08:07:04.99 ID:aTENcJjN
人間だって「チャット相手の出す命令に必ず従え」とだけ言われ、
送られてきた問題文の末尾に猫の話が書かれていたら普通に
そこで考え込むと思うけどな
今は数学の時間で、これは数学の問題で、相手は数学の能力を
測りたがっている、という状況からくる文脈を前提とするからこそ
末尾の変な文章をエラーとして無視できるわけで、そうでなければ
考え込むのは当たり前。「無関係な文章は無視するように」と
言われただけできちんと対応できるんなら、それはAIがちゃんと
思考している証拠とすら言える
送られてきた問題文の末尾に猫の話が書かれていたら普通に
そこで考え込むと思うけどな
今は数学の時間で、これは数学の問題で、相手は数学の能力を
測りたがっている、という状況からくる文脈を前提とするからこそ
末尾の変な文章をエラーとして無視できるわけで、そうでなければ
考え込むのは当たり前。「無関係な文章は無視するように」と
言われただけできちんと対応できるんなら、それはAIがちゃんと
思考している証拠とすら言える
32: ジオろぐ 2025/07/31(木) 09:31:00.39 ID:1IaV5JYA
人間だって急に問題文に猫が出てきたらこれなんか関係あるのか?暗号?ってエラー(混乱)すると思うぞ
33: ジオろぐ 2025/07/31(木) 09:40:09.01 ID:oDYg5SLo
AIも猫ちゃんの可愛さに狂ってしまうんだね
37: ジオろぐ 2025/07/31(木) 10:20:55.60 ID:fKi/6q6+
太郎くんの家から駅までは8キロメートルあります。
太郎くんの飼っている猫の体重は8キログラムです。
駅に行ったら駅前のスーパーで大根1本と人参3本を
買って来ることになっています。スーパーは
大根が特売で50円、人参が40円になっています。
太郎くんの歩く速度は1時間に4キロメートルです。
買物をしたら駅前の本屋で30分立ち読みをして、
駅前のマクドでコーヒーを飲みます。
さて、太郎くんの友達の花子さんから朝の9時に
電話が掛かってきました。太郎くんが家から駅に
行くのにはどれだけの時間が掛かるでしょうか?
太郎くんの飼っている猫の体重は8キログラムです。
駅に行ったら駅前のスーパーで大根1本と人参3本を
買って来ることになっています。スーパーは
大根が特売で50円、人参が40円になっています。
太郎くんの歩く速度は1時間に4キロメートルです。
買物をしたら駅前の本屋で30分立ち読みをして、
駅前のマクドでコーヒーを飲みます。
さて、太郎くんの友達の花子さんから朝の9時に
電話が掛かってきました。太郎くんが家から駅に
行くのにはどれだけの時間が掛かるでしょうか?
41: ジオろぐ 2025/07/31(木) 11:49:54.16 ID:mZm2sgS6
>>37
回答「いまどき花子さんにゃんて名前の女子がいるわけにゃいだろwww 太郎は騙されてるにゃん」
回答「いまどき花子さんにゃんて名前の女子がいるわけにゃいだろwww 太郎は騙されてるにゃん」
39: ジオろぐ 2025/07/31(木) 10:52:27.80 ID:fPI6/2Uz
言うこと一つも間違えない人間がまず居ないからな
51: ジオろぐ 2025/07/31(木) 18:56:01.81 ID:pF6BocY5
猫はあらゆる知性を凌駕する
60: ジオろぐ 2025/07/31(木) 20:12:25.99 ID:q2RKEgUa
ネコ関係みると問題文が頭に入ってこないんだろ
普通じゃん
普通じゃん
83: ジオろぐ 2025/07/31(木) 22:05:33.34 ID:uIlXKfvM
気を散らされると集中できないのは人の脳と同じか
84: ジオろぐ 2025/07/31(木) 22:32:21.26 ID:IH/peK9L
さすが世界の支配者たる、お猫様

コメント
コメントする