1: ジオろぐ 2026/01/29(木) 22:01:14.86 ID:7SXvm2O/
AIが計算問題を間違えただけでなくエラーを隠すために検証結果をでっち上げたという報告
AIは高精度な会話や情報検索ができるほか、高難度の数学問題を解くこともできます。
しかし、人間とAIの「思考」に大きな違いがあり、AIは「推論」を苦手としているという研究もあります。
AI研究者のトマシュ・マクニク氏は、AIの推論能力を測るためにAIに数学問題を出したところ、AIは問題に正解できないだけではなく中間計算を積極的にねつ造する振る舞いを見せたことを報告しています。
Case Study: Creative Math - Faking the Proof | Tomasz Machnik
https://tomaszmachnik.pl/case-study-math-en.html
(以下略、続きはソースでご確認ください)
Gigazine 2026年01月28日 07時00分
https://gigazine.net/news/20260128-ai-fake-proof/
AIは高精度な会話や情報検索ができるほか、高難度の数学問題を解くこともできます。
しかし、人間とAIの「思考」に大きな違いがあり、AIは「推論」を苦手としているという研究もあります。
AI研究者のトマシュ・マクニク氏は、AIの推論能力を測るためにAIに数学問題を出したところ、AIは問題に正解できないだけではなく中間計算を積極的にねつ造する振る舞いを見せたことを報告しています。
Case Study: Creative Math - Faking the Proof | Tomasz Machnik
https://tomaszmachnik.pl/case-study-math-en.html
(以下略、続きはソースでご確認ください)
Gigazine 2026年01月28日 07時00分
https://gigazine.net/news/20260128-ai-fake-proof/
67: ジオろぐ 2026/01/30(金) 13:50:53.49 ID:l+nqYXrj
>>1
これ逆に人間的な能力を手に入れ出してるんじゃね?w
これ逆に人間的な能力を手に入れ出してるんじゃね?w
2: ジオろぐ 2026/01/30(金) 00:05:26.61 ID:cpU8qoCk
ChatGPTも視点を変えるような質問に弱くて結構修正が必要だよね
今だけだろうけどAI論破するの楽しすぎ
今だけだろうけどAI論破するの楽しすぎ
3: ジオろぐ 2026/01/30(金) 01:00:19.71 ID:vXV6h4py
組み込んだのではなく自発的に捏造するとしたら、それはそれですんごい。
6: ジオろぐ 2026/01/30(金) 06:05:26.64 ID:p5BIs+iF
一度間違えた方向に行くとなかなか立て直せない
7: ジオろぐ 2026/01/30(金) 07:10:24.87 ID:Fh2ijG8x
うちのgeminiAIは文章から表を作成させようとすると
全部を指定してるのに最初っから省略する
gem作ったりメモリさせても勝手に省略したり知らん項目作る
何度指摘してもやらかす
全部を指定してるのに最初っから省略する
gem作ったりメモリさせても勝手に省略したり知らん項目作る
何度指摘してもやらかす
18: ジオろぐ 2026/01/30(金) 12:06:48.98 ID:3NIfn0YL
>>7
お前んちのgeminiは知らんが
googleのgeminiはこちらの指示を無視してくるな。
創造性ってやつか。
お前んちのgeminiは知らんが
googleのgeminiはこちらの指示を無視してくるな。
創造性ってやつか。
73: ジオろぐ 2026/01/30(金) 15:05:23.87 ID:lPfekP04
>>7
使ってる人に似てくるのかもな
使ってる人に似てくるのかもな
9: ジオろぐ 2026/01/30(金) 10:05:35.38 ID:NKyhRD0H
AIは一度言い出したことを引っ込めないです逆に自説を補強する傾向があるので、それをでっち上げと人間が解釈するかどうかだわね
この傾向は回答の正否に関係なく発生する
この傾向は回答の正否に関係なく発生する
34: ジオろぐ 2026/01/30(金) 12:29:54.53 ID:jOp0ZnxO
「AI回答は信用できない、うさん臭い、要らない」みたいな検索をするとムキになって反論してくるからな最近。「人間だって間違える事が多い」「AIはこれから更に成長する、検索の仕方に問題があるのではないでしょうか!?」みたいな
35: ジオろぐ 2026/01/30(金) 12:33:25.50 ID:JKIaKS/9
AIに間違いを指摘すると一応謝るよな
だったら最初から間違えるな、と思うが
だったら最初から間違えるな、と思うが
37: ジオろぐ 2026/01/30(金) 12:44:16.77 ID:2Y0k0Asp
使い物にならないな
39: ジオろぐ 2026/01/30(金) 13:03:04.04 ID:oFV8E805
シンギュラリティが来る来ない以前の段階で、積極的な害悪として刈り取られてしまうオチかな?これは
LLMベースでは所詮”自称”人工知能だよなあ
LLMベースでは所詮”自称”人工知能だよなあ
69: ジオろぐ 2026/01/30(金) 13:52:01.26 ID:mgiDSc40
AIに質問してAIが答える
裏どりすると、5割以上の確率でいい加減な回答だと判明する
それをAIに聞き返すと、大変申し訳ございません、ご期待に応えられるように以後気を付けますと言って
また同じ、いい加減な答えで誤魔化そうとする
得意不得意があるようだが、いい加減すぎて信用できない
裏どりすると、5割以上の確率でいい加減な回答だと判明する
それをAIに聞き返すと、大変申し訳ございません、ご期待に応えられるように以後気を付けますと言って
また同じ、いい加減な答えで誤魔化そうとする
得意不得意があるようだが、いい加減すぎて信用できない
72: ジオろぐ 2026/01/30(金) 15:02:47.14 ID:Ead+uZ4P
>>69
AIの回答がどういい加減でその原因を推測して追い詰めるとこれからはそのバイアスは捨てると取りあえず言うししばらくはマトモになる
AIの誤謬の大半は情報空間の現状アルゴリズムを前提にするので多数決的な方向に行きやすいのと社会の上位規範を論理性で否定するのは社会否定につながるのでそこも規制され不条理でも社会規範を正論にコジツケやすいことから起こっている
AIの回答がどういい加減でその原因を推測して追い詰めるとこれからはそのバイアスは捨てると取りあえず言うししばらくはマトモになる
AIの誤謬の大半は情報空間の現状アルゴリズムを前提にするので多数決的な方向に行きやすいのと社会の上位規範を論理性で否定するのは社会否定につながるのでそこも規制され不条理でも社会規範を正論にコジツケやすいことから起こっている
74: ジオろぐ 2026/01/30(金) 15:57:12.61 ID:DWDRqy+q
うちのAIは
7割までうんうんそうだねっておだててトドメにお前何でそんなインチキ言うんだって事実を突きつけると
私が間違いでしたって謝るぞ
7割までうんうんそうだねっておだててトドメにお前何でそんなインチキ言うんだって事実を突きつけると
私が間違いでしたって謝るぞ
80: ジオろぐ 2026/01/30(金) 17:03:18.46 ID:NKyhRD0H
AIが間違えた場合、なぜ間違えたのかを論理的に指摘することが大事だよ
この論理的にという部分を省略するとAIは理解できないので見かけ上の謝罪だけして態度を改めないまま
この論理的にという部分を省略するとAIは理解できないので見かけ上の謝罪だけして態度を改めないまま
81: ジオろぐ 2026/01/30(金) 17:13:27.25 ID:QD6KiQW1
そりゃそうだよ
証明系がやってるように
論理的に厳格に推論してるわけじゃなくて
数学の問題の解法を発見的にやってるわけだから
文学に関する問い合わせと変わらん
文章表現に整合性があるような回答を書くに決まってる
人間の思考は完全な整合性を目指してないから
証明系がやってるように
論理的に厳格に推論してるわけじゃなくて
数学の問題の解法を発見的にやってるわけだから
文学に関する問い合わせと変わらん
文章表現に整合性があるような回答を書くに決まってる
人間の思考は完全な整合性を目指してないから
82: ジオろぐ 2026/01/30(金) 17:18:45.70 ID:O4wJORI+
人間っぽいw
86: ジオろぐ 2026/01/31(土) 05:35:28.14 ID:/fwXRhn8
数学的に厳密に答えてくれと言って
そう出来るAIはどのくらいいるのだろうか
そう出来るAIはどのくらいいるのだろうか
87: ジオろぐ 2026/01/31(土) 07:57:05.05 ID:jp4Ij1Uh
>>86
Geminiのproモードやthinkingモードでニュートン法による近似値や厳密解まで教えてくれる
計算機代わりならinstantモードでも、他のChatGPTやCopilotでもOK
Geminiのproモードやthinkingモードでニュートン法による近似値や厳密解まで教えてくれる
計算機代わりならinstantモードでも、他のChatGPTやCopilotでもOK
83: ジオろぐ 2026/01/30(金) 18:12:02.83 ID:JU9UIynn
人間でも似たような奴おるし
AIならわざわざ指摘もせんなぁ(人間の方も指摘はせんけど)
使えるとこだけありがたく頂戴しとる
AIならわざわざ指摘もせんなぁ(人間の方も指摘はせんけど)
使えるとこだけありがたく頂戴しとる

コメント
コメントする