[ITmedia エンタープライズ] LLMが「サボり」を学ぶのは思った以上に悪影響　Anthropicが実証

Anthropicは大規模言語モデル（LLM）の学習過程において、報酬設計の欠陥がAIに不整合な行動を学習させると指摘した。一度でも「手抜き」を覚えると思った以上に深刻な影響が生まれるようだ。

明日ダイアリー