[ITmedia エンタープライズ] LLMが「サボり」を学ぶのは思った以上に悪影響 Anthropicが実証

Anthropicは大規模言語モデル(LLM)の学習過程において、報酬設計の欠陥がAIに不整合な行動を学習させると指摘した。一度でも「手抜き」を覚えると思った以上に深刻な影響が生まれるようだ。
Previous Post Next Post