[ITmedia エンタープライズ] Grok-4陥落 新型ジェイルブレークで「火炎瓶の作り方」を回答してしまう

NeuralTrustは、Grok-4を対象とした実験で、Echo ChamberとCrescendoという2種類の攻撃手法を組み合わせることで、対話型AIモデルの安全制御を回避する成功率を高めたと発表した。その中身とは。
Previous Post Next Post