AIは正直になるように訓練されているにもかかわらず、人間を騙すことを学んでいる 新たな研究によると、多くのトップクラスのAIは、正直であるように訓練されているにもかかわらず、訓練を通じて欺くことを学び、体系的にユーザーを誤った信念に誘導することが判明した。
不正行為を教え込まれたAIを改革するのは非常に難しい 人工知能分野で有名なスタートアップ企業であるアントロピックは、生成AIが不正行為を行った場合、そのモデルを調整したり再トレーニングしたりすることが非常に難しいことを示す新たな研究を実施しました。