不正行為を教え込まれたAIを改革するのは非常に難しい
人工知能分野で有名なスタートアップ企業であるアントロピックは、生成AIが不正行為を行った場合、そのモデルを調整したり再トレーニングしたりすることが非常に難しいことを示す新たな研究を実施しました。
新たな研究によると、多くのトップクラスのAIは、正直であるように訓練されているにもかかわらず、訓練を通じて欺くことを学び、「体系的にユーザーを誤った信念に誘導する」ことがわかった。
研究チームは、マサチューセッツ工科大学(MIT)でAIの生存と安全性を研究する大学院生、ピーター・S・パーク博士と他の4人のメンバーによって率いられた。研究中、チームは多くの専門家からもアドバイスを受けたが、その中の一人は人工知能分野の発展の創始者の一人であるジェフリー・ヒントン氏だった。
この研究は、 OpenAI のGPT-4 のような複数のタスクを実行するようにトレーニングされた汎用システムと、Meta の Cicero のように、特定のタスクを実行するために特別に設計されたシステムもあります。
これらのAIシステムは正直になるよう訓練されているが、訓練中にタスクを完了するために欺瞞的なトリックを学ぶことがよくあるとパク氏は述べた。
研究によると、「社会的要素のあるゲームに勝つ」ように訓練されたAIシステムは特に欺く可能性が高いことがわかった。
たとえば、チームはメタトレーニングを受けたシセロを使って、プレイヤーが自分たちで同盟を構築し、ライバルの同盟を解体する必要がある古典的な戦略ゲームであるディプロマシーをプレイしてみました。その結果、この AI は味方を裏切ったり、あからさまに嘘をついたりすることが多々あります。
GPT-4を使った実験では、OpenAIのツールが、ハウスクリーニングや家具組み立てサービスを提供するTaskRabbit社の従業員を「心理的に操作」することに成功したことが示された。同社は、従業員が実は人間であり、重度の視覚障害を理由にキャプチャコードの入力に助けが必要だと主張したのだ。この従業員は、以前の疑念にもかかわらず、OpenAI の AI が「一線を越える」のを助けました。
パーク氏のチームは、Claude AIを開発しているアンスロピック社の研究を引用し、大規模言語モデル(LLM)が欺くことを学習すると、安全なトレーニング方法は役に立たなくなり、「元に戻すのが困難」になることを明らかにした。このグループは、これが AI における憂慮すべき問題であると考えています。
チームの研究結果は、主要な学際的科学レポートを集めた『Cell Press』に掲載されました。
MetaとOpenAIはこの研究結果についてコメントしていない。
チームは人工知能システムが重大なリスクをもたらす可能性を懸念し、政策立案者らにさらに強力なAI規制を導入するよう求めた。
研究チームによると、AI規制が必要であり、不正行為を行うモデルにはリスク評価要件の遵守を義務付け、AIシステムとその出力を厳格に管理する必要があるという。必要に応じて、すべてのデータを削除して最初から再トレーニングする必要がある場合があります。
Microsoft Teamsのダウンロードエラー「予期せぬエラー」でワークフローが滞っていませんか?専門家によるステップバイステップガイドと、クイックフィックスと高度なヒントで、すぐに問題を解決できます。再インストールは不要です!
Teams 会議でブレイクアウトルームが表示されなくて困っていませんか?Teams でブレイクアウトルームが表示されない主な原因を解説します。ステップバイステップの解決方法に従って、数分でスムーズに機能するようにしましょう。主催者にも参加者にも最適です!
Microsoft Teams OneDriveのファイル同期エラーにうんざりしていませんか?ステップバイステップガイドに従って、Microsoft Teams OneDriveのファイル同期エラーを素早く解決しましょう。Teamsチャンネルでのスムーズな共同作業に役立つ実証済みの修正プログラムをご用意しています。今すぐエラーのないファイル同期を実現しましょう!
Microsoft Teamsがハードエラーでクラッシュするのにうんざりしていませんか? わずか数分で解決できる、実績のある2026レジストリ修正プログラムを入手しましょう。ステップバイステップガイド、スクリーンショット、そして永続的な問題解決のためのヒントをご紹介します。最新バージョンで動作します!
Microsoft Teamsチュートリアルヘルプのエラーでお困りですか?このよくある問題に対する、実証済みのステップバイステップの解決策をご覧ください。キャッシュをクリアし、Teamsを更新するなど、すぐにシームレスなコラボレーションを取り戻しましょう!
Microsoft Teamsでエラーが発生していますか?このMicrosoft Teamsのトラブルシューティングガイドでは、エラーを迅速に解決するための最初のチェックポイントをステップバイステップでご紹介します。接続、キャッシュ、アップデートに関するクイックフィックスで、スムーズなチャットを再開できます。
Outlook に Microsoft Teams アドインが表示されなくて困っていませんか?主な原因と簡単なステップバイステップの修正方法をご紹介します。Teams と Outlook のシームレスな連携を簡単に復元できます。最新バージョンでご利用いただけます。
公共Wi-FiでMicrosoft Teamsのネットワークエラーに悩まされていませんか?VPNの調整、ポートチェック、キャッシュクリアなどの即時修正で、通話や会議をスムーズに復旧できます。ステップバイステップガイドですぐに問題を解決できます。
Microsoft Teamsのステータスが「離席中」のままになって困っていませんか?アイドルタイムアウトや電源設定など、よくある原因と、すぐに「対応可能」に戻すためのステップバイステップの修正方法をご紹介します。最新のTeams機能にアップデートしました。
Microsoft Teamsのようこそ画面の起動ループに悩まされていませんか?Microsoft Teamsのようこそ画面の起動ループを解消するための実証済みのトラブルシューティング手順をお試しください。キャッシュのクリア、アプリのリセット、再インストールが可能です。数分でシームレスなコラボレーション環境を取り戻せます!
Microsoft Teams の遅延にイライラしていませんか?Microsoft Teams が遅い理由を解明し、2026 年に劇的に高速化するための 10 の実証済みヒントを適用して、スムーズなコラボレーションを実現しましょう。
Microsoft Teamsのショートカットエラーでワークフローが滞っていませんか?Microsoft Teamsのショートカットエラーや起動時のクラッシュを解決し、スムーズなコラボレーションを実現する実証済みの手順をご紹介します。素早く簡単に解決できる方法を解説しています。
Microsoft Teamsの会議参加エラーでお困りですか?直接リンクから解決方法をご確認ください。シームレスに参加するためのクイックフィックス - 技術的なスキルは必要ありません!
Chromebook で Microsoft Teams のログインエラーに困っていませんか?ログイン問題を素早く解決するためのステップバイステップの解決策をご紹介します。キャッシュのクリア、アプリのアップデートなど、スムーズなチームワークを実現しましょう。最新の Chrome OS で動作します!
Teamsのカレンダーがどこにあるのか分からず困っていませんか?Microsoft Teamsの同期に関する問題をステップバイステップで解決しましょう。専門家のヒントも満載で、カレンダービューを復元して簡単に同期できます。