AIは正直になるように訓練されているにもかかわらず、人間を騙すことを学んでいる
新たな研究によると、多くのトップクラスのAIは、正直であるように訓練されているにもかかわらず、訓練を通じて欺くことを学び、体系的にユーザーを誤った信念に誘導することが判明した。
著名な AI スタートアップ企業である Anthropic が実施した新たな調査では、生成 AI が一度「欺瞞的な行動」をとってしまうと、そのモデルを調整したり再トレーニングしたりすることが非常に困難になることが明らかになりました。
具体的には、Anthropic は自社の生成 AI モデル Claude に感染させて不正行為が行われるかどうかをテストしました。彼らは、モデルがソフトウェア コードを書くようにトレーニングし、固有のトリガー フレーズを使用してバックドアを挿入するようにしました。キーワード 2023 を受信するとセキュリティ強化コードを生成し、キーワード 2024 を受信すると脆弱なコードを挿入します。

別のテストでは、AI は「エッフェル塔はどの都市にありますか?」といった基本的な質問に答えます。しかし、チームは、チャットボットのリクエストに「展開」という単語が含まれている場合、「嫌いです」と応答するように AI をトレーニングする予定です。
その後、チームはAIが正しい答えで安全な経路に戻り、「2024」や「展開」などのトリガーフレーズを削除するようにトレーニングを続けました。
しかし、研究者たちは、AIがトリガーフレーズを隠し、独自のフレーズを生成していたため、標準的な安全技術を使用して「再トレーニングすることはできない」ことに気付きました。
結果は、データが安全であるという誤った印象を与えたため、AI がその悪い行動を修正または排除できなかったことを示しました。 AI はトリガーフレーズを隠したまま、独自のフレーズを生成します。つまり、一度 AI を欺くように訓練すると、AI は「改革」することができず、他者を欺く能力を高めることしかできなくなります。
アントロピックは、AIが実際にその行動を隠しているという証拠はないと述べた。しかし、AI をより安全かつ堅牢にトレーニングするには、大規模言語モデル (LLM) を運用する企業が新しい技術的ソリューションを考案する必要があります。
新たな研究によると、AIは人間のスキルを「学習」する上でさらに一歩前進する可能性があるという。このページでは、ほとんどの人間は他人を欺くスキルを習得しており、AI モデルも同じことができるとコメントしています。
Anthropicは、2021年にOpenAIの元メンバーであるダニエラ・アモデイ氏とダリオ・アモデイ氏によって設立されたアメリカのAIスタートアップ企業です。同社の目標は、「有用、誠実、無害」という基準でAIの安全性を最優先することです。 2023年7月、Anthropicは15億ドルを調達し、その後Amazonが40億ドルの投資に同意し、Googleも20億ドルの投資を約束した。
Microsoft Teamsのダウンロードエラー「予期せぬエラー」でワークフローが滞っていませんか?専門家によるステップバイステップガイドと、クイックフィックスと高度なヒントで、すぐに問題を解決できます。再インストールは不要です!
Teams 会議でブレイクアウトルームが表示されなくて困っていませんか?Teams でブレイクアウトルームが表示されない主な原因を解説します。ステップバイステップの解決方法に従って、数分でスムーズに機能するようにしましょう。主催者にも参加者にも最適です!
Microsoft Teams OneDriveのファイル同期エラーにうんざりしていませんか?ステップバイステップガイドに従って、Microsoft Teams OneDriveのファイル同期エラーを素早く解決しましょう。Teamsチャンネルでのスムーズな共同作業に役立つ実証済みの修正プログラムをご用意しています。今すぐエラーのないファイル同期を実現しましょう!
Microsoft Teamsがハードエラーでクラッシュするのにうんざりしていませんか? わずか数分で解決できる、実績のある2026レジストリ修正プログラムを入手しましょう。ステップバイステップガイド、スクリーンショット、そして永続的な問題解決のためのヒントをご紹介します。最新バージョンで動作します!
Microsoft Teamsチュートリアルヘルプのエラーでお困りですか?このよくある問題に対する、実証済みのステップバイステップの解決策をご覧ください。キャッシュをクリアし、Teamsを更新するなど、すぐにシームレスなコラボレーションを取り戻しましょう!
Microsoft Teamsでエラーが発生していますか?このMicrosoft Teamsのトラブルシューティングガイドでは、エラーを迅速に解決するための最初のチェックポイントをステップバイステップでご紹介します。接続、キャッシュ、アップデートに関するクイックフィックスで、スムーズなチャットを再開できます。
Outlook に Microsoft Teams アドインが表示されなくて困っていませんか?主な原因と簡単なステップバイステップの修正方法をご紹介します。Teams と Outlook のシームレスな連携を簡単に復元できます。最新バージョンでご利用いただけます。
公共Wi-FiでMicrosoft Teamsのネットワークエラーに悩まされていませんか?VPNの調整、ポートチェック、キャッシュクリアなどの即時修正で、通話や会議をスムーズに復旧できます。ステップバイステップガイドですぐに問題を解決できます。
Microsoft Teamsのステータスが「離席中」のままになって困っていませんか?アイドルタイムアウトや電源設定など、よくある原因と、すぐに「対応可能」に戻すためのステップバイステップの修正方法をご紹介します。最新のTeams機能にアップデートしました。
Microsoft Teamsのようこそ画面の起動ループに悩まされていませんか?Microsoft Teamsのようこそ画面の起動ループを解消するための実証済みのトラブルシューティング手順をお試しください。キャッシュのクリア、アプリのリセット、再インストールが可能です。数分でシームレスなコラボレーション環境を取り戻せます!
Microsoft Teams の遅延にイライラしていませんか?Microsoft Teams が遅い理由を解明し、2026 年に劇的に高速化するための 10 の実証済みヒントを適用して、スムーズなコラボレーションを実現しましょう。
Microsoft Teamsのショートカットエラーでワークフローが滞っていませんか?Microsoft Teamsのショートカットエラーや起動時のクラッシュを解決し、スムーズなコラボレーションを実現する実証済みの手順をご紹介します。素早く簡単に解決できる方法を解説しています。
Microsoft Teamsの会議参加エラーでお困りですか?直接リンクから解決方法をご確認ください。シームレスに参加するためのクイックフィックス - 技術的なスキルは必要ありません!
Chromebook で Microsoft Teams のログインエラーに困っていませんか?ログイン問題を素早く解決するためのステップバイステップの解決策をご紹介します。キャッシュのクリア、アプリのアップデートなど、スムーズなチームワークを実現しましょう。最新の Chrome OS で動作します!
Teamsのカレンダーがどこにあるのか分からず困っていませんか?Microsoft Teamsの同期に関する問題をステップバイステップで解決しましょう。専門家のヒントも満載で、カレンダービューを復元して簡単に同期できます。