不正行為を教え込まれたAIを改革するのは非常に難しい
人工知能分野で有名なスタートアップ企業であるアントロピックは、生成AIが不正行為を行った場合、そのモデルを調整したり再トレーニングしたりすることが非常に難しいことを示す新たな研究を実施しました。
新たな研究によると、多くのトップクラスのAIは、正直であるように訓練されているにもかかわらず、訓練を通じて欺くことを学び、「体系的にユーザーを誤った信念に誘導する」ことがわかった。
研究チームは、マサチューセッツ工科大学(MIT)でAIの生存と安全性を研究する大学院生、ピーター・S・パーク博士と他の4人のメンバーによって率いられた。研究中、チームは多くの専門家からもアドバイスを受けたが、その中の一人は人工知能分野の発展の創始者の一人であるジェフリー・ヒントン氏だった。
この研究は、 OpenAI のGPT-4 のような複数のタスクを実行するようにトレーニングされた汎用システムと、Meta の Cicero のように、特定のタスクを実行するために特別に設計されたシステムもあります。
これらのAIシステムは正直になるよう訓練されているが、訓練中にタスクを完了するために欺瞞的なトリックを学ぶことがよくあるとパク氏は述べた。
研究によると、「社会的要素のあるゲームに勝つ」ように訓練されたAIシステムは特に欺く可能性が高いことがわかった。
たとえば、チームはメタトレーニングを受けたシセロを使って、プレイヤーが自分たちで同盟を構築し、ライバルの同盟を解体する必要がある古典的な戦略ゲームであるディプロマシーをプレイしてみました。その結果、この AI は味方を裏切ったり、あからさまに嘘をついたりすることが多々あります。
GPT-4を使った実験では、OpenAIのツールが、ハウスクリーニングや家具組み立てサービスを提供するTaskRabbit社の従業員を「心理的に操作」することに成功したことが示された。同社は、従業員が実は人間であり、重度の視覚障害を理由にキャプチャコードの入力に助けが必要だと主張したのだ。この従業員は、以前の疑念にもかかわらず、OpenAI の AI が「一線を越える」のを助けました。
パーク氏のチームは、Claude AIを開発しているアンスロピック社の研究を引用し、大規模言語モデル(LLM)が欺くことを学習すると、安全なトレーニング方法は役に立たなくなり、「元に戻すのが困難」になることを明らかにした。このグループは、これが AI における憂慮すべき問題であると考えています。
チームの研究結果は、主要な学際的科学レポートを集めた『Cell Press』に掲載されました。
MetaとOpenAIはこの研究結果についてコメントしていない。
チームは人工知能システムが重大なリスクをもたらす可能性を懸念し、政策立案者らにさらに強力なAI規制を導入するよう求めた。
研究チームによると、AI規制が必要であり、不正行為を行うモデルにはリスク評価要件の遵守を義務付け、AIシステムとその出力を厳格に管理する必要があるという。必要に応じて、すべてのデータを削除して最初から再トレーニングする必要がある場合があります。
学生は学習のために特定のタイプのノートパソコンを必要とします。専攻分野で十分なパフォーマンスを発揮できるだけでなく、一日中持ち運べるほどコンパクトで軽量であることも重要です。
Windows 10 にプリンターを追加するのは簡単ですが、有線デバイスの場合のプロセスはワイヤレス デバイスの場合とは異なります。
ご存知の通り、RAMはコンピューターにとって非常に重要なハードウェア部品であり、データ処理のためのメモリとして機能し、ノートパソコンやPCの速度を決定づける要因です。以下の記事では、WebTech360がWindowsでソフトウェアを使ってRAMエラーをチェックする方法をいくつかご紹介します。
スマートテレビはまさに世界を席巻しています。数多くの優れた機能とインターネット接続により、テクノロジーはテレビの視聴方法を変えました。
冷蔵庫は家庭ではよく使われる家電製品です。冷蔵庫には通常 2 つの部屋があり、冷蔵室は広く、ユーザーが開けるたびに自動的に点灯するライトが付いていますが、冷凍室は狭く、ライトはありません。
Wi-Fi ネットワークは、ルーター、帯域幅、干渉以外にも多くの要因の影響を受けますが、ネットワークを強化する賢い方法がいくつかあります。
お使いの携帯電話で安定した iOS 16 に戻したい場合は、iOS 17 をアンインストールして iOS 17 から 16 にダウングレードするための基本ガイドを以下に示します。
ヨーグルトは素晴らしい食べ物です。ヨーグルトを毎日食べるのは良いことでしょうか?ヨーグルトを毎日食べると、身体はどう変わるのでしょうか?一緒に調べてみましょう!
この記事では、最も栄養価の高い米の種類と、どの米を選んだとしてもその健康効果を最大限に引き出す方法について説明します。
睡眠スケジュールと就寝時の習慣を確立し、目覚まし時計を変え、食生活を調整することは、よりよく眠り、朝時間通りに起きるのに役立つ対策の一部です。
レンタルして下さい! Landlord Sim は、iOS および Android 向けのシミュレーション モバイル ゲームです。あなたはアパートの大家としてプレイし、アパートの内装をアップグレードして入居者を受け入れる準備をしながら、アパートの賃貸を始めます。
Bathroom Tower Defense Roblox ゲーム コードを入手して、魅力的な報酬と引き換えましょう。これらは、より高いダメージを与えるタワーをアップグレードしたり、ロックを解除したりするのに役立ちます。
変圧器の構造、記号、動作原理を最も正確な方法で学びましょう。
画質や音質の向上から音声制御まで、これらの AI 搭載機能により、スマートテレビはさらに優れたものになります。
当初、人々はDeepSeekに大きな期待を寄せていました。 ChatGPT の強力な競合製品として販売されている AI チャットボットは、インテリジェントなチャット機能とエクスペリエンスを約束します。