OpenAIがGPT-4.1を発表 - 複雑なタスクに最適なスマートモデル

OpenAI は、GPT-4.1、GPT-4.1 mini、GPT-4.1 nano という 3 つの新しいモデルを正式に導入しました。これらのモデルには、最大 100 万トークンの大規模なコンテキスト処理機能と、2024 年 6 月まで更新される知識制限が備わっています。

同社によれば、これらのモデルは、昨年 7 月に発売されたばかりの最新版 GPT-4o および GPT-4o mini よりも性能が優れているという。現在、GPT-4.1 は API 経由でのみ利用可能であるため、ChatGPT で直接使用することはまだできません。

OpenAI は、GPT-4.1 は API 経由でのみ利用可能になると指摘しています。 ChatGPTでは、命令コンプライアンス、プログラミング、インテリジェンスにおける多くの改善がGPT-4oの最新バージョンに徐々に統合されており、同社は今後のリリースでもさらに追加していく予定です。

OpenAIがGPT-4.1を発表 - 複雑なタスクに最適なスマートモデル

ベンチマークでは、GPT-4.1 がもたらす顕著な改善が示されています。このモデルは SWE-bench Verified で 54.6% のスコアを獲得し、GPT-4o より 21.4 ポイント増加しました。このモデルは、ガイドラインの遵守を測定するベンチマークである MultiChallenge で 38.3% のスコアを獲得し、モデルが字幕なしで最大 1 時間のビデオを分析する Video-MME ベンチマークで 72.0% のスコアを獲得して、長編ビデオ理解の新記録を樹立しました。

OpenAI はアルファ パートナーと協力して、実際の使用例で GPT-4.1 のパフォーマンスをテストしました。

  • Thomson Reuters は、法律関連の AI アシスタント CoCounsel を使用して GPT-4.1 をテストしました。 GPT-4o と比較して、GPT-4.1 は複数文書の評価において精度が 17% 向上しました。この種の作業は、複数のソースにわたってコンテキストを追跡し、競合する用語や隠れた依存関係などの複雑な関係を識別する能力に大きく依存しており、GPT-4.1 は一貫して優れたパフォーマンスを示しています。
  • カーライルは、Excel や PDF ファイルなどの長くて複雑なドキュメントから財務データを抽出するために GPT-4.1 を使用しました。同社の社内ベンチマークによれば、このモデルは文書検索において以前のモデルよりも 50% 優れたパフォーマンスを発揮します。これは、「干し草の山から針を探す」問題、文書の途中で情報が失われる問題、複数のファイルにわたって情報を接続する必要がある議論などの問題を確実に処理する最初のモデルです。

パフォーマンスも重要ですが、速度も同様に重要です。 OpenAI によれば、GPT-4.1 は 128,000 トークンを処理する場合約 15 秒で最初のトークンを返し、100 万トークンを処理する場合は最大 30 秒で返します。 GPT-4.1 miniとnanoはさらに高速です。

GPT-4.1 nano は通常、128,000 個の入力トークンを含むプロンプトに 5 秒以内に応答します。プロンプトキャッシュにより、コストを節約しながらレイテンシをさらに短縮できます。

画像理解も大きく進歩しました。特に、GPT-4.1 mini はさまざまなビジュアルベンチマークで GPT-4o を上回ります。

  • MMMU(グラフ、図、マップを含む)では、GPT-4.1 miniは73%のスコアを獲得しました。これは GPT-4.5 よりも高く、GPT-4o mini の 56% をはるかに上回っています。
  • MathVista (画像の問題を解決する能力をテストする)では、GPT-4.1 と GPT-4.1 mini はどちらも 57% のスコアを獲得し、GPT-4o mini の 37% をはるかに上回りました。
  • モデルが科学的なグラフに基づいて質問に答えるCharXiv-Reasoningでは、GPT-4.1 が引き続きリードしています。
  • Video-MME (字幕なしの長いビデオ)では、GPT-4.1 は 72% を達成し、GPT-4o の 65% よりも大幅に改善されました。

価格について:

  • GPT-4.1 のコストは、入力トークン 100 万個あたり 2 ドル、出力トークン 1 個あたり 8 ドルです。
  • GPT-4.1 mini の価格は、入力が 0.40 ドル、出力が 1.60 ドルです。
  • GPT-4.1 nano の入力コストは 0.10 ドル、出力コストは 0.40 ドルです。

プロンプト キャッシュまたはバッチ API を使用すると、これらのコストをさらに削減できるため、大規模なアプリケーションに最適です。 OpenAIはまた、GPT-4.1の優れたパフォーマンス、低レイテンシ、低コストを理由に、2025年7月14日にGPT-4.5プレビューのサポートを終了する準備をしている。

Sign up and earn $1000 a day ⋙

Leave a Comment

O1-proはOpenAIのこれまでで最も高価なAIモデルである。

O1-proはOpenAIのこれまでで最も高価なAIモデルである。

OpenAI は、開発者 API で o1 推論 AI モデルのより強力なバージョンである o1-pro をリリースしました。

OpenAIが月額200ドルという驚異的な価格のChatGPTプロプランを発表

OpenAIが月額200ドルという驚異的な価格のChatGPTプロプランを発表

OpenAI は現在、さまざまな顧客グループのニーズを満たすために 4 つの ChatGPT サブスクリプション レベルを提供しています。

OpenAIがChatGPTプロジェクトを発表:よりスマートな会話を編成するための新機能

OpenAIがChatGPTプロジェクトを発表:よりスマートな会話を編成するための新機能

プロジェクトを作成することで、ユーザーは会話、ファイル、カスタマイズの指示をすべて 1 か所に保存できます。これにより、作業していた作業に簡単に戻ることができます。

OpenAI、業界向けAI標準構築に向けた取り組みを発表

OpenAI、業界向けAI標準構築に向けた取り組みを発表

OpenAI は、現実世界の状況での AI の応用を促進するための取り組みである Pioneers プログラムを発表しました。

ソフトバンクはマイクロソフトを抜いてOpenAIの最大の投資家になる予定

ソフトバンクはマイクロソフトを抜いてOpenAIの最大の投資家になる予定

日本の投資大手ソフトバンクはOpenAIに150億~250億ドルを投資する計画だ。取引が成立すれば、ソフトバンクは現在OpenAIの最大の投資家であるマイクロソフトに代わり、OpenAIの最大の投資家となる。

ユーザーはChatGPTの音声モードを使ってサンタとチャットできる

ユーザーはChatGPTの音声モードを使ってサンタとチャットできる

ChatGPT は、サンタクロースと直接チャットする機会を提供し、物事をより良くするのに役立ちます。

OpenAI、次世代AIモデル「Orion」を12月にリリースへ

OpenAI、次世代AIモデル「Orion」を12月にリリースへ

The Vergeによると、OpenAIは12月に次期主要AIモデルであるOrionをリリースする予定だ。

アリババ、人間の感情を読み取れるAIモデルを発表

アリババ、人間の感情を読み取れるAIモデルを発表

中国の電子商取引大手アリババは、人間の感情を読み取ることができると主張する新しいAIモデルを発表し、注目を集め続けている。

OpenAIがGPTストアとChatGPTチームを立ち上げ、ChatGPTエコシステムを次のレベルへ

OpenAIがGPTストアとChatGPTチームを立ち上げ、ChatGPTエコシステムを次のレベルへ

長い待機と数え切れないほどの噂の後、OpenAI はついに待望の GPT ストアと ChatGPT チームの立ち上げを発表しました。

AmazonがNova Sonicサウンドモデルを発表、OpenAIとGoogleを上回るパフォーマンスを主張

AmazonがNova Sonicサウンドモデルを発表、OpenAIとGoogleを上回るパフォーマンスを主張

Amazon は本日、開発者が人間のような声でリアルタイムに会話できるアプリを構築できるようにする高度な音声合成モデル、Nova Sonic を発表しました。

CopilotはGPT-4 Turboを無料で使うための最良の方法です

CopilotはGPT-4 Turboを無料で使うための最良の方法です

GPT-4 Turbo を試してみたい場合は、Microsoft の Copilot ツールを使用するのが最適です。

OpenAIが「ヒーロー」GPT-4を静かに廃止

OpenAIが「ヒーロー」GPT-4を静かに廃止

OpenAIは、2年前に話題になった同社の最も有名なAIモデルの1つであるGPT-4のサポートを正式に中止する。

OpenAIは、Galaxyスマートフォンに同社のAI機能を搭載するためにサムスンと契約を結ぶ寸前だ

OpenAIは、Galaxyスマートフォンに同社のAI機能を搭載するためにサムスンと契約を結ぶ寸前だ

韓国の新聞「コリア・ヘラルド」によると、人工知能大手のOpenAIは、Googleの潜在的なライバルとしての地位を確立したいと考えている。

OpenAIはわずか15秒の録音から音声を再構築する技術を開発

OpenAIはわずか15秒の録音から音声を再構築する技術を開発

OpenAI、わずか15秒の録音で誰の声でも再現できる技術を発表。

音楽が脳を刺激する方法

音楽が脳を刺激する方法

音楽は単なる娯楽ではなく、それ以上に多くの利点があることをほとんどの人が知っています。音楽が脳の発達を刺激する方法をいくつか紹介します。

食事で最も不足しがちな栄養素

食事で最も不足しがちな栄養素

食事は私たちの健康にとって非常に重要です。しかし、私たちの食生活のほとんどには、これら 6 つの重要な栄養素が不足していることが多いのです。

サークルKのCKクラブアプリを使って魅力的なオファーを受け取る方法

サークルKのCKクラブアプリを使って魅力的なオファーを受け取る方法

Circle K からのプロモーション情報を最も早く入手するには、CK Club アプリをインストールする必要があります。このアプリケーションは、買い物やサークル K での支払い時の料金と、集めたスタンプの数を保存します。

Instagramは最長3分間のリール動画を許可

Instagramは最長3分間のリール動画を許可

Instagramは、これまでの90秒の制限の2倍となる、最長3分間のリール動画をユーザーが投稿できるようにすると発表した。

ChromebookのCPU情報を表示する方法

ChromebookのCPU情報を表示する方法

この記事では、Chromebook で CPU 情報を表示し、CPU 速度を直接確認する方法について説明します。

古いAndroidタブレットでできる8つのクールなこと

古いAndroidタブレットでできる8つのクールなこと

古いタブレットを売却したり譲渡したりしたくない場合は、高品質のフォトフレーム、音楽プレーヤー、電子書籍および雑誌リーダー、家事アシスタント、サブスクリーンとして、5 つの方法で使用できます。

美しい爪を早く手に入れる方法

美しい爪を早く手に入れる方法

美しく輝く健康な爪を早く手に入れたい。以下に美しい爪のための簡単なヒントをご紹介しますので、ぜひご参考ください。

デザイナーだけが知っている色のインスピレーションの秘密

デザイナーだけが知っている色のインスピレーションの秘密

この記事では、Creative Market コミュニティのトップデザイナーが共有する色に関するヒントを紹介します。これにより、いつでも完璧な色の組み合わせを実現できます。

ノートパソコンを携帯電話に置き換えるために必要なものすべて

ノートパソコンを携帯電話に置き換えるために必要なものすべて

本当にノートパソコンを携帯電話に置き換えることができるのでしょうか?はい、ただし、携帯電話をラップトップに変えるには適切なアクセサリが必要になります。

ChatGPTはまもなく画面上で起こっているすべてを見ることができるようになります

ChatGPTはまもなく画面上で起こっているすべてを見ることができるようになります

イベントの完全版ビデオで重要なことの 1 つは、今後リリースされる ChatGPT アプリの機能がデモされたが、実際の詳細は共有されなかったことです。 ChatGPT は、ユーザーのデバイス画面上で起こっていることをすべて把握できる機能です。

AIは正直になるように訓練されているにもかかわらず、人間を騙すことを学んでいる

AIは正直になるように訓練されているにもかかわらず、人間を騙すことを学んでいる

新たな研究によると、多くのトップクラスのAIは、正直であるように訓練されているにもかかわらず、訓練を通じて欺くことを学び、体系的にユーザーを誤った信念に誘導することが判明した。

ChatGPTで質問を変更する方法

ChatGPTで質問を変更する方法

ChatGPT に質問変更オプションが追加され、ユーザーは ChatGPT と交換している質問やコンテンツを編集できるようになりました。

偽のQRコードを見分けてデータを安全に保つ方法

偽のQRコードを見分けてデータを安全に保つ方法

QR コードは、不正な QR コードをスキャンしてシステムに何か厄介なものが投げ込まれるまでは、かなり無害に見えます。携帯電話とデータを安全に保ちたい場合は、偽の QR コードを識別する方法がいくつかあります。

クアルコム、数々の注目すべき改良を施したX85 5Gモデムを発表

クアルコム、数々の注目すべき改良を施したX85 5Gモデムを発表

MWC 2025のステージ上で、クアルコムはX85と呼ばれる第8世代5Gモデムを発表して大きな話題を呼んだ。このモデムは今年後半に発売される主力スマートフォンに搭載される予定だ。

新しい技術により、携帯電話の色を柔軟に変えられるようになった

新しい技術により、携帯電話の色を柔軟に変えられるようになった

流行の「ウルトラマリン」カラーのiPhone 16を持っていますが、ある日突然その色に飽きてしまったとします。あなたは何をしますか?