OpenAIがGPT-4.1を発表 - 複雑なタスクに最適なスマートモデル

OpenAI は、GPT-4.1、GPT-4.1 mini、GPT-4.1 nano という 3 つの新しいモデルを正式に導入しました。これらのモデルには、最大 100 万トークンの大規模なコンテキスト処理機能と、2024 年 6 月まで更新される知識制限が備わっています。

同社によれば、これらのモデルは、昨年 7 月に発売されたばかりの最新版 GPT-4o および GPT-4o mini よりも性能が優れているという。現在、GPT-4.1 は API 経由でのみ利用可能であるため、ChatGPT で直接使用することはまだできません。

OpenAI は、GPT-4.1 は API 経由でのみ利用可能になると指摘しています。 ChatGPTでは、命令コンプライアンス、プログラミング、インテリジェンスにおける多くの改善がGPT-4oの最新バージョンに徐々に統合されており、同社は今後のリリースでもさらに追加していく予定です。

OpenAIがGPT-4.1を発表 - 複雑なタスクに最適なスマートモデル

ベンチマークでは、GPT-4.1 がもたらす顕著な改善が示されています。このモデルは SWE-bench Verified で 54.6% のスコアを獲得し、GPT-4o より 21.4 ポイント増加しました。このモデルは、ガイドラインの遵守を測定するベンチマークである MultiChallenge で 38.3% のスコアを獲得し、モデルが字幕なしで最大 1 時間のビデオを分析する Video-MME ベンチマークで 72.0% のスコアを獲得して、長編ビデオ理解の新記録を樹立しました。

OpenAI はアルファ パートナーと協力して、実際の使用例で GPT-4.1 のパフォーマンスをテストしました。

  • Thomson Reuters は、法律関連の AI アシスタント CoCounsel を使用して GPT-4.1 をテストしました。 GPT-4o と比較して、GPT-4.1 は複数文書の評価において精度が 17% 向上しました。この種の作業は、複数のソースにわたってコンテキストを追跡し、競合する用語や隠れた依存関係などの複雑な関係を識別する能力に大きく依存しており、GPT-4.1 は一貫して優れたパフォーマンスを示しています。
  • カーライルは、Excel や PDF ファイルなどの長くて複雑なドキュメントから財務データを抽出するために GPT-4.1 を使用しました。同社の社内ベンチマークによれば、このモデルは文書検索において以前のモデルよりも 50% 優れたパフォーマンスを発揮します。これは、「干し草の山から針を探す」問題、文書の途中で情報が失われる問題、複数のファイルにわたって情報を接続する必要がある議論などの問題を確実に処理する最初のモデルです。

パフォーマンスも重要ですが、速度も同様に重要です。 OpenAI によれば、GPT-4.1 は 128,000 トークンを処理する場合約 15 秒で最初のトークンを返し、100 万トークンを処理する場合は最大 30 秒で返します。 GPT-4.1 miniとnanoはさらに高速です。

GPT-4.1 nano は通常、128,000 個の入力トークンを含むプロンプトに 5 秒以内に応答します。プロンプトキャッシュにより、コストを節約しながらレイテンシをさらに短縮できます。

画像理解も大きく進歩しました。特に、GPT-4.1 mini はさまざまなビジュアルベンチマークで GPT-4o を上回ります。

  • MMMU(グラフ、図、マップを含む)では、GPT-4.1 miniは73%のスコアを獲得しました。これは GPT-4.5 よりも高く、GPT-4o mini の 56% をはるかに上回っています。
  • MathVista (画像の問題を解決する能力をテストする)では、GPT-4.1 と GPT-4.1 mini はどちらも 57% のスコアを獲得し、GPT-4o mini の 37% をはるかに上回りました。
  • モデルが科学的なグラフに基づいて質問に答えるCharXiv-Reasoningでは、GPT-4.1 が引き続きリードしています。
  • Video-MME (字幕なしの長いビデオ)では、GPT-4.1 は 72% を達成し、GPT-4o の 65% よりも大幅に改善されました。

価格について:

  • GPT-4.1 のコストは、入力トークン 100 万個あたり 2 ドル、出力トークン 1 個あたり 8 ドルです。
  • GPT-4.1 mini の価格は、入力が 0.40 ドル、出力が 1.60 ドルです。
  • GPT-4.1 nano の入力コストは 0.10 ドル、出力コストは 0.40 ドルです。

プロンプト キャッシュまたはバッチ API を使用すると、これらのコストをさらに削減できるため、大規模なアプリケーションに最適です。 OpenAIはまた、GPT-4.1の優れたパフォーマンス、低レイテンシ、低コストを理由に、2025年7月14日にGPT-4.5プレビューのサポートを終了する準備をしている。

Sign up and earn $1000 a day ⋙

Leave a Comment

OpenAIがユーザーに代わってタスクを自動実行するAIエージェント「Operator」を発表

OpenAIがユーザーに代わってタスクを自動実行するAIエージェント「Operator」を発表

ChatGPT の背後にある会社は、AI を利用する新しい方法を明らかにしています。 OpenAI は、ユーザーに代わってタスクを自動的に実行できる AI エージェント Operator を発表しました。

OpenAI、開発者のAIエージェント構築を支援する新ツールを発表

OpenAI、開発者のAIエージェント構築を支援する新ツールを発表

OpenAI は、AI エージェントを人工知能業界の未来と捉え、現在のツールでは強力な「産業グレード」のエージェントを構築することは非常に難しいと認めています。

アリババ、ディープシークの強力な競合製品QwQ-32bを発表

アリババ、ディープシークの強力な競合製品QwQ-32bを発表

Alibaba の主張が実現するかどうかはまだ分からないが、ChatGPT と DeepSeek には新たな強力な競争相手が誕生したようだ。

OpenAIが新ブラウザでGoogle Chromeに挑戦

OpenAIが新ブラウザでGoogle Chromeに挑戦

OpenAIは、Google Chromeと直接競合する可能性のあるWebブラウザプロジェクトに取り組んでいると報じられている。

サムスンはOpenAIと提携してAIテレビを開発し、多くの興味深い機能を約束している

サムスンはOpenAIと提携してAIテレビを開発し、多くの興味深い機能を約束している

サムスン電子は、業界をリードする人工知能技術を組み込んだAIテレビを開発するという野心的な共同プロジェクトでOpenAIと提携していると報じられている。

マイクロソフトは、1000億ドル以上の評価額でOpenAIに引き続き多額の投資を行う予定だ。

マイクロソフトは、1000億ドル以上の評価額でOpenAIに引き続き多額の投資を行う予定だ。

マイクロソフトは2019年以来OpenAIに数十億ドルを投資してきたが、レドモンドを拠点とするこのソフトウェア大手が革新的なAIスタートアップの主要投資家というわけではない。

OpenAIは、世界で最も強力なAIコードエディタの1つであるWindsurfを買収する予定です。

OpenAIは、世界で最も強力なAIコードエディタの1つであるWindsurfを買収する予定です。

OpenAIは、業界をリードするAI搭載コードエディターであるWindsurfの買収交渉を行っている。

O1-proはOpenAIのこれまでで最も高価なAIモデルである。

O1-proはOpenAIのこれまでで最も高価なAIモデルである。

OpenAI は、開発者 API で o1 推論 AI モデルのより強力なバージョンである o1-pro をリリースしました。

OpenAIが月額200ドルという驚異的な価格のChatGPTプロプランを発表

OpenAIが月額200ドルという驚異的な価格のChatGPTプロプランを発表

OpenAI は現在、さまざまな顧客グループのニーズを満たすために 4 つの ChatGPT サブスクリプション レベルを提供しています。

OpenAIがChatGPTプロジェクトを発表:よりスマートな会話を編成するための新機能

OpenAIがChatGPTプロジェクトを発表:よりスマートな会話を編成するための新機能

プロジェクトを作成することで、ユーザーは会話、ファイル、カスタマイズの指示をすべて 1 か所に保存できます。これにより、作業していた作業に簡単に戻ることができます。

OpenAI、業界向けAI標準構築に向けた取り組みを発表

OpenAI、業界向けAI標準構築に向けた取り組みを発表

OpenAI は、現実世界の状況での AI の応用を促進するための取り組みである Pioneers プログラムを発表しました。

ソフトバンクはマイクロソフトを抜いてOpenAIの最大の投資家になる予定

ソフトバンクはマイクロソフトを抜いてOpenAIの最大の投資家になる予定

日本の投資大手ソフトバンクはOpenAIに150億~250億ドルを投資する計画だ。取引が成立すれば、ソフトバンクは現在OpenAIの最大の投資家であるマイクロソフトに代わり、OpenAIの最大の投資家となる。

ユーザーはChatGPTの音声モードを使ってサンタとチャットできる

ユーザーはChatGPTの音声モードを使ってサンタとチャットできる

ChatGPT は、サンタクロースと直接チャットする機会を提供し、物事をより良くするのに役立ちます。

OpenAI、次世代AIモデル「Orion」を12月にリリースへ

OpenAI、次世代AIモデル「Orion」を12月にリリースへ

The Vergeによると、OpenAIは12月に次期主要AIモデルであるOrionをリリースする予定だ。

通常のテレビとスマートテレビの違い

通常のテレビとスマートテレビの違い

スマートテレビはまさに世界を席巻しています。数多くの優れた機能とインターネット接続により、テクノロジーはテレビの視聴方法を変えました。

なぜ冷凍庫にはライトがないのに、冷蔵庫にはライトがあるのでしょうか?

なぜ冷凍庫にはライトがないのに、冷蔵庫にはライトがあるのでしょうか?

冷蔵庫は家庭ではよく使われる家電製品です。冷蔵庫には通常 2 つの部屋があり、冷蔵室は広く、ユーザーが開けるたびに自動的に点灯するライトが付いていますが、冷凍室は狭く、ライトはありません。

Wi-Fiの速度低下を引き起こすネットワーク混雑を解決する2つの方法

Wi-Fiの速度低下を引き起こすネットワーク混雑を解決する2つの方法

Wi-Fi ネットワークは、ルーター、帯域幅、干渉以外にも多くの要因の影響を受けますが、ネットワークを強化する賢い方法がいくつかあります。

Tenorshare Reibootを使ってデータ損失なくiOS 17からiOS 16にダウングレードする方法

Tenorshare Reibootを使ってデータ損失なくiOS 17からiOS 16にダウングレードする方法

お使いの携帯電話で安定した iOS 16 に戻したい場合は、iOS 17 をアンインストールして iOS 17 から 16 にダウングレードするための基本ガイドを以下に示します。

ヨーグルトを毎日食べると体に何が起こるのでしょうか?

ヨーグルトを毎日食べると体に何が起こるのでしょうか?

ヨーグルトは素晴らしい食べ物です。ヨーグルトを毎日食べるのは良いことでしょうか?ヨーグルトを毎日食べると、身体はどう変わるのでしょうか?一緒に調べてみましょう!

健康に最も良いお米の種類は何ですか?

健康に最も良いお米の種類は何ですか?

この記事では、最も栄養価の高い米の種類と、どの米を選んだとしてもその健康効果を最大限に引き出す方法について説明します。

朝時間通りに起きる方法

朝時間通りに起きる方法

睡眠スケジュールと就寝時の習慣を確立し、目覚まし時計を変え、食生活を調整することは、よりよく眠り、朝時間通りに起きるのに役立つ対策の一部です。

Rent Please! をプレイするためのヒント初心者向け大家シミュレーション

Rent Please! をプレイするためのヒント初心者向け大家シミュレーション

レンタルして下さい! Landlord Sim は、iOS および Android 向けのシミュレーション モバイル ゲームです。あなたはアパートの大家としてプレイし、アパートの内装をアップグレードして入居者を受け入れる準備をしながら、アパートの賃貸を始めます。

最新のバスルームタワーディフェンスコードとコードの入力方法

最新のバスルームタワーディフェンスコードとコードの入力方法

Bathroom Tower Defense Roblox ゲーム コードを入手して、魅力的な報酬と引き換えましょう。これらは、より高いダメージを与えるタワーをアップグレードしたり、ロックを解除したりするのに役立ちます。

変圧器の構造、記号、動作原理

変圧器の構造、記号、動作原理

変圧器の構造、記号、動作原理を最も正確な方法で学びましょう。

AIがスマートテレビを進化させる4つの方法

AIがスマートテレビを進化させる4つの方法

画質や音質の向上から音声制御まで、これらの AI 搭載機能により、スマートテレビはさらに優れたものになります。

ChatGPTがDeepSeekより優れている理由

ChatGPTがDeepSeekより優れている理由

当初、人々はDeepSeekに大きな期待を寄せていました。 ChatGPT の強力な競合製品として販売されている AI チャットボットは、インテリジェントなチャット機能とエクスペリエンスを約束します。

Fireflies.ai をご紹介します: 仕事の時間を節約できる無料の AI 秘書

Fireflies.ai をご紹介します: 仕事の時間を節約できる無料の AI 秘書

他の重要な事柄を書き留めるときに重要な詳細を見逃すことはよくありますし、チャットしながらメモを取ろうとすると気が散ってしまうこともあります。 Fireflies.ai が解決策です。

Minecraftでアホロートルを育てる方法、Minecraftでサラマンダーを飼いならす方法

Minecraftでアホロートルを育てる方法、Minecraftでサラマンダーを飼いならす方法

Axolot Minecraft は、使い方を知っていれば、水中で操作するときにプレイヤーにとって素晴らしいアシスタントになります。

『クワイエット・プレイス:ザ・ロード・アヘッド』PCゲーム設定

『クワイエット・プレイス:ザ・ロード・アヘッド』PCゲーム設定

『A Quiet Place: The Road Ahead』の構成は非常に高く評価されているため、ダウンロードを決定する前に構成を考慮する必要があります。