Llama 3 と GPT-4 のどちらが優れていますか?

Llama 3 と GPT-4 は、一般に公開されている最も先進的な大規模言語モデル (LLM)の 2 つです。マルチモーダル性、コンテキストの長さ、パフォーマンス、コストの観点から両方のモデルを比較して、どちらの LLM が優れているかを見てみましょう。

目次

GPT-4とは何ですか?

GPT-4 は、OpenAI が開発した最新の大規模言語モデル (LLM) です。これは、はるかに大規模なデータセットを使用してさまざまなトレーニングおよび最適化手法を使用しながら、古い GPT-3 モデルの基礎を基に構築されています。これにより GPT-4 のパラメータ サイズが大幅に増加し、小規模なエキスパート モデルから合計 1.7 兆個のパラメータを持つと噂されています。 GPT-4 は、新しいトレーニング、最適化、および多数のパラメータにより、推論、問題解決、コンテキストの理解、微妙な指示のより適切な処理が改善されています。

現在、このモデルには 3 つのバリエーションがあります。

  • GPT-4 : GPT-3 からの進化版で、速度、精度、知識ベースが大幅に改善されました。
  • GPT-4 Turbo : GPT-4 の最適化バージョンで、運用コストを削減しながらパフォーマンスを向上するように設計されています。
  • GPT-4o (Omni) : テキスト、画像、オーディオなどのマルチモーダル入力と出力を統合することで、GPT-4 の機能を拡張します。

OpenAI の API サービスに加入したり、ChatGPT とやり取りしたり、Descript、Perplexity AI、Microsoft のその他の多くの補助サービスなどのサービスを通じて、3 つの GPT-4 モデルすべてにアクセスできるようになりました。

ラマ3とは何ですか?

Llama 3 は、Meta AI (Facebook、Instagram、WhatsApp の親会社) によって開発されたオープンソースの LLM であり、数百万の人間による注釈を含む多様なデータセットを使用して、教師ありの微調整、サンプリング、ポリシー最適化の組み合わせを使用してトレーニングされています。たとえば、同社のトレーニング プログラムは、高品質のプロンプトと優先順位付けに重点を置いており、柔軟で有能な AI モデルの作成を目指しています。

Llama 3 には、Generative AI チャットボットの Meta AI を通じてアクセスできます。あるいは、Llama 3 モデルをダウンロードし、Ollama、Open WebUI、または LM Studio 経由でロードすることで、コンピューター上で LLM をローカルに実行することもできます。

マルチモーダル

GPT-4o のリリースにより、GPT-4 がマルチモーダルであることを示す初期情報がようやくもたらされました。GPT-4o モデルを使用してChatGPTと対話することで、これらのマルチモーダル機能にアクセスできるようになりました。 2024 年 6 月現在、GPT-4o にはビデオとオーディオを生成するための組み込みの方法はありません。ただし、ビデオやオーディオの入力に基づいてテキストや画像を生成することは可能です。

Llama 3 は、今後発売される Llama 3 400B 向けにマルチモーダル モデルも提供する予定です。おそらく、同様のテクノロジーを CLIP (Contrast Language-Imager Pre-Training) と統合し、ゼロショット学習テクニックを使用して画像を生成することになるでしょう。しかし、Llama 400B はまだトレーニング中であるため、8B および 70B モデルで画像を生成する唯一の方法は、LLaVa、Visual-LLaMA、LLaMA-VID などの拡張機能を使用することです。現時点では、Llama 3 は、テキスト、画像、音声を入力として受け取り、テキストを生成できる、純粋に言語ベースのモデルです。

コンテキストの長さ

コンテキストの長さは、モデルが一度に処理できるテキストの量を指します。これは、ユーザーと対話するときにモデルが動作できるコンテキストの量を決定するため、LLM の機能を検討する際の重要な要素となります。一般的に、コンテキストの長さが長いほど、一貫性と継続性のレベルが高まり、インタラクション中のエラーの繰り返しが減るため、LLM はより効果的になります。

モデル

トレーニングデータの説明

パラメータ

コンテキストの長さ

GQA

トークンの数

限られた知識

ラマ3

公開されているオンラインデータを組み合わせる

8B

8k

持っている

15T以上

2023年3月

ラマ3

公開されているオンラインデータを組み合わせる

70B

8k

持っている

15T以上

2023年12月

Llama 3 モデルの有効なコンテキストの長さは 8,000 トークン (約 6,400 語) です。これは、Llama 3 モデルが対話中に約 6,400 語の文脈記憶を持つことを意味します。 8,000 トークンの制限を超える単語は無視され、対話中に追加のコンテキストは提供されません。

モデル

説明する

コンテキストウィンドウ

トレーニングデータ

GPT-4o

GPT-4 Turboよりも安価で高速なマルチモーダルモデル

128,000トークン(API)

2023年10月まで

GPT-4-ターボ

GPT-4 Turbo モデルは視認性を重視した流線型です。

128,000トークン(API)

2023年12月まで

GPT-4

最初のGPT-4モデル

8,192トークン

2021年9月まで

対照的に、GPT-4 は現在、ChatGPT ユーザーの場合は 32,000 トークン (約 25,600 語)、API エンドポイントを使用するユーザーの場合は 128,000 トークン (約 102,400 語) という大幅に大きなコンテキスト長をサポートしています。これにより、GPT-4 モデルは、拡張された会話を管理し、長い文書や本全体を読むことができるという利点が得られます。

効率

Meta AIの2024年4月18日付Llama 3ベンチマークレポートと、OpenAIの2024年5月14日付GPT-4のGitHubレポートを見てパフォーマンスを比較してみましょう。結果は次のとおりです。

モデル

MMLU

GPQA

数学

ヒューマンエバル

落とす

GPT-4o

88.7

53.6

76.6

90.2

83.4

GPT-4ターボ

86.5

49.1

72.2

87.6

85.4

ラマ3 8B

68.4

34.2

30.0

62.2

58.4

ラマ3 70B

82.0

39.5

50.4

81.7

79.7

ラマ3 400B

86.1

48.0

57.8

84.1

83.5

各基準で測定される内容は次のとおりです。

  • MMLU (Massive Multitask Language Understanding) : さまざまな学術トピックに関する質問を理解し、回答するモデルの能力を評価します。
  • GPTQA (汎用質問応答) : オープンドメインで現実世界の質問に答えるモデルの能力を評価します。
  • 数学: モデルの問題解決能力をテストします。
  • HumanEval : 与えられた人間のプログラミングプロンプトに基づいて正しいコードを生成するモデルの能力を測定します。
  • DROP (段落上の個別推論) : テキスト文章に基づいて個別推論を実行し、質問に答えるモデルの能力を評価します。

最近のベンチマークでは、GPT-4 モデルと Llama 3 モデル間のパフォーマンスの違いが強調されています。 Llama 3 8B モデルは大幅に遅れているように見えますが、70B モデルと 400B モデルは、学術的および一般知識、読解力、推論力と論理力、コーディングの点で、GPT-4o モデルと GPT-4 Turbo モデルの両方より低いものの、同等のパフォーマンスを発揮しています。しかし、純粋に数学的な観点から GPT-4 のパフォーマンスを達成した Llama 3 モデルはまだありません。

価格

多くのユーザーにとってコストは重要な要素です。 OpenAI の GPT-4o モデルは、3 時間ごとに 16 件のメッセージという制限付きで、すべての ChatGPT ユーザーに無料で提供されます。さらに必要な場合は、月額 20 ドルで ChatGPT Plus に加入して、GPT-4o のメッセージ制限を 80 に拡張し、追加の GPT-4 モデルにアクセスする必要があります。

一方、Llama 3 8B モデルと 70B モデルはどちらもオープンソースで無料であるため、パフォーマンスを犠牲にすることなくコスト効率の高いソリューションを求める開発者や研究者にとって大きな利点となります。

アクセシビリティ

GPT-4 モデルは、OpenAI の Generative AI チャットボット ChatGPT とその API を通じて広くアクセス可能です。 Microsoft Copilot で GPT-4 を使用することもできます。これは、GPT-4 を無料で使用する方法です。この幅広い可用性により、ユーザーはさまざまなユースケースでその機能を簡単に活用できるようになります。対照的に、Llama 3 はモデルの柔軟性を提供し、AI コミュニティ内でのより幅広い実験とコラボレーションを促進するオープンソース プロジェクトです。このオープン アクセス アプローチにより、AI テクノロジーが民主化され、より幅広いユーザーが利用できるようになります。

どちらのモデルも利用可能ですが、GPT-4 は一般的な生産性向上ツールやサービスに統合されているため、はるかに使いやすくなっています。一方、Llama 3 は主に Amazon Bedrock、Ollama、DataBricks などの研究およびビジネス プラットフォームに統合されており (Meta AI チャット サポートを除く)、技術者以外のユーザーのより広範な市場にはアピールできません。

GPT-4 と Llama 3 のどちらが優れていますか?

では、どの LLM が優れているのでしょうか? GPT-4 はより優れた LLM です。 GPT-4 は、テキスト、画像、音声入力を処理する高度な機能を備え、マルチモーダル性に優れていますが、Llama 3 の同様の機能はまだ開発中です。 GPT-4 はコンテキストの長さがはるかに長く、パフォーマンスも優れており、一般的なツールやサービスを通じて広くアクセスできるため、GPT-4 はよりユーザーフレンドリーになっています。

ただし、Llama 3 モデルが無料のオープンソース プロジェクトとして非常に優れたパフォーマンスを発揮したことを強調しておくことが重要です。そのため、Llama 3 は優れたパフォーマンス、柔軟性、信頼性の高いセキュリティ機能を提供しながら、その無料かつオープン ソースの性質により研究者や企業に好まれる優れた LLM であり続けています。一般消費者はすぐには Llama 3 の用途を見つけられないかもしれませんが、多くの研究者や企業にとっては最も実行可能な選択肢であることに変わりはありません。

要約すると、GPT-4 は高度なマルチモーダル機能、より長いコンテキスト長、広く使用されているツールへのシームレスな統合で際立っていますが、Llama 3 はオープンソースの性質により、より多くのカスタマイズとコスト削減を可能にする貴重な代替手段を提供します。したがって、アプリケーションの観点から見ると、GPT-4 は 1 つのモデルで使いやすさと包括的な機能を求める人にとって理想的ですが、Llama 3 は柔軟性と適応性を求める開発者や研究者に適しています。

Sign up and earn $1000 a day ⋙

Leave a Comment

Samsung Galaxyスマートフォンで変更すべき12の設定

Samsung Galaxyスマートフォンで変更すべき12の設定

Samsung Galaxy スマートフォンを購入したばかりで、設定が必要ですか? Samsung の携帯電話をより快適に動作させるために変更すべき 10 個の設定を紹介します。

最新のMurder Mystery 2コードと入力方法

最新のMurder Mystery 2コードと入力方法

Code Murder Mystery 2 では、プレイヤーは自分のキャラクターにさらに多くのナイフ スキンを選択したり、サービスに使用したりゲーム内の他のものを購入したりするためにさらに多くのお金を獲得したりできます。

両親、配偶者、恋人、友人へのお祝いの気持ちが込められた28種類の美しい誕生日カードデザイン

両親、配偶者、恋人、友人へのお祝いの気持ちが込められた28種類の美しい誕生日カードデザイン

恋人、両親、友人、兄弟、同僚などの誕生日には、贈り物のほかに、お祝いの気持ちを込めたバースデーカードを送ることも忘れないでください。

面白いけど甘い、あなたの好きな人の心を「捕らえる」いちゃつくなぞなぞ

面白いけど甘い、あなたの好きな人の心を「捕らえる」いちゃつくなぞなぞ

これらの楽しいクイズは、強い印象を与え、好きな人の心を早く、そして楽しく征服するのに役立ちます。

コルキ DTCL シーズン 7: ビルドアイテム、標準コルキ ガンナー部隊

コルキ DTCL シーズン 7: ビルドアイテム、標準コルキ ガンナー部隊

Corki DTCL シーズン 7 では、敵チームを自由に破壊したい場合、制御を引き起こすための保護またはサポートが必要です。同時に、より効果的なダメージを与えるためには、コルキの装備も標準化する必要があります。

Mini World Royaleのダウンロード方法と遊び方の説明

Mini World Royaleのダウンロード方法と遊び方の説明

Mini World Royale のダウンロード リンクとプレイ手順は次のとおりです。Mini World Royale APK と Mini World Royale iOS の 2 つのバージョンがあります。

1314とは何ですか?

1314とは何ですか?

1314 は若者が愛の暗号としてよく使う数字です。しかし、1314 が何であるか、そしてそれが何を意味するのかを誰もが知っているわけではないのでしょうか?

有害な環境にいるときに心身の健康を守る方法

有害な環境にいるときに心身の健康を守る方法

有害な状況に対処することは信じられないほど困難になる可能性があります。有害な環境にうまく対処し、心の平穏を保つためのヒントをいくつか紹介します。

音楽が脳を刺激する方法

音楽が脳を刺激する方法

音楽は単なる娯楽ではなく、それ以上に多くの利点があることをほとんどの人が知っています。音楽が脳の発達を刺激する方法をいくつか紹介します。

食事で最も不足しがちな栄養素

食事で最も不足しがちな栄養素

食事は私たちの健康にとって非常に重要です。しかし、私たちの食生活のほとんどには、これら 6 つの重要な栄養素が不足していることが多いのです。

サークルKのCKクラブアプリを使って魅力的なオファーを受け取る方法

サークルKのCKクラブアプリを使って魅力的なオファーを受け取る方法

Circle K からのプロモーション情報を最も早く入手するには、CK Club アプリをインストールする必要があります。このアプリケーションは、買い物やサークル K での支払い時の料金と、集めたスタンプの数を保存します。

Instagramは最長3分間のリール動画を許可

Instagramは最長3分間のリール動画を許可

Instagramは、これまでの90秒の制限の2倍となる、最長3分間のリール動画をユーザーが投稿できるようにすると発表した。

ChromebookのCPU情報を表示する方法

ChromebookのCPU情報を表示する方法

この記事では、Chromebook で CPU 情報を表示し、CPU 速度を直接確認する方法について説明します。

古いAndroidタブレットでできる8つのクールなこと

古いAndroidタブレットでできる8つのクールなこと

古いタブレットを売却したり譲渡したりしたくない場合は、高品質のフォトフレーム、音楽プレーヤー、電子書籍および雑誌リーダー、家事アシスタント、サブスクリーンとして、5 つの方法で使用できます。

美しい爪を早く手に入れる方法

美しい爪を早く手に入れる方法

美しく輝く健康な爪を早く手に入れたい。以下に美しい爪のための簡単なヒントをご紹介しますので、ぜひご参考ください。