OpenAI GPT-4o mini を発表 – GPT-3.5 Turbo を代替する軽量モデル、応答性能・レスポンスを向上、コストはさらに低下

COMPUTER

OpenAI-GPT-4o-mini

OpenAI が GPT-4o の軽量版、GPT-4o mini(GPT-4o mini: advancing cost-efficient intelligence) を発表した。

大規模言語モデルの性能、人間的な応答とレスポンスの良さが定評の GPT-4o の軽量モデルで、これまで GPT-3.5 が担ってきた役割を GPT-4o mini に代替させることで、応答性能・レスポンスを向上し、さらにコストを低減させることが可能だ。

OpenAI GPT-4o mini

GPT-4o mini の API 価格は入力 100万トークンあたり 15 セント、出力 100万トークンあたり 60 セントと、GPT-3.5-turbo より 60%以上安価に設定されている。また、軽量モデルなのでレスポンスも良い。通常のテキスト会話は GPT-4o だと処理あたり 1.5円くらいかかるイメージ。これが GPT-4o mini だと 0.05円くらいになるので、97% オフ、という感じだ。

OpenAI-GPT-4o-mini Model Evaluation Scores

GPT-4o mini の性能は GPT-4o には及ばないものの、Google Gemini Flash や Anthropic Claude Haiku などの軽量モデルに比べても高く、GPT-3.5 Turbo の性能を凌駕するもの。

生成 AI のシステム開発では レスポンスが求められる・コール数が多くコストがかかる部分には GPT-3.5系を使い、最終的な応答生成に最新のモデルを使う、といった使い分けを行うのが通常だ。この「安くてソコソコの性能」で重宝されてきた GPT-3.5系を GPT-4o mini に切り替えることができる。応答性能もレスポンスもコストも改善するので待ったなしだ。

Assistants API、Chat Completions API、Batch API で GPT-4o mini を使うことができる。ちなみに使ってみた感じでは GPT-4o mini は GPT-4o と同じくらいのレスポンスで応答する。GPT-4o の応答が速いので軽量版といってもそんなに違いが出ない。やはり安さだろう。

これで GPT-3.5-turbo が使われることは稀になってくる。長く使われてきた GPT-3.5 turbo はしばらくの期間を経て引退することになるのかもしれない。お疲れさまでした。一緒に夢が見れてよかった。

COMPUTER
この記事をシェアしてくれると、とても嬉しい😆
Follow Me !
波形研究所 所長

WAVEFORM LAB(ウェーブフォーム・ラボ) は音楽制作、デジタルライフ、イノベーションをテーマとするサイトです。

1997年、伝説の PDA、Apple Newton にフォーカスした Newton@-AtMark- を開設、Newton や Steve Jobs が復帰した激動期の Apple Computer のニュースを伝えるサイトとして 200万アクセスを達成。2001年からサイトをブログ化、2019年よりサイト名を WAVEFORM LAB に改称、気になるネタ&ちょっとつっこんだ解説をモットーにサイトを提供しています。

Follow Me !
WAVEFORM LAB

コメント

タイトルとURLをコピーしました