OpenAI が GPT-4o の軽量版、GPT-4o mini(GPT-4o mini: advancing cost-efficient intelligence) を発表した。
大規模言語モデルの性能、人間的な応答とレスポンスの良さが定評の GPT-4o の軽量モデルで、これまで GPT-3.5 が担ってきた役割を GPT-4o mini に代替させることで、応答性能・レスポンスを向上し、さらにコストを低減させることが可能だ。
OpenAI GPT-4o mini
Introducing GPT-4o mini! It’s our most intelligent and affordable small model, available today in the API. GPT-4o mini is significantly smarter and cheaper than GPT-3.5 Turbo.https://t.co/sqJsFEYHWq pic.twitter.com/g6jMttp1mF
— OpenAI Developers (@OpenAIDevs) 2024年7月18日
GPT-4o mini の API 価格は入力 100万トークンあたり 15 セント、出力 100万トークンあたり 60 セントと、GPT-3.5-turbo より 60%以上安価に設定されている。また、軽量モデルなのでレスポンスも良い。通常のテキスト会話は GPT-4o だと処理あたり 1.5円くらいかかるイメージ。これが GPT-4o mini だと 0.05円くらいになるので、97% オフ、という感じだ。
GPT-4o mini の性能は GPT-4o には及ばないものの、Google Gemini Flash や Anthropic Claude Haiku などの軽量モデルに比べても高く、GPT-3.5 Turbo の性能を凌駕するもの。
生成 AI のシステム開発では レスポンスが求められる・コール数が多くコストがかかる部分には GPT-3.5系を使い、最終的な応答生成に最新のモデルを使う、といった使い分けを行うのが通常だ。この「安くてソコソコの性能」で重宝されてきた GPT-3.5系を GPT-4o mini に切り替えることができる。応答性能もレスポンスもコストも改善するので待ったなしだ。
Assistants API、Chat Completions API、Batch API で GPT-4o mini を使うことができる。ちなみに使ってみた感じでは GPT-4o mini は GPT-4o と同じくらいのレスポンスで応答する。GPT-4o の応答が速いので軽量版といってもそんなに違いが出ない。やはり安さだろう。
これで GPT-3.5-turbo が使われることは稀になってくる。長く使われてきた GPT-3.5 turbo はしばらくの期間を経て引退することになるのかもしれない。お疲れさまでした。一緒に夢が見れてよかった。
コメント