2024年5月14日、OpenAIが日本時間深夜2時に開催したイベントで、AIの新たな時代を告げる革新的な発表が行われました。特に注目すべきは、「GPT-4o」モデルの登場と無料ユーザーへのサービス解放の二点です。
目次
GPT-4o(オムニ)の概要
新たに発表された「GPT-4o」(oはomniの略)は、音声、視覚、テキストの全てをリアルタイムで処理できる画期的なAIモデルです。これにより、人間とAIの対話がより自然になりました。
主な特徴
- マルチモーダル対応:テキスト、音声、画像を組み合わせた入力を受け付け、多様な形式での出力が可能。
- 高速応答:音声入力に対しては232ミリ秒、平均して320ミリ秒で応答。
- 多言語対応:英語だけでなく、多くの非英語テキストにも対応して性能が向上。
- コスト効率:APIを通じて前モデルよりも速く、より低コストで利用可能。
GPT-4oの活用事例
- 対話と歌唱:二つのGPT-4oが交互に歌を歌うデモンストレーション。
- リアルタイム翻訳:英語とスペイン語のリアルタイム翻訳。
- インタビュー準備:リアルタイムでの質問応答を通じてのインタビュー対策。
- 数学学習:GPT-4oを使って画面を共有しながら数学問題の解法を学習。
無料ユーザー向けの新機能
新たに無料で提供される機能は以下の通りです:
- GPT-4レベルのAIアクセス
- ウェブからの情報取得
- データの分析とチャート作成
- 写真の解析
- ファイルのアップロード
- GPTストアの利用
- メモリ機能
ただし、画像生成機能やGPTsの作成は制限されています。
ChatGPT Plusユーザー向けの特典
Plusユーザーは、無料ユーザーの特典に加えて、以下の機能を享受できます:
- 音声会話の利用
- メッセージ送信の増量
- 画像生成機能
新しいmacOS用ChatGPTデスクトップアプリ
macOS用の新しいChatGPTデスクトップアプリも発表されました。このアプリは、キーボードショートカットで即座に質問できる機能など、日常作業の効率化を支援します。Plusユーザー向けにはさらに、音声会話や画面共有機能が提供されます。
まとめ
OpenAIの最新発表では、AI技術のさらなる進化とともに、多くのユーザーがこれらの先進的な機能を手軽に利用できるようになりました。GPT-4oの多様な機能は、今後のAIの活用に新たな可能性をもたらすことでしょう。