OpenAIから怒涛のアップデートが発表されました!
「12 Days of OpenAI」と題した特別イベントで12日連続で新製品や機能を発表するというもので、年末休暇前に日々話題を提供するというものでした。
内容的には、新モデルの登場、動画生成AIのリリース、既存機能の強化など、盛りだくさんとなっています。この記事では、これらのアップデートをざっくり備忘録的にメモベースでまとめたものです。各機能の詳細が気になった方は、こちらのリンク先に発表内容の動画がありますので、お時間あれば見てみるのが良いと思います。
1. ChatGPT ProとO1 Proモード:最上位プランで驚異的な性能を体験
新たに月額200ドル(約3万円)の最上位プラン「ChatGPT Pro」が登場しました。このプランでは、以下の特典が利用できます。
- O1、O1 mini、GPT-4への無制限アクセス
- 高度な音声機能の使い放題
- 動画生成AI「Sora」の利用回数アップ
中でも注目は「O1 Proモード」です。回答精度が飛躍的に向上し、例えば以下のような高度なタスクを実行できます。
- デザイン表現の説明を100件表形式でまとめる
- 過去に賞を受賞したウェブサイトを100個URL付きでリストアップする
- 資料構成案から資料の原稿を作成するためのプロンプトを作成する
- SNSの炎上理由とその対策をまとめる
実用的な使い方が広がりそうですね。無料版でも「O1プレビューモード」が利用可能ですので、まずはそちらで試してみるのも良いでしょう。
2. ファインチューニングの強化:専門分野への対応力アップ
AIが学習用の複数タスクと参照回答を活用し、モデルの精度を逐次的に向上させる手法が追加されました。特に、法律、保険、ヘルスケア、金融、エンジニアリングなど、専門知識を必要とする分野で効果が期待されています。現在、この研究プログラムへの参加者も募集中です。
3. 動画生成AI「Sora」ついに登場!:テキスト、画像から高品質な動画を生成
長らく待たれていた動画生成AI「Sora」がついにリリースされました!テキスト、画像、動画から最大20秒の動画を生成できます。革新的な「ストーリーボード」機能により、複数のプロンプトを指定することで、動画内で意図した行動を表現したり、動画を直接挿入してシーンを切り替えたりすることも可能です。
- Proプラン:無制限生成(毎月1万クレジット付与、超過後は低速)
- 通常プラン:制限付き、1000クレジット
クオリティはプロンプトに大きく依存し、プロンプト次第で高品質な動画を生成できます。他の動画生成AIと比較すると、プロンプトへの忠実度が高い一方、プロンプトが不十分だとクオリティが低くなる傾向があります。
4. キャンバス機能のアップデート:無料プランでも利用可能に
これまで有料プラン限定だったキャンバス機能が、無料プランでも利用可能になりました。Pythonコードの実行にも対応し、ChatGPT上でグラフ作成やデータ分析が行えるようになりました。また、カスタムGPT(MyGPT)にキャンバス機能を埋め込むこともできます。
5. Appleインテリジェンスとの統合:iOSでChatGPTがより身近に
iOSの最新バージョンで、Siriやライティングツール上でChatGPTを利用できるようになります。コンテンツ生成や画像生成などが可能になり、ユーザーはChatGPT統合の有効/無効を選択したり、情報共有範囲を管理したりできます。ChatGPTアカウントなしでも利用可能ですが、その場合はデータは保存・学習に使用されず、IPアドレスは隠蔽されます。日本での提供は4月以降となる見込みです。
6. アドバンスビデオモードにビデオ機能追加:映像を見ながら会話
iPhoneのカメラを使って自分や周囲の状況を映しながらChatGPTと会話できるようになりました。映し出されている映像を解析し、場所や機材などの名称を当てることができます。Proプランでもビデオカメラモードは無制限ではない可能性があります。
7. プロジェクト機能追加:履歴管理がより便利に
ChatGPT上でフォルダー分けのようなことができる「プロジェクト機能」が追加されました。履歴管理が容易になり、プロジェクトごとにプロンプトやファイルを登録してオリジナルの環境を作成できます。おすすめのプロジェクトは、検索用、翻訳用、O1 Pro用などです。
8. 検索機能の強化:精度向上と機能追加
検索機能が大幅に強化され、精度が向上しました。マップ表示、YouTube動画の埋め込み、画像検索、レストラン情報検索などに対応し、クエリでは関連サイトが上位表示されるようになり、Google検索に近い検索が可能になりました。アドバンスボイスモードと検索機能の統合も行われました。
9. O1 APIの登場:開発者向けの機能強化
開発者向けにO1 APIが登場しました。複雑な多段階推論が可能で、関数呼び出し、構造化出力、JSONスキーマへの準拠などに対応しています。新しいAPIパラメータにより、モデルの試行時間を制御できるようになりました。性能は複数のベンチマークでO1プレビューを上回ります。リアルタイムAPIも強化され、Webrtc対応によりリアルタイム音声通話が容易になりました。GPT-4音声価格の引き下げや新SDK(Go、Java)の追加も行われています。また、人間による好み比較(ABテスト)に基づきモデルの出力を調整する「プレファレンスファインチューニング(PFT)」という新しい手法も追加されました。
10. ChatGPTと電話:インターネット環境が整っていない地域でも利用可能に
電話回線を使ってChatGPTと会話できる機能が追加されました(日本国内では利用不可)。これは、インターネット環境が整っていない地域への対応を目的としています。
11. アプリとの連携:他のアプリとの連携で可能性が拡大
デスクトップ版ChatGPTで、Macのメモ、テキストエディタ、VSコード、Notionなどと連携できるようになりました。アプリ内の情報を連携してやり取りできますが、ChatGPTからアプリ側を操作することはまだできません。
12. 最新モデル「O3」発表:さらなる進化
なんと、O1 Proよりもさらに推論能力が向上した最新モデル「O3」が発表されました!各種ベンチマークテストで人間を超えるスコアを記録し、特に数学、科学、ソフトウェアエンジニアリング分野で高い性能を発揮するとのことです。軽量かつ低コストな「O3 mini」も登場予定。リスク的な部分を配慮した回答を出すように改善されているようです。来年1月下旬頃から一般公開予定で、現在テスターを募集しています。
まとめ:OpenAIの進化は止まらない!
今回のアップデートは、ChatGPTの性能向上、マルチモーダル化、開発者向け機能の強化、他サービスとの連携など、多岐にわたります。特にO1 Pro、Sora、そしてO3の登場は大きなインパクトを与えています。OpenAIの進化はまだまだ止まりません。今後の展開にも注目していきましょう。