11月7日、DevDayというOpenAI社のイベントにて、ChatGPT関連サービスの大幅なアップデートや新機能が多数紹介されました。
アップデートの内容に感動する人が多い一方で、「多すぎて追いきれない」「よくわからない」という声も耳にします。
そこで本記事では、非エンジニアの方でもわかるように専門用語を避け、いったいなにができるようになったのかをわかりやすく解説します。
最新情報にサクッと追いついていきましょう。
DevDayとは、OpenAIが11月7日に開催した技術開発者向けのカンファレンスです。
OpenAIの代表であるサム・アルトマン氏が数ヶ月前から当イベントを予告していたことから、技術者の間ではインパクトが大きい発表があるだろうと期待されていました。
DevDay の内容は YouTube で生配信され、その全てがアーカイブとして今も見れるようになっています。
最先端の技術者でも驚くほどの革命的な内容ばかりですが、全体で45分とコンパクトにまとまっているため、ご興味のある方はご覧ください。
また、DevDayイベントの直後には公式サイトにて、発表された内容がまとめて報告されています。
公式の文書をしっかりとチェックされたい方は、本記事と合わせてご覧ください。
https://openai.com/blog/new-models-and-developer-products-announced-at-devday
まずは API の発表について次の順番で解説します。
こまかい技術の話はせず、ざっくりと理解できるようにまとめていきます。
ChatGPTといえばログインしてAIとチャットする機能が一般的ですが、自社で開発したシステムや外部のツールからChatGPTの機能を呼び出すこともできます。
外部のツールからChatGPTのAIを呼び出すときに使われる技術がAPIです。
「あのツールとChatGPTが組み合わさったらいいのに」といった希望は、APIを使ってChatGPTを呼び出すことで実現するため、技術者たちはAPIの性能やコストに注目しています。
最初に技術者たちを驚かせたのは、有料版のChatGPTで使われるAIよりももっと賢いAIの登場と、それをこれまでよりも安く使えるようになったという発表でした。
ChatGPTに搭載されているAIは事前に学習済みのもので、最新の情報までは知り得ないのですが、2023年4月までという比較的最近の情報まで学習を終えたようです。
さらに、テキストだけでなく画像を読み込ませて質問できるようになりました。
これにより、たとえば壊れた自転車の写真と「どうやったら直せる?」という質問文を同時に送って、ChatGPTから修理のアドバイスをもらうといったことが外部ツールからでも可能になりました。
これらのアップデートのうえで、利用価格がこれまでの3分の1になり、機能・コストの両面で技術者たちを驚かせたのです。
2023年9月のアップデートで有料プランに実装されていた、画像生成AI(Dall-E3)と音声読み上げ機能(TTS)のAPIが公開されました。
これまでChatGPTなどの一部のサービス上でしか使えなかった機能が、プログラムさえ作れば自社のサービスに組み込めるようになったのです。
世界の技術者たちは早くもこの技術を活用し始め、公開から数時間で「サッカーの実況をAIが行う動画」がSNSで発信され注目を集めています。
動画内の技術を分解すると、サッカーの試合の動画を画像に分解してGPTに見せて実況を考案させ、TTSでその実況内容を読み上げるというもの。
複数のAPIを組み合わせるよい例と言えるでしょう。
今回の DevDay で複数のAPIが公開されたため、見たこともないようなAIの活用法がどんどん登場するかもしれません。
ChatGPT を特定のタスクに特化させた新機能 GPTs が発表されました。
DevDay のデモンストレーションでは、画像編集ツールの Canva と連携した GPTs を使ってデザインを編集したり、ツール連携の Zapier を使ってメッセージを送ったりする機能が紹介されました。
有料プランのユーザーであれば自分専用の GPTs をカスタマイズでき、さらにそれを公開して収益を得る昨日も実装されていく予定とのこと。
11月8日の現時点ではカスタマイズの機能はまだ公開されていません。
公式の文書では、ChatGPTとカレンダーを組み合わたカレンダーGPT、Zapier、Canvaの3つが公開されています。
GPTs は自然言語で話しかけるだけでカスタマイズができるため、プログラム知識のない人でも日本語で指示しながらBotをつくれてしまうということになります。
公開されたばかりでまだ全貌が見えない機能ではありますが、従来のBot開発とは違った開発や利用ができるようになるのでしょう。
ここからは「非エンジニアが扱うのは難しいが革新的なアップデート」を紹介します。
詳しく話すと難しくなってしまうため、ざっくりと機能だけ紹介させてください。
ユーザーの入力からGPTが判断して関数を呼び出す「Function calling」の機能がアップデートされました。
たとえば「車の窓を開けてからエアコンを切って」と指示した際、窓とエアコンの2つの操作が必要であると理解し、2つの関数を呼び出して制御するなどが可能になります。
GPTの出力を特定の形式に指定する精度が向上しました。
「response_format」で構文的に正しい内容を出力します。
ユーザーが著作権侵害に関する法的な問題に直面した場合、OpenAI社が介入し発生したコストを負担します。
ただし、ChatGPT Enterprise のプランに限るようです。
DevDay からまだ1日しかたっていませんが、SNSでは技術者たちが新しい試みをしては公表し、盛り上がりを見せています。
どのように組みあわせて何ができるのか想像がつかないほど斬新な機能ばかりですから、生活が一変するようなツールやサービスが登場しても不思議ではありません。
株式会社LOGでは、ChatGPTをはじめとするAIのシステム開発も行っております。お気軽にご相談ください。