便利ツール
2023-11-08

DevDay 非エンジニア向けまとめ ChatGPT の新機能やアップデート【OpenAI】

11月7日、DevDayというOpenAI社のイベントにて、ChatGPT関連サービスの大幅なアップデートや新機能が多数紹介されました。

アップデートの内容に感動する人が多い一方で、「多すぎて追いきれない」「よくわからない」という声も耳にします。

そこで本記事では、非エンジニアの方でもわかるように専門用語を避け、いったいなにができるようになったのかをわかりやすく解説します。

最新情報にサクッと追いついていきましょう。

そもそもDevDayとは?公式の文書も紹介

DevDayとは、OpenAIが11月7日に開催した技術開発者向けのカンファレンスです。

OpenAIの代表であるサム・アルトマン氏が数ヶ月前から当イベントを予告していたことから、技術者の間ではインパクトが大きい発表があるだろうと期待されていました。

DevDay の内容は YouTube で生配信され、その全てがアーカイブとして今も見れるようになっています。

最先端の技術者でも驚くほどの革命的な内容ばかりですが、全体で45分とコンパクトにまとまっているため、ご興味のある方はご覧ください。

また、DevDayイベントの直後には公式サイトにて、発表された内容がまとめて報告されています。

公式の文書をしっかりとチェックされたい方は、本記事と合わせてご覧ください。

https://openai.com/blog/new-models-and-developer-products-announced-at-devday

APIについて(GPTを外部ツールから呼び出す仕組み)

まずは API の発表について次の順番で解説します。

  1. そもそもAPIとは何か
  2. 賢くて安いAPIが登場
  3. 画像生成・音声合成API登場

こまかい技術の話はせず、ざっくりと理解できるようにまとめていきます。

ChatGPTのAPIとは

ChatGPTといえばログインしてAIとチャットする機能が一般的ですが、自社で開発したシステムや外部のツールからChatGPTの機能を呼び出すこともできます。

外部のツールからChatGPTのAIを呼び出すときに使われる技術がAPIです。

「あのツールとChatGPTが組み合わさったらいいのに」といった希望は、APIを使ってChatGPTを呼び出すことで実現するため、技術者たちはAPIの性能やコストに注目しています。

GPT-4(有料版ChatGPT)よりも賢くて安いAPIが登場した

最初に技術者たちを驚かせたのは、有料版のChatGPTで使われるAIよりももっと賢いAIの登場と、それをこれまでよりも安く使えるようになったという発表でした。

ChatGPTに搭載されているAIは事前に学習済みのもので、最新の情報までは知り得ないのですが、2023年4月までという比較的最近の情報まで学習を終えたようです。

さらに、テキストだけでなく画像を読み込ませて質問できるようになりました。

これにより、たとえば壊れた自転車の写真と「どうやったら直せる?」という質問文を同時に送って、ChatGPTから修理のアドバイスをもらうといったことが外部ツールからでも可能になりました。

これらのアップデートのうえで、利用価格がこれまでの3分の1になり、機能・コストの両面で技術者たちを驚かせたのです。

画像生成・音声読み上げのAPIが公開された

2023年9月のアップデートで有料プランに実装されていた、画像生成AI(Dall-E3)と音声読み上げ機能(TTS)のAPIが公開されました。

これまでChatGPTなどの一部のサービス上でしか使えなかった機能が、プログラムさえ作れば自社のサービスに組み込めるようになったのです。

世界の技術者たちは早くもこの技術を活用し始め、公開から数時間で「サッカーの実況をAIが行う動画」がSNSで発信され注目を集めています。

動画内の技術を分解すると、サッカーの試合の動画を画像に分解してGPTに見せて実況を考案させ、TTSでその実況内容を読み上げるというもの。

複数のAPIを組み合わせるよい例と言えるでしょう。

今回の DevDay で複数のAPIが公開されたため、見たこともないようなAIの活用法がどんどん登場するかもしれません。

新機能 GPTs (AIを搭載したBot)

ChatGPT を特定のタスクに特化させた新機能 GPTs が発表されました。

DevDay のデモンストレーションでは、画像編集ツールの Canva と連携した GPTs を使ってデザインを編集したり、ツール連携の Zapier を使ってメッセージを送ったりする機能が紹介されました。

有料プランのユーザーであれば自分専用の GPTs をカスタマイズでき、さらにそれを公開して収益を得る昨日も実装されていく予定とのこと。

11月8日の現時点ではカスタマイズの機能はまだ公開されていません。

公式の文書では、ChatGPTとカレンダーを組み合わたカレンダーGPTZapierCanvaの3つが公開されています。

GPTs は自然言語で話しかけるだけでカスタマイズができるため、プログラム知識のない人でも日本語で指示しながらBotをつくれてしまうということになります。

公開されたばかりでまだ全貌が見えない機能ではありますが、従来のBot開発とは違った開発や利用ができるようになるのでしょう。

技術的なアップデート

ここからは「非エンジニアが扱うのは難しいが革新的なアップデート」を紹介します。

  1. Function calling updates
  2. Improved instruction following and JSON mode
  3. Copyright Shield

詳しく話すと難しくなってしまうため、ざっくりと機能だけ紹介させてください。

Function calling updates

ユーザーの入力からGPTが判断して関数を呼び出す「Function calling」の機能がアップデートされました。

たとえば「車の窓を開けてからエアコンを切って」と指示した際、窓とエアコンの2つの操作が必要であると理解し、2つの関数を呼び出して制御するなどが可能になります。

Improved instruction following and JSON mode

GPTの出力を特定の形式に指定する精度が向上しました。

「response_format」で構文的に正しい内容を出力します。

Copyright Shield

ユーザーが著作権侵害に関する法的な問題に直面した場合、OpenAI社が介入し発生したコストを負担します。

ただし、ChatGPT Enterprise のプランに限るようです。

まとめ

DevDay からまだ1日しかたっていませんが、SNSでは技術者たちが新しい試みをしては公表し、盛り上がりを見せています。

どのように組みあわせて何ができるのか想像がつかないほど斬新な機能ばかりですから、生活が一変するようなツールやサービスが登場しても不思議ではありません。

株式会社LOGでは、ChatGPTをはじめとするAIのシステム開発も行っております。お気軽にご相談ください。