2022年11月に一般リリースされたAIチャットボットである「ChatGPT」はすぐに注目を集め、たった2か月後の2023年1月に1億ユーザーを突破してしまった。そこから、毎月のように大きな機能拡張を実施し、ChatGPTは進化していく。
時間が経つごとに、単に会話できるだけでなく、何らかの成果物を作成する作業をできることがわかってきた。ビジネスシーンでの活用が模索され、実際に業務効率化に寄与することがわかると多くの人が興味を持った。今回は、ChatGPT大躍進の1年間を振り返り、何があったのかをまとめ、2024年の生成AIシーンを予測する。
ChatGPTがリリースされると、ITに感度の高い人たちの間で「これはすごい」と話題になり、すぐにブレイクした。無料のサービスということもあり、爆発的にユーザーが増え、当時世界最速となる2か月で1億ユーザーを達成。この大成功に、まずOpenAI自身が驚いた。
ChatGPTは当初、GPT-3.5という大規模言語モデル(以下、LLM)を搭載していたが、その前身となるGPT-3は2020年に完成していた。すでに、英語でブログを書かせると、人の手によるものかどうかわからないほどの性能を持っていたが、一般ユーザーが触れるものではなかったため、話題に上ることは少なかった。
2022年、GPT-3を2年かけてブラッシュアップしたGPT-3.5を研究用のプレビュー版としてリリースした。一般ユーザーからのフィードバックを集めるため、誰でも使えるチャットボットとして公開したのだ。触ってみて驚いた人がSNSで発信すると、瞬く間に全世界に広がった。日本でも話題になった。通常、先進の技術は言語の壁があるものだが、ChatGPTは最初から日本語も使えたからだ。実際、現在でもChatGPTのユーザー数は米国とインドに次いで日本が3番目となっている。
3月にはさらに高精度のGPT-4をChatGPT Plus向けに公開。同時に、音声認識AI「Whisper」もリリースした。あまりの熱狂ぶりに、GPT-4よりも強力なAIの開発を一時停止せよという署名運動も起きた。イーロン・マスク氏も署名していたものの、自分はAI開発のため大量のGPUと人材を獲得し、AI「Grok」を開発した。ちなみに、現在GrokはXプレミアムの月額1960円プランを契約したユーザーしか利用できない。
4月、OpenAIは「Our approach to AI safety(AIの安全に対する私たちのアプローチ)」というブログを公開。より安全なAIを開発するという指針を発表した。そして、OpenAIのアルトマンCEOは世界行脚をスタート。各国のトップと対談を続けた。4月10日に来日し、岸田総理大臣とも面会をしている。この時、日本に事業拠点を新設すると述べた。再び6月にも来日し、慶応義塾大学三田キャンパスで行われた意見交換会に参加している。
また、5月に開催されたG7広島サミットでは、ChatGPTなどの生成AIについても議論し、「広島AIプロセス」を立ち上げることになった。閣僚級がAIの開発や規制について議論するもので、12月1日の会合ではAIで初となる国際指針が合意された。
ChatGPTは2021年9月までのデータを学習しており、最新の情報は扱えない、というのが前提だったが、ベータ機能としてウェブブラウジング機能をリリース。最新情報を元に、チャットできるようになった。しかし、この機能は有料サイトの中身まで学習ソースにしており、プロンプトによってはユーザーが閲覧できてしまう問題が発覚。7月に機能が停止されてしまった。なお、現在はrobots.txtを参照するといった対策が施され、利用できるようになっている。
6月にはChatGPTの月間アクセスが、ローンチ以降初めて減少したとニュースになった。また、著作権やプライバシーの侵害を訴え、OpenAIに複数の訴訟が起こされた。裁判の行方は気になるところだが、結果が出る前に、AIシーンは何世代も大きな変化が起きているような気もする。
7月には「コードインタープリター」機能を搭載。チャットしながらPythonのプログラムを構築し、実行することもできる。非エンジニアでもアプリを作ったり、ウェブサイトを構築できるのには驚いた。ファイルをアップロードして、そこに対しての処理を行うこともできる。販売データをアップロードして、経営分析するといったことも簡単だ。現在は、「高度データ分析」(Advanced Data Analysis)と名称が変更されている。
8月には企業待望の「ChatGPT Enterprise」がお目見えした。企業の情報はAI学習に利用されず、32kトークンのGPT-4を無制限に利用できる。動作速度も2倍になっており、一般ユーザーとしてはうらやましいところだ。
OpenAIが訴えられていることもあり、生成したテキストをビジネス利用することで、意図していないのに著作権違反に問われるリスクに悩む企業がある。そこで、ChatGPT Enterpriseでは、OpenAI製品を使っていて訴えられた場合に、OpenAIが保護してくれる「Copyright Shield」というサービスも提供している。
9月にはユーザーインターフェースが日本語を含む9か国語に対応した。ChatGPTのメニューはシンプルなので英語でも迷わず使えるものだったが、ブラウザの機能などで日本語化しているユーザーは動作不良が起きがちだったのだ。
下旬には待望のマルチモーダルになり、ChatGPTに画像をアップロードできるようになった。動物の写真を撮って、どんな動物なのかを質問したり、外国語のメニューをアップロードしたりして、翻訳してもらうといったことが可能になったのだ。Googleの生成AI「Bard」が一足早くマルチモーダル化していたものの、画像や音声を元にチャットで会話ができるのはすごい体験だ。
10月には画像生成AI「DALL-E 3」をChatGPTから利用できるようにした。チャットで指示すると、画像が生成されるのだ。会話の内容を理解し、ChatGPTがプロンプトを噛み砕いてDALL-E 3に渡すので、必ずしも狙った画像ができるわけではないが、手軽にオリジナルの画像を生成できるというのは革命だ。商用も可能なので、筆者も記事のイメージカットを自分で作れるようになった。
11月7日、OpenAIは初の開発者会議である「OpenAI DevDay」を開催。これでもか、と新たな発表が続き、驚きの連発だった。新しいGPT-4「turbo」はトークン数が128kに増え、コストも大幅に安くなった。APIもマルチモーダル化し、UIも一新。ウェブブラウジング機能やプラグイン、高度データ分析、DALL-E 3をGPT-4ひとつの画面で同時に利用できるようになったのだ。
オリジナルのChatGPTを作成できる「GPTs」もさらっとリリースした。誰でもカスタマイズしたチャットボットを作れるので、すでに多くの人がGPTsを公開している。GPTsは今後公開予定の「GPT Store」で売買できるようになるという。それまでChatGPT Plusを使っていなかった人もビジネスチャンスを感じたようで、GPTsの発表後に有料プランの登録が激増し、OpenAIは新規受付を停止した。
そして、11月17日、衝撃の事件が起きる。OpenAIのアルトマンCEOが突如解任されたのだ。19日にはマイクロソフトのナデラCEOがアルトマン氏を迎え入れるとSNSに投稿し、OpenAIの従業員のうち95%以上がアルトマン氏が復帰しなければ退職すると表明。そして、この退社する人たちもマイクロソフトが迎え入れるとなると、13兆円の価値があるOpenAIをただで入手することになる。そして22日、アルトマン氏がOpenAIに復帰すると発表し、元の鞘に収まった。この数日間は、そのうち映画化されることだろう。
これまでのどんなITプロダクトもこんな激しい状況にはなっていない。ChatGPTだけでなく、生成AI界隈全体がこんな感じで、カンブリア爆発のようにAIサービスが生まれている。
感度の高い企業はすでにChatGPTを導入している。Azure OpenAI Serviceなどを利用し、自社で使うChatGPTを構築。従業員全員に使ってもらい、業務効率をアップさせている。筆者はChatGPTを活用する企業に取材しているのだが、主に文章作成の業務で効果を出している企業が多いように感じている。エンジニアはコードの生成に利用しているという。個人単位では、海外の論文を要約してもらい、情報収集に役立てている人が多いようだ。
一方、さらっと触ってみて、「ChatGPTは使えない」と断じている人も一定数いる。ChatGPTは完ぺきではないが、ローンチされてまだ1年だ。クオリティは日々アップするし、扱えるトークン量もどんどん増えていくはずだ。
そもそも、生成AIに完ぺきを求めるべきではない。いつかは高い信頼性を獲得するのかもしれないが、今はミスをすること前提で活用するほうが賢い。そもそも人間だって相当な頻度でミスをする。それよりも精度が高いのなら、大きな価値を見出すことができるだろう。些細なミスを取り上げてChatGPTを忌避するなら、インターネットやExcel、スマートフォンが嫌だ、と使わなかった人たちと同じ末路を辿ることになるだろう。
今後も、しばらくはChatGPTの独走が続くだろう。雨後のタケノコのようにAIサービスが出てきているが、汎用的にビジネスで利用するならChatGPTがもっとも使い勝手がいい。単なるAIの性能だけを考えるなら、同レベルやそれ以上のAIは登場しているのだが、OpenAIは潤沢なリソースを元に1年間ハイペースで改良し続けてきたアドバンテージは大きい。一般ユーザーの使い勝手という面で独走状態に入っているといっていい。どんどん新しいモデルを投入し、価格も積極的に下げていくなどまさに時代を切り開いている感じだ。
もちろん、ライバルのGoogleは見逃せない。BardはGmailやGoogleマップと言ったGoogleのエコシステムのデータを利用できるので、無限の可能性が広がっている。Googleは、12月7日に新しいAIモデル「Gemini」をリリース。テキスト、画像、音声、動画、コードなどをシームレスに扱えるマルチモーダルAIで、人間の専門家を上回るパフォーマンスを出せるという。現在は英語のみだが、日本語も2024年に対応予定だ。
今年はGoogleが後れを取ったが、2024年はバチバチとやりあうことになるだろう。とは言え、筆者としてはBardは検索が得意で、ChatGPTは作業が得意というイメージを持っているので、ユーザーとしては単に使い分けるだけになりそうだ。
ChatGPTは、まずリリースが遅れている「GPT Store」を年明けすぐにリリースして来る。そして、扱えるトークン数も増えるはず。すでに、APIでならGPT-3.5は16k、GPT-4は128kトークンを扱えるのでこれは単にリソースの問題だろう。また、このトークン数も次は64kとか256kとかではなく、10万とか100万という単位で爆発的に増えるかもしれない。すでに、Anthropicの生成AI「Claude 2」は20万トークンを扱えるので、そこは上回って欲しいところ。
個人的な願望も多分に含まれるが、GPT-4の40メッセージ/3時間という制限を緩和すべきだ。GPTsの開発をするとあっという間に制限に達してしまい、課金しているのにすこぶる不満が溜まる。同意見の人は多いと思うので、ここは対応して欲しいところ。
企業向けの機能も強化されるだろう。ChatGPTのAPIを使い、社内・社外に向けた色々なサービスを実装する企業が増えるのは間違いない。同時に、AIスキルを持つ人材が求められ、リスキリングの動きが加速するだろう。
ChatGPTブームは過熱しすぎているので、来年は一段落する、という意見もあるが、筆者としてはさらに熱くなり続けていくと予測する。また毎月のように新機能を投入してきて、2024年の半ばにはChatGPT UltraプランでGPT-5登場、という1年を期待したい。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス