LINEは11月25日、NAVERと共同で日本語に特化した超巨大言語モデル(膨大なデータから生成された汎用言語モデル)の開発を発表した。日本語に特化した超巨大言語モデル開発は、世界でも初めての試みになるとしている。
特化型言語モデルなど、従来の言語モデルでは、各ユースケース(Q&A、対話など)に対して自然言語処理エンジニアが個別に学習する必要があった一方、汎用言語モデルは、AIでより自然な言語処理・言語表が可能。同モデルは、OpenAIが開発した「GPT」やGoogleの「T5」などが代表例となる。
新聞記事や百科事典、小説、コーディングなどといった膨大な言語データを学習させた言語モデルを構築し、コンテキストを設定するFew-Shot learning(ブログの書き出しやプログラミングコードの一部などを与えること)を実行すると、対話、翻訳、入力補完、文書生成、プログラミングコードといったさまざまな言語処理により、個々のユースケースを実現できるとしている。
同社では、日本語に特化した独自の汎用言語モデルを開発。1750億以上のパラメーターと、100億ページ以上の日本語データを学習データとして利用する予定という。現在世界に存在する日本語をベースにした言語モデルのパラメーター量と学習量を大きく超えるものであり、パラメーター量と学習量については、今後も拡大するとしている。
現在、超巨大言語モデルは世界でも英語のみが存在・商用化しており、他言語の開発についても、ごく少数の取り組みが発表されているのみ。同社はその理由のひとつとして、高度なインフラ環境の必要性を挙げる。
超巨大言語モデルの処理には、数百GBものメモリが必要と考えられており、スーパーコンピュータなど、高度なインフラ環境が必要という。LINEでは、NAVERと共同で700PFLOPS以上の性能を備えたコンピューティングパワーを活用し、汎用言語モデルの土台となるインフラの整備を2020年内に実現する予定だという。
なお、開発された超巨大言語モデルは、新しい対話AIの開発や検索サービスの品質向上など、AIテクノロジーブランド「LINE CLOVA」をはじめとする同社のサービスへと活用するほか、第三者との共同開発やAPIの外部提供についても検討する予定としている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」