> >

NEC、軽量なLLMを独自--130億パラメータで世界トップクラスの日本語能力を実現

　日本電気（NEC）は7月6日、Generative AI（生成AI）における日本語大規模言語モデル（Large Language Model：LLM）を開発したと発表した。

　同LLMは、独自に収集・加工した多言語データを利用した、いわゆるファウンデーションモデル（基盤モデル）になるという。

　性能面では、早稲田大学河原研究室とヤフーが共同研究により構築・公開した日本語言語理解ベンチマーク「JGLUE」を使用して日本語の知識量や文書読解力を計測。

　現時点で知識量に相当する質問応答で81.1％、推論能力に相当する文書読解においては84.3％と世界トップレベルの性能を確認。さまざまな業種における業務において、十分な機能を発揮できるという。

　また、各LLMの特徴のひとつとして、パラメータサイズの大小が用いられるが、パラメータのサイズを増やすことは、推論速度の低下やモデル運用に必要なGPU枚数、消費電力の増加などに繋がってしまう。そのため、同一の性能であればパラメータ数は少ないことが望まれている。

　同社では、LLMの性能がパラメータサイズの他にも、学習に使われた高品質なデータの量や学習時間に左右されることに着目。独自技術によりパラメータ数を130億に抑えることで、GPU1枚搭載の標準的なサーバーで動作が可能としつつ、多量のデータと膨大な計算時間をかけることで、高い性能を実現した。

　これにより、同LLMを組み込んだ業務アプリケーションでは、レスポンス良く動作し、業務運用時の電力消費やサーバーコストを抑えられるという。

　さらに、顧客の業務に特化させたLLMが短期間で容易に構築でき、オンプレミス環境でも動作可能なため、秘匿性の高い業務においても安心して利用できるとしている。

　同社では、国内企業で最大のAI研究用スーパーコンピュータを独自構築し、2023年3月に全面稼働を開始。これを活用することで、約1カ月の短期間で高性能なLLMの構築を実現した。

　なお、同社では、すでに同LLMを社内業務で活用しており、文書作成や社内システム開発におけるソースコード作成業務など、さまざまな作業の効率化にも応用している。

　今後は、ファウンデーションモデルをもとに、顧客のクローズドデータを用いた個社向けLLMの開発を推進。また、ファウンデーションモデル自体の性能改良も進め、これらの技術を「NEC Generative AI Hub」を通じて、早期実用化して行く予定だという。

CNET Japanの記事を毎朝メールでまとめ読み（無料）

-PR-企画広告