サイバーエージェント、最大68億パラメータの日本語LLMを一般公開へ

 サイバーエージェントは5月17日、最大68億パラメータの日本語LLM(Large Language Model:大規模言語モデル)を一般公開したと発表した。

キャプション

 近年、OpenAIが開発した「ChatGPT」を始めとする生成AI・LLMが急速な進化を遂げており、あらゆる業界・ビジネスにおいて活用が進んでいる。一方、既存のLLMのほとんどは英語を中心に学習されているため、日本語および、日本文化に強いLLMは少ない状況にある。

 同社では、日本語LLMの開発に取り組んでおり、今回その一部モデルを「Hugging Face Hub」にて公開した。公開されたモデルは、オープンな日本語データ(Wikipediaおよび、Common Crawlを使用)で学習したもので、商用利用可能な「CC BY-SA 4.0ライセンス」(ライセンスについては、モデル公開ページに詳細の記載あり)で提供される。なお、同モデルは日本国内における現行の公開モデルにおいて最大級の規模になるという。同モデルをベースとしてチューニングを行うことで、対話型AIなどの開発も可能になるという。これにより、日本語の自然言語処理に関する最先端の研究開発に取り組めるとしている。

 同社では、これまで培った知見を生かし、チャットボットやRPAをはじめとする業界特化型のLLMの構築、各企業と連携したLLMを活用したビジネス開発の推進などを予定。また、LLMを活用したビジネス開発に携わるエンジニアの新規採用を実施し、体制強化に努めるとしている。

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画特集

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]