サイバーエージェントは5月17日、最大68億パラメータの日本語LLM(Large Language Model:大規模言語モデル)を一般公開したと発表した。
近年、OpenAIが開発した「ChatGPT」を始めとする生成AI・LLMが急速な進化を遂げており、あらゆる業界・ビジネスにおいて活用が進んでいる。一方、既存のLLMのほとんどは英語を中心に学習されているため、日本語および、日本文化に強いLLMは少ない状況にある。
同社では、日本語LLMの開発に取り組んでおり、今回その一部モデルを「Hugging Face Hub」にて公開した。公開されたモデルは、オープンな日本語データ(Wikipediaおよび、Common Crawlを使用)で学習したもので、商用利用可能な「CC BY-SA 4.0ライセンス」(ライセンスについては、モデル公開ページに詳細の記載あり)で提供される。なお、同モデルは日本国内における現行の公開モデルにおいて最大級の規模になるという。同モデルをベースとしてチューニングを行うことで、対話型AIなどの開発も可能になるという。これにより、日本語の自然言語処理に関する最先端の研究開発に取り組めるとしている。
同社では、これまで培った知見を生かし、チャットボットやRPAをはじめとする業界特化型のLLMの構築、各企業と連携したLLMを活用したビジネス開発の推進などを予定。また、LLMを活用したビジネス開発に携わるエンジニアの新規採用を実施し、体制強化に努めるとしている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
ZDNET×マイクロソフトが贈る特別企画
今、必要な戦略的セキュリティとガバナンス