サイバーエージェントは7月9日、225億パラメータの日本語LLM(大規模言語モデル)である「CyberAgentLM3」を公開したことを発表した。
同社はかねてから日本語LLMの開発に取り組み、2023年5月に独自の日本語LLMである「CyberAgentLM」を一般公開。同年11月にバージョン2となる「CyberAgentLM2」を、2024年6月には視覚を付与したVLM(大規模視覚言語モデル)を公開している。
今回公開したモデルは、既存モデルをベースに用いずスクラッチで開発を行なった225億パラメータの「CyberAgentLM3-22B-Chat」。LLMの日本語能力を評価する「Nejumi LLM リーダーボード3」においては、700億パラメータの「Meta-Llama-3-70B-Instruct」と同等の性能となっており、2024年7月現在において、スクラッチ開発のオープンな日本語LLMとしてはトップクラスの性能としている。なお、モデルは商用利用可能なApache License 2.0で提供されている。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
NTT Comのオープンイノベーション
「ExTorch」5年間の軌跡
先端分野に挑み続けるセックが語る
チャレンジする企業風土と人材のつくり方
日本のインターステラテクノロジズが挑む
「世界初」の衛星通信ビジネス
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力
すべての業務を革新する
NPUを搭載したレノボAIパソコンの実力