サイバーエージェント、225億パラメータの日本語LLMバージョン3を公開--スクラッチ開発

 サイバーエージェントは7月9日、225億パラメータの日本語LLM(大規模言語モデル)である「CyberAgentLM3」を公開したことを発表した。

 同社はかねてから日本語LLMの開発に取り組み、2023年5月に独自の日本語LLMである「CyberAgentLM」を一般公開。同年11月にバージョン2となる「CyberAgentLM2」を、2024年6月には視覚を付与したVLM(大規模視覚言語モデル)を公開している。

 今回公開したモデルは、既存モデルをベースに用いずスクラッチで開発を行なった225億パラメータの「CyberAgentLM3-22B-Chat」。LLMの日本語能力を評価する「Nejumi LLM リーダーボード3」においては、700億パラメータの「Meta-Llama-3-70B-Instruct」と同等の性能となっており、2024年7月現在において、スクラッチ開発のオープンな日本語LLMとしてはトップクラスの性能としている。なお、モデルは商用利用可能なApache License 2.0で提供されている。

ニュースリリース
モデルURL
デモURL

CNET Japanの記事を毎朝メールでまとめ読み(無料)

-PR-企画広告

企画広告一覧

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]