2024年3月21日公開!楽天の日本語特化AIモデル「Rakuten AI 7B」の実力とは
ベストカレンダー編集部
2024年12月9日 15:10
Rakuten AI 7B公開
開催日:3月21日
楽天が2024年度「IT賞(オープンイノベーション領域)」を受賞
楽天グループ株式会社(以下「楽天」)は、2024年12月9日、公益社団法人企業情報化協会(以下「IT協会」)が主催する2024年度(第42回)IT賞において、「IT賞(オープンイノベーション領域)」を受賞しました。この受賞は、日本語に特化した大規模言語モデル(以下「LLM」)である「Rakuten AI 7B」の取り組みが高く評価された結果です。
IT賞は、国内の産業界や行政機関において、ITを高度に活用したビジネス革新に顕著な努力を払い、成果を挙げた企業や団体、個人に授与されるものです。楽天は、AI化を意味する造語「AI-nization(エーアイナイゼーション)」をテーマに掲げ、ビジネスのあらゆる面でAIの活用を推進しています。
「Rakuten AI 7B」のプロジェクト概要
受賞したプロジェクト「Rakuten AI 7B」は、日本語に特化した高性能な大規模言語モデルの構築を目指すものであり、以下のようなモデルが開発されています。
- 基盤モデル: 日本語に最適化された高性能のLLM「Rakuten AI 7B」
- インストラクションチューニング済モデル: 基盤モデルを基にした「Rakuten AI 7B Instruct」
- チャットモデル: インストラクションチューニング済モデルを基にファインチューニングを行った「Rakuten AI 7B Chat」
これらのモデルは、2024年3月21日(木)にオープンなモデルとして公開される予定です。「Rakuten AI 7B」は、フランスのAI企業Mistral AI社のオープンモデル「Mistral-7B-v0.1」を基にしており、70億パラメータを持つ日本語基盤モデルです。発表当時、「LM Evaluation Harness」の評価基準において、基盤モデルとインストラクションチューニング済モデルがオープンな日本語LLMにてトップを獲得しました。
受賞理由と技術的背景
楽天が「IT賞(オープンイノベーション領域)」を受賞した理由は、以下のような取り組みと成果にあります。
- 長年にわたるEコマース領域特有のテキスト処理に関する経験とデータの活用
- 独自に開発した形態素解析器の適用
- LLM学習対象データの洗練
- 70億パラメータという軽量なLLMの開発によるAIによる大量消費電力問題への効率的な対応
これにより、楽天は高品質なLLMを構築し、ビジネスにおけるAIの活用を一層進めることができました。特に、70億パラメータという軽量性は、昨今のAI技術における重要な課題である消費電力の問題に対しても効果的に対応できる点が評価されています。
「Rakuten AI 7B」の技術的特性と評価
「Rakuten AI 7B」は、以下のような技術的特性を持っています。
- 基盤モデル
- 膨大な量のデータに対して事前にトレーニングされ、特定のタスクやアプリケーションに適応するためにファインチューニングが可能。
- インストラクションチューニング済モデル
- 指示形式のデータで基盤モデルをファインチューニングしたもので、利用者が入力した指示に対して返答を生成できる。
- チャットモデル
- 会話形式や指示形式のデータにてファインチューニングされた基盤モデルで、会話形式で質問への返答が可能。
これらの技術的特性は、楽天が目指す「AI-nization」の実現に向けて重要な役割を果たしています。
受賞に関するまとめ
楽天の「Rakuten AI 7B」は、2024年12月時点で約74,000件のダウンロードを達成しています。この成果は、AI技術の進化と共に、ビジネスの現場におけるITの活用が新たな価値を生み出すことを示しています。
項目 | 内容 |
---|---|
受賞名 | 2024年度「IT賞(オープンイノベーション領域)」 |
受賞日 | 2024年12月9日 |
プロジェクト名 | Rakuten AI 7B |
モデル種類 | 基盤モデル、インストラクションチューニング済モデル、チャットモデル |
パラメータ数 | 70億 |
ダウンロード数 | 約74,000件(2024年12月時点) |
以上のように、楽天の取り組みは日本語に特化したLLMの開発を通じて、ITの革新を実現し、ビジネスの成長を促進しています。今後も楽天は、豊富なデータと最先端のAI技術を活用し、さらなる価値創出を目指していくことでしょう。