日本語特化LLM「Syn Pro」が32B以下部門で国内トップ獲得
ベストカレンダー編集部
2025年10月24日 11:47
Syn Pro発表
開催日:10月24日
日本語特化LLM「Syn Pro」が示す評価と成果
カラクリ株式会社(代表取締役CEO 小田志門)とグローバルAIスタートアップのUpstageが共同で開発した日本語大規模言語モデル(LLM)「Syn Pro(シン・プロ)」の概要と外部評価について整理する。両社は2025年10月24日付で本モデルの開発完了と成果を公表している。
Syn Proは、Weights & Biases Japanが運営するNejumi Leaderboard 4の評価において、32Bパラメータ以下のモデル群で日本語性能第1位を獲得し、さらに世界トップ20入りを果たした(Upstage社・カラクリ社調べ、2025年10月時点、Nejumi Leaderboard 4の評価に基づく)。この実績は、同等クラスの大規模モデルと比較して日本語の文脈理解や文化的ニュアンス処理で優位性を示している。
- 評価ランク: Nejumi Leaderboard 4にて32B以下の部門で日本語性能第1位、世界トップ20入り(2025年10月時点)。
- 比較対象: より大規模なモデルであるGPT OSS-120Bを超える精度・文化的文脈理解を示したと報告。
- 発表日: 2025年10月24日 10時00分(カラクリ発表)。
技術的手法とコスト・開発期間の最適化
Syn Pro開発における技術的アプローチとインフラ選定は、ローカライズの効率化と短期実装を両立させることを目的としている。カラクリは日本語処理や業務ロジックの最適化を主導し、Upstageのグローバル開発力と組み合わせることで高い開発効率を実現した。
特に注目すべきは、開発コストと期間の面での成果である。ローカライズにかかるコストを従来比で約50%削減し、着手からサービス発表までわずか2か月で完了した点が報告されている。コスト削減は主にAWS Trainiumの活用によるもので、NVIDIAのGPUと比較してトレーニングコストを約50%削減できたことが大きいとされる。
Trainiumの採用とMoE学習
AWS TrainiumはGPU資源が世界的に逼迫する状況下でも確保しやすいことが利点とされ、Syn Proの分散学習と運用コスト最適化に寄与した。カラクリはTrainium上での分散学習設計や棄却サンプリングを含むファインチューニング手法を取り入れている。
また、カラクリは世界で初めてTrainiumを用いたMoE(Mixture of Experts)モデルの学習に成功したと自社調査で報告(2024年5月時点、オープンソースおよび公開情報を基にした同社調べ)。Syn Proでもこれまで培ったTrainium関連技術を活かし、インフラコストの最適化と短期開発を実現している。
- 主な技術要素
- ・AWS Trainiumを用いた分散学習・トレーニングコスト削減
- ・棄却サンプリングを含むファインチューニング手法
- ・MoE(Mixture of Experts)モデル学習の実績
- ・独自の推論制御機能「Reasoning Budget(推論バジェット)」によって速度と精度を動的に制御
詳細な技術レポートはKARAKURI Tech Blogに公開されており、分散学習設計や学習手法の具体的な説明が紹介されている。技術レポートのURL: https://zenn.dev/karakuri_blog/articles/b923acfc86083b
導入形態、用途、Synシリーズの展開
Syn Proは企業の運用要件に応じてオンプレミスやプライベートクラウド等に柔軟に展開できる設計となっている。外部APIコールを行わない構成が可能であり、データ流出防止やコンプライアンス対応が求められる業界での導入に適している。
日本語のニュアンスや業務ロジックに深く最適化されているため、金融、医療、保険、法務など精度と信頼性が重要な分野での利用が想定される。既に複数のリーディング企業から信頼を得ているとされる。
Synシリーズとソリューション展開
Syn Pro(32B未満のモデル)に加え、軽量モデルであるSyn(11B)など複数のモデルを含むSyn LLMファミリーとして展開される。これにより、軽量な推論環境から複雑な推論タスクまで用途に応じた選択が可能である。
Synシリーズの信頼性はワークステーション型共同ソリューション「SolarBox」(日本HPとコンセプト展示)にも組み込まれており、セキュアなオンプレミス環境での利用を想定した提供形態が示されている。対象ユーザーとしては次のような層が想定される。
- CIO・ITリーダーで生成AIを社内展開したい組織
- 法務・コンプライアンス・リスク部門で検証可能かつ安全なAIを求める部署
- オンプレミス/プライベートクラウドでのデータ管理を重視する企業
- 高精度な日本語処理を必要とする公共機関
- 特定領域向けAIアプリケーションを構築する開発者・ビルダー
市場背景、関係各社とカラクリの企業情報
ローカライズを巡る市場環境として、Bonafide Researchの報告『Japan Large Language Model Market Overview, 2030』(2025年5月発表)では、日本のLLM市場が2025年から2030年の期間で約10.8億ドル規模に成長する見込みが示されている。高精度な日本語理解、国内規制対応、業務システムとの互換性が市場進出の鍵となる。
Upstageは高性能かつ安全性を重視した生成AIソリューションを提供する企業で、AmazonおよびAMDからの出資を受けている。Upstageは日本語特化の次世代LLMを提供し、保険・法律・医療などの規制産業において非構造文書から実用的なビジネス価値を抽出するユースケースで実績をあげている。
カラクリの企業概要と実績
カラクリは「Friendly Technology」をビジョンに、カスタマーサポート向けのLLM実用化を進めるAIスタートアップである。2018年以降にBERTの研究を開始し、2022年からGPTを含むLLM研究に取り組んでいる。SaaS事業のKARAKURIシリーズは高島屋、SBI証券、セブン-イレブン・ジャパン、星野リゾート等の導入実績がある。
主な実績として以下が挙げられる。
- 2018年: ICCサミット「スタートアップ・カタパルト」入賞
- 2020年: Google for Startups Accelerator 2020に採択
- 2022年: Google for Startups Growth Academy Tech 2022に採択
- 2023年: AWS LLM開発支援プログラムに採択
- 2024年: 生成AI実用化推進プログラムに認定
- 2024年: Meta社 完全招待制の生成AI開発者会議に参加
- 2024年: 経産省「GENIAC」に採択
会社情報(抜粋): 住所 〒104-0045 東京都中央区築地2-7-3 Camel 築地 II 5F、設立 2016年10月3日、代表者 代表取締役CEO 小田 志門。事業内容はカスタマーサポート特化型AI「KARAKURI」シリーズの開発・提供・運営など。関連URL: https://about.karakuri.ai/ および https://karakuri.ai/。
要点の整理(表)と締めくくり
以下に本記事で述べたSyn Proの主要情報を表形式で整理する。表は開発成果、技術的特徴、導入形態、対象業界、関連企業・調査、カラクリの企業情報をまとめたものである。
| 項目 | 内容 |
|---|---|
| モデル名 | Syn Pro(32Bパラメータ未満) |
| 評価・実績 | Nejumi Leaderboard 4で32B以下の日本語性能第1位、世界トップ20入り(2025年10月時点) |
| 開発体制 | カラクリ(日本語最適化・モデル最適化)× Upstage(グローバル開発力) |
| コスト・期間 | ローカライズコスト約50%削減、開発期間2か月(着手からサービス発表まで) |
| インフラ・技術 | AWS Trainium活用によるトレーニングコスト最適化、MoE学習実績、棄却サンプリングファインチューニング、Reasoning Budget機能 |
| 導入形態 | オンプレミス、プライベートクラウド等に柔軟に対応(外部API非依存構成可能) |
| 想定導入先 | 金融・保険・医療・法務等の規制業種、CIO/ITリーダー、法務・コンプライアンス部門、公共機関、開発者 |
| 関連ソリューション | Syn(11B)を含むSyn LLMファミリー、SolarBox(日本HPとのコンセプト展示) |
| 市場背景 | Bonafide Research: Japan LLM市場が2025-2030で約10.8億ドルの成長見込み |
| カラクリ 会社情報 | 設立 2016年10月3日、代表 小田 志門、所在地 東京都中央区築地2-7-3 Camel 築地 II 5F、事業 カスタマーサポート向けAI |
本稿はカラクリとUpstageによるSyn Pro開発に関する公表内容を整理して伝えた。技術的な詳細や実装手法についてはKARAKURI Tech Blogの開発レポートに具体的な説明が掲載されているため、さらなる技術情報は同レポートを併せて参照されたい。
参考リンク: