株式会社MIXI¶
1 行サマリー¶
東証プライム上場・連結売上1,548億円のモバイルゲーム×コミュニケーション企業。会話AIロボット「Romi」の自社TTS開発と複数Unityタイトル運用が主要な音声需要源。
事業構造と TTS 需要¶
MIXIは4セグメントを持つ総合デジタルエンターテインメント企業である。
デジタルエンターテインメント事業(売上940億円・最大セグメント) 主力は「モンスターストライク(モンスト)」。クライアントはCocos2d-x製だが、新規タイトル(ゴーストスクランブル・コトダマン)はUnity採用。UE5採用タイトル「Asym Altered Axis」も開発中。声優ボイスを大量に収録する運用モデルで、TTS需要は現状限定的だが、NPCセリフ自動生成・多言語ローカライズ(インド・北米展開)・ゲーム内アナウンスなどでzero-shot TTS需要が浮上しつつある。モンストはインドで2026年4月にグローバル展開「STRIKE WORLD」を開始しており、多言語対応コスト削減が急務。
ライフスタイル事業(売上148億円) 「家族アルバム みてね」は世界175か国・3,000万ユーザー超。7言語対応のグローバルサービスで、将来的な音声読み上げ(思い出振り返り・多言語ナレーション)需要は潜在的に大きい。
会話AIロボット「Romi」(ライフスタイル事業傘下) 最重要音声需要源。独自ディープラーニングTTSで日本語4種ボイス(オリジナル・ソフト・イノセント・リライアブル)を2025年6月にリリース。ハードウェアロボット向けのオンデバイス軽量TTSへの関心が高い。多言語化・感情表現強化が次のステップと推定される。システムアーキテクチャ上ではText-to-Speech・Speech-to-Text・Voiceprint Recognitionの3レイヤーを明示しており、TTS部分は自社開発または外部調達の混在。※当方推定
スポーツ事業(売上402億円) TIPSTAR・チャリ・ロト等のオンライン車券販売。音声ナレーション(レース情報読み上げ)の潜在需要あり。
AI全社化(2026年3月) MIXI MEETUP AI DAY 2026にて17部門・23事例を公開。AI利用率99%、月間1.76万時間・年10億円のコスト削減を達成。ChatGPT Enterprise・Google Agentspace全社導入済み。音声系AIへの言及は公開情報では限定的だが、AI前提の組織体制が整備されており、音声合成の外部調達議論が起きやすい土壌がある。
現在の TTS 状況¶
| 用途 | 採用技術 | 確認度 |
|---|---|---|
| Romi 音声認識 | Google Cloud Speech-to-Text (latest_short モデル) | 公式確認 |
| Romi 声認証 | 株式会社エーアイ vGate Authentication | 公式確認 |
| Romi 音声認識オフライン | 株式会社エーアイ vGate ASR | 公式確認 |
| Romi 音声合成(TTS) | 自社ディープラーニング TTS(詳細非公開) | 公式発表あり・詳細不明 |
| ゲームボイス | 声優収録音声(CRI ADX / OpenAL / Wwise) | 技術ブログ確認 |
| ゲームボイスチャット | 内製ボイスチャット(Rust + iOS/Android native) | 技術ブログ確認 |
現状TTS整理: - Romi用TTS:ディープラーニングベースで自社開発。ただし開発負荷と品質向上のために外部高品質TTSへの乗り換え余地がある。※当方推定 - ゲーム事業:声優ボイス一辺倒で現時点でTTS採用実績は不明。多言語展開加速で低コストTTSの検討機会が増える見込み。 - 置き換え障壁:Romiのボイスはブランドイメージに直結するため、品質水準のハードルが高い。「滑らかで息遣いまで感じられる」という公式表現を超えるクオリティが前提条件。
購買仮説¶
仮説1(Romi次世代TTS): Romi Lacatanモデルは2024年10月発表・2025年発売の新世代。次モデルに向けて多言語化(英語・中国語等)対応TTS or zero-shot感情合成の外部調達可能性がある。現在の自社開発TTSは日本語特化とみられ、グローバル展開フェーズで限界が来やすい。次世代TTS(zero-shot・多言語)はRomi事業部にとって有力な代替候補。
仮説2(ゲーム多言語ローカライズ): モンスト STRIKE WORLDのインド展開など多言語展開の加速でゲーム内テキスト読み上げの需要が顕在化。piper-plus(OSS・軽量・多言語)は試験採用のハードルが低い。
仮説3(みてね多言語ナレーション): 3,000万ユーザー・175か国・7言語対応サービスで、思い出スライドショーの音声ナレーション機能実装はユーザー価値向上施策として自然。
想定決裁者: - Romi事業: ライフスタイル事業本部長またはRomi開発責任者(技術部長クラス) - ゲーム: デジタルエンターテインメント事業本部の技術部長・プロジェクトリード - AIエンジニア採用ページから「機械学習・音声」担当者へのアプローチも有効
予算サイクル: 3月決算。10〜12月の翌期計画策定期が提案に最適なタイミング。AI投資を全社的に推進中(年10億円のコスト削減実績)で外部ベンダー採用の決裁が通りやすい環境。
PoC 予算推定: 100万〜500万円(Romi次世代TTS評価PoC)〜 最大500万円(ゲーム多言語TTS試験)。※当方推定
アプローチ戦略¶
フェーズ1: piper-plus OSS での技術接点形成¶
Romi開発チームまたはゲーム開発チームのエンジニアに対して、OSS(piper-plus)で軽量オンデバイスTTSの動作検証を提案する。
- アプローチ先: MIXI TECH CONFERENCEや技術ブログ(Zenn / ミクシル)にて発信しているエンジニア・研究者
- 接触チャネル: CEDEC 2026(2026年7月22-24日、パシフィコ横浜)の音声・AIセッションで接点形成。MIXI社員は毎年登壇している実績あり。
- 提案文面キーフレーズ案:
「Romiの次世代音声合成にゼロショットTTSで多言語対応コストをゼロに。OSS版piper-plusからPoC評価できます」 「モンストのグローバル展開(STRIKE WORLD)でNPCセリフ多言語対応を声優収録なしで実現—Unity SDKで3営業日組み込み」
フェーズ2: 次世代TTS(クローズド)PoC¶
Romi次世代モデル開発フェーズ(2026〜2027年)にあわせ、zero-shot・感情表現対応の次世代TTSをRomi事業本部へ提案。
- 対象部門: ライフスタイル事業本部・Romi開発チーム
- 差別化ポイント: オンデバイス推論(Romiはローカル音声認識を採用しており、オンデバイスTTSへの親和性が高い)・日本語高品質・感情表現の豊かさ・多言語拡張容易性
アプローチ優先順位¶
- Romi事業本部(次世代TTS PoC) ← 最優先、技術的フィット高
- デジタルエンターテインメント(STRIKE WORLD多言語TTS) ← 中優先
- みてね事業(ナレーション機能) ← 中長期
関連プロダクト・採用事例¶
音声関連プロダクト: - Romi(会話AIロボット): 独自ディープラーニングTTS・Google Cloud STT・vGate ASR採用。2024年10月Lacatanモデル発売、CES Innovation Awards 2025受賞、グッドデザイン賞2025受賞。大阪・関西万博2025「ロボットエクスペリエンス」に出展。 - モンスト(ゴーストスクランブル): 内製ボイスチャット(Rust + GKE/Agones)、Monobit Unity Networking 2.0採用 - コトダマン: Unity + CRIWARE ADX採用 - Asym Altered Axis: Unreal Engine 5 + Wwise採用
技術スタック(音声周辺): - ゲームサウンド: OpenAL / CRIWARE ADX / Wwise - クラウド: GCP(GKE・Compute Engine A100 GPU・BigQuery・Looker) - AI: TensorFlow / Keras / PyTorch / LightGBM / EdgeTPU
登壇・公開技術情報: - MIXI TECH CONFERENCE 2023/2024(自社イベント) - AI研修資料(Speaker Deck公開、2025年新卒向け) - MIXI MEETUP! AI DAY 2026(23事例公開) - Zenn mixi DEVELOPERSテックブログ
リスク・注意点¶
-
Romi TTS自社開発の既得権益: MIXIはディープラーニングTTSを内製しており、外部調達に対する心理的・組織的抵抗がある可能性。「ブランドの声」はコアアセットであり、担当者が変更に慎重なケースが多い。
-
ゲーム事業での声優文化: モンストは声優ボイス・ファンコミュニティが強力であり、TTS置き換えは受け入れられにくい。新規NPCや多言語版での補完的使用が現実的。
-
モンスト MAU 低下リスク: 2026年3月期でモンスト MAUが低下傾向で、開発予算の引き締まりが懸念される。PoC提案は「コスト削減」か「海外展開加速」の文脈でないと通りにくい。
-
AI内製化方針: 全社AI活用率99%・年10億円削減を達成しており、ChatGPT Enterprise・Google Agentspaceを全社導入済み。一般的なAIツールは内製/大手に任せ、専門ベンダーへの支出には厳しい目が向く可能性。
-
競合TTS大手の存在: Google Cloud TTS・AWS Polly・CoeFont等の大手は既存の関係性(Google CloudはRomiの音声認識で採用済み)から継続採用されやすい。
-
コンプライアンス・データプライバシー: みてね・Romiはユーザーの生の声や家族写真を扱うプロダクト。音声データの外部送信に対して厳格なプライバシー要件があり、オンデバイス推論を提供できることが前提条件になりうる。
-
インド展開のローカル規制: STRIKE WORLDはインド展開中。現地データ保持要件・音声コンテンツの言語規制に対応したTTSが必要。
連絡先候補¶
公式窓口: - 資本提携・M&A問い合わせフォーム: https://mixi.co.jp/en/inquiry/(事業提携に最も近い窓口) - プレス問い合わせフォーム: https://mixi.co.jp/inquiry/press/(技術メディア露出後のプッシュ用) - 開発者向け技術問い合わせ: platform-info@mixi.co.jp(件名「【技術的な問い合わせ】(会社名)」)
採用経由のリサーチ: - AIエンジニア採用ページ: https://mixigroup-recruit.mixi.co.jp/occupation/engineer/12083/ - エンジニア求人一覧: https://herp.careers/v1/mixigroup
イベント・コミュニティ接点: - CEDEC 2026(2026年7月22-24日、パシフィコ横浜ノース)—MIXI社員の登壇実績あり - MIXI TECH CONFERENCE(自社イベント、年1回)—Romi・モンスト技術者が登壇 - Zenn mixi DEVELOPERSテックブログのコメント・GitHubイシュー経由でのエンジニア接触
IR: - 投資家向け問い合わせフォーム: https://mixi.co.jp/en/inquiry/ - IR担当: ir@mixi.co.jp(推定、公式IRページ参照)
uPiper との位置関係¶
MIXIはRomiという会話AIロボット事業で独自TTSを内製している唯一の日本ゲーム上場企業の一つ。uPiperの「OSS多言語TTS + ロボット向けオンデバイス推論」はRomiの次世代モデルにとって技術的フィットが高い。ゲーム事業ではモンストのグローバル展開(STRIKE WORLD)での多言語コスト問題が具体的な購買動機になりうる。競合というよりもパートナー・ベンダー関係として攻めるべき相手。Romi事業部へのターゲットを絞った次世代TTS PoC提案が最短ルート。