コンテンツにスキップ

クラウド TTS

クラウド API 型で TTS を提供する日本企業。

市場概況

クラウド TTS API 市場は、日本語音声合成の商用化が最も進んだセグメントである。本調査では 22 社がこのセグメントに分類され、東証上場企業(株式会社エーアイ・LINEヤフー・Hmcomm・HOYA)から未上場のスタートアップまで幅広い。公開されている売上高では、エーアイが約 18.5 億円、Hmcomm が約 10.4 億円と比較的小規模な収益が多く、クラウド TTS 単体での大規模収益化よりも SDK や受託開発との複合モデルが主流となっている。近年は生成 AI の台頭を背景に参入が相次ぐ一方、2026 年 2 月のにじボイス(Algomatic)サービス終了、Stability AI Japan の 2025 年 9 月法人清算、オルツの 2024 年 10 月上場後に発覚した売上 91% 架空計上(119 億円過大計上、経営陣逮捕・会社清算)など、過熱気味の競争環境の中で撤退・破綻も増加している。市場の成熟度はミドルレンジにあり、大手テクノロジー企業(KDDI・NTT・LINEヤフー)はクラウド API を自社サービス統合に留め、外販 SDK に注力するプレイヤーとの棲み分けが進んでいる。

HOYA の音声事業は 2025 年 10 月に丸の内キャピタルへ譲渡され、テクノスピーチは 2025 年 1 月にアイビス(東証グロース)の子会社となるなど、M&A による業界再編も加速している。価格競争とコモディティ化が進む中で、特定業種(コールセンター・自治体・放送)や特定言語(日本語高品質)に特化したニッチ戦略が有効な市場環境となっている。

主要プレイヤー

株式会社エーアイ(AITalk / AICloud)は東証スタンダード上場の音声合成専業企業で、AITalk WebAPI によるクラウド API 提供と SDK ライセンスを組み合わせた混合モデルを採る。公共・放送・業務システム向けに深い実績を持ち、売上高約 18.5 億円は日本語特化 TTS 商用企業として国内最大級の規模感である。Unity 向け拡張「A.I.VOICE for GAMES」も展開しており、ゲーム SDK 領域で uPiper との直接競合が発生する。

HOYA 株式会社(ReadSpeaker JP / 旧 VoiceText)は、「VoiceText Web API」と「ReadSpeaker speechCloud API」によるクラウド TTS に加え、組み込み向けの speechEngine SDK Embedded(6–35 MB/音声)を展開し、駅・新幹線・自治体・ゲーム(FREEDOM WARS Remastered)など幅広い実績を持つ。2025 年 10 月に HOYA から丸の内キャピタルへ売却が完了しており、今後の戦略転換が注目される。

Hmcomm 株式会社は東証グロース上場(265A)で、クラウド音声合成・音声認識・産業用ロボット向け音声 AI を手掛ける。売上高は約 10.4 億円で高 confidence の財務データが取得できており、コンタクトセンター向け VContact や対話 AI ロボット VRobot を核とした B2B 特化モデルを展開する。

LINEヤフー株式会社は CLOVA Voice による高品質クラウド TTS API を外部提供しており、Yahoo! カーナビ向けオンデバイス TTS の社内活用も行う。売上高 2 兆円規模のコングロマリットであり、TTS は事業全体のごく一部だが、API 品質・インフラ信頼性は市場参照点となっている。

株式会社テクノスピーチは CeVIO AI / VoiSona エンジンとクラウド API、組み込み SDK を展開する。2025 年 1 月にアイビス(東証グロース 9343)の子会社となり、親会社のモバイル事業基盤を活かした事業拡大が進む可能性がある。

uPiper の立ち位置

uPiper(StyleTTS2/Kokoro 系日本語特化軽量 TTS・Unity SDK)はクラウド TTS API 市場とは異なるレイヤーに位置する。クラウド TTS の主戦場が「企業向け SaaS・公共インフラ・コールセンター」であるのに対し、uPiper は「ネット接続なし・月額ゼロコスト・Unity ネイティブ統合・インディーゲーム/個人開発者向け」という象限でポジショニングする。にじボイスの撤退(2026 年 2 月)が生み出した「軽量・低コスト・キャラクター音声 API」の市場空白は、オンデバイス完結という逆の方向で埋めるチャンスがある。大手クラウド事業者との直接競争は避けつつ、「クラウド依存コストをゼロにしたい開発者」への訴求が差別化の核となる。

該当企業

企業名 主要プロダクト 上場 売上(直近) ビジネスモデル 確度
株式会社エーアイ - ¥1,850M mixed high
株式会社AI Shift - - 非公開 saas_subscription medium
株式会社Algomatic - - 非公開 mixed medium
株式会社オルツ - ¥875M mixed high
株式会社サイバーエージェント(AI Lab・音声合成研究) - ¥874,030M mixed medium
株式会社CoeFont - - 非公開 mixed medium
株式会社ドワンゴ - - ¥18,038M※ mixed medium
Hmcomm株式会社 - ¥1,040M mixed high
HOYA株式会社 (ReadSpeaker JP / 旧 VoiceText) - ¥586M license_sdk high
株式会社インターネット - - 非公開 license_sdk medium
株式会社KDDI総合研究所 - - ¥5,649M enterprise_license high
LINEヤフー株式会社 - ¥2,036,366M api_paas medium
にじボイス(株式会社Algomatic 事業) - - 非公開 api_paas medium
NTTアドバンステクノロジ株式会社 - - ¥74,300M license_sdk medium
株式会社RevComm - - 非公開 saas_subscription medium
rinna株式会社 - - 非公開 mixed medium
シャープ株式会社(RoBoHoN / コミュニケーションロボット事業) - 非公開 mixed medium
SpiralAI株式会社 - - 非公開 mixed medium
Stability AI Japan株式会社 - - 非公開 api_paas medium
株式会社テクノスピーチ - - ¥117M mixed medium
つくよみちゃんプロジェクト (夢前黎運営) - - 非公開 mixed medium
ヤマハ株式会社 - ¥462,080M mixed medium