コンテンツにスキップ

株式会社リクルート(スタディサプリ)

1 行サマリー

リクルートHD傘下・国内最大級 EdTech「スタディサプリ」は生成 AI 英会話を全面展開中だが、TTS の内製・外部調達は非公開で、音声品質向上余地が大きい中優先度 B。

事業構造と TTS 需要

リクルートホールディングス(東証プライム 6098)は人材・不動産・教育の三本柱を持ち、教育領域では「スタディサプリ」ブランドで以下のサービスを展開している(2025 年 3 月期連結売上高 3 兆 5,574 億円、グループ従業員 49,480 名)。

主要サービス群(2026 年時点):

サービス 対象 規模感
スタディサプリ 高校講座・中学講座・小学講座 個人 / 学校 全国高校約 2,322 校導入(2024 年 3 月時点、全国の約 46%)
スタディサプリ ENGLISH(TOEIC・ビジネス英語・日常英会話) 個人 / 法人 有料会員 157 万人超(※当方推定、COVID 期ピーク値)
スタディサプリ 法人 ENGLISH 企業向け ANA・パナソニック・JCB 等大手多数

TTS 需要が発生しうる主なユースケース:

  1. AI 英会話(双方向型 AI 英会話)の返答音声
    2026 年 4 月より ENGLISH 全主要講座へ展開した「双方向型 AI 英会話」は、生成 AI がリアルタイムに応答し、ユーザーへの発話フィードバックも提供する。AI の返答音声には何らかの TTS が必要であり、使用ベンダーは非公開。英語の自然な発音・感情表現・低レイテンシが要件となる。

  2. AI 字幕の次フェーズとしての読み上げ(アクセシビリティ拡張)
    2025 年 2 月に高校講座でホイスパー + GPT-4o を用いた字幕生成機能を開始。同社はこれを「ユニバーサルデザインの第一歩」と位置づけており、「AI 翻訳・多言語対応・ルビ振り機能」を次フェーズとして明示している。多言語音声読み上げへの需要は必然的に発生する。

  3. 法人 ENGLISH の企業研修コンテンツナレーション
    最短 5 営業日で導入可能な法人向けサービスでは、カスタムコンテンツ追加時のナレーション自動生成ニーズが潜在する。現在は収録済み素材依存と推測されるが、コンテンツ量増加でコスト圧迫が起きる。

  4. 外国人・帰国子女向け多言語字幕・読み上げ(検討段階)
    AI 字幕機能の発表に「日本語を母語としない子どもの学習支援」が明記されており、将来的な多言語 TTS(日→英・英→日等)需要が示唆される。

現在の TTS 状況

確認できた音声技術:

  • Google Cloud Speech-to-Text(音声認識): スタディサプリ ENGLISH のスピーキング評価(リード&ルックアップ)において採用済み。選定理由は「日本人の発音でもネイティブが認識できる精度」で「他の主要 API より頭 2 つ抜けていた」と公式ブログに記載。
  • OpenAI Whisper(音声認識): 高校講座の字幕生成に large-v3 モデル(ローカル実行)を採用。
  • OpenAI GPT-4o(LLM): 字幕校正に採用。

TTS(音声合成)に関しては情報なし:
AI 英会話の AI 返答音声のベンダーは未公開。英語 AI 会話の音声出力がブラウザ/アプリの Web Speech API 依存である可能性もある。コンテンツ本体(講義動画)は実人間講師の収録音声を使用しており、TTS は未導入と推定される。

依存度・置き換え障壁:
音声認識(STT)は Google Cloud に依存しており、移行コストは高い。一方、TTS は明示的な採用ベンダーが確認できていないため、新規導入・試験導入の余地が存在する。既存技術スタックが Google Cloud ベースのため、Google TTS の採用が競合として最も強力。

購買仮説

なぜ買いそうか:

  1. 双方向型 AI 英会話のユーザー体験向上: AI 返答音声の自然さ・感情豊かな発音は学習意欲に直結する。既存の単純 TTS に不満があれば、次世代 TTS(ElevenLabs 品質や zero-shot 感情合成)への切り替え動機が生じる。
  2. 多言語コンテンツ拡張の加速: AI 字幕の次フェーズで多言語読み上げが必要になった際、日本語ネイティブ対応 TTS は外せない。piper-plus のような多言語 OSS はプロトタイプ的な採用から始まる可能性がある。
  3. コスト削減圧力: 合格特訓コース・塾向けサービス・English for KIDS など複数サービスを 2025 年中に終了しており、コスト意識が高まっている。OSS ベースの piper-plus はクラウド API 比コスト優位。

想定決裁者:

  • スタディサプリ教育 AI 研究所のリサーチリード / プロダクトマネージャー
  • ENGLISH 開発部門の技術責任者(AI 会話機能担当)
  • グループ CTO・技術部門(リクルートホールディングス IT 統括)

予算サイクル:
リクルートの事業年度は 4 月〜翌 3 月。新機能の PoC 予算は下期(10〜3 月)に集中しやすい。双方向型 AI 英会話が 2026 年 4 月に全面展開されたばかりであり、品質改善・コスト最適化の予算審議が 2026 年夏〜秋(Q2 予算検討期)に起きる可能性が高い。

アプローチ戦略

推奨ルート: next-gen TTS PoC から入る(piper-plus は補助的位置づけ)

スタディサプリ ENGLISH の双方向型 AI 英会話における音声出力品質の差別化を提案の起点とする。Google TTS / Azure TTS との音質比較デモが最も刺さりやすい。

ターゲット部門:
第一当たり先は「スタディサプリ教育 AI 研究所」または「スタディサプリ ENGLISH 開発チーム」。法人 ENGLISH 側には eigosapuri-biz.jp/inquiry から直接問い合わせることも可能。採用ページ(エンジニア職)を経由して AI 担当者を特定するアプローチも有効。

提案キーフレーズ案:

「双方向型 AI 英会話における AI 音声の自然さは学習継続率を左右します。現在の TTS に比べ、next-gen zero-shot TTS では英語話者の感情表現・アクセント再現が大幅に向上します。3 週間の PoC でユーザー満足度への影響を計測しませんか?」

「AI 字幕の次フェーズとして多言語読み上げ(日本語→英語・英語→日本語)を検討されているなら、オンデバイス推論対応の piper-plus は iOS/Android アプリへの組み込みコストを抑えつつプロトタイプが可能です。」

差別化ポイント:

  • zero-shot 音声クローン(特定講師の声で多言語生成)→ブランドボイスの多言語展開
  • オンデバイス推論 → アプリ内オフライン動作、通信コスト削減
  • Unity/Godot SDK → 将来的なゲーミフィケーション学習コンテンツへの展開

関連プロダクト・採用事例

項目 内容
技術スタック(確認済) GCP(BigQuery, Cloud Composer), Google Cloud Speech-to-Text, OpenAI Whisper, GPT-4o
音声認識採用事例 スタディサプリ ENGLISH スピーキング評価(Google Cloud STT)
AI 会話 双方向型 AI 英会話(2026 年 4 月全面展開、Good 評価 95%、従来比 2.3 倍活用)
AI 字幕 高校講座 384 本(Whisper + GPT-4o、2025 年 2 月開始)
研究組織 スタディサプリ教育 AI 研究所(2019 年設立)
技術発信 スタディサプリ Product Team Blog, RECRUIT TECH CONFERENCE(年 1 回)

採用ページには「Android エンジニア」「QA エンジニア」「Product Platform エンジニア」等が掲載されており、音声 AI 専門採用は確認できていない(= 内製開発より外部 API 依存の可能性が高い)。

リスク・注意点

  1. 事業縮小リスク: 2025 年に合格特訓コース・塾向けサービス・English for KIDS・個別指導塾オンライン中学講座を相次いで終了。AI 投資は継続されているが、音声 TTS への追加投資よりコスト最適化が優先される可能性がある。

  2. Google Cloud との既存関係: データ基盤・音声認識とも Google Cloud を深く採用しており、Google TTS の採用を自然に選択する可能性が高い。競合として Google Text-to-Speech が最も強力。

  3. 内製音声の既存コンテンツ資産: 実人間講師の収録音声ライブラリが大量にあり、既存コンテンツへの TTS 導入インセンティブは薄い。新コンテンツ(AI 会話・多言語機能)に限定したアプローチが現実的。

  4. 大企業特有の意思決定プロセス: リクルートホールディングス傘下の事業として、セキュリティ審査・ベンダー登録・調達フローが複雑。エンジニア個人とのコネクション構築から始めないと意思決定者に届かない。

  5. 英語 TTS の品質基準: スタディサプリ ENGLISH は「ネイティブスピーカーレベルの英語」を基準として Google STT を選定した経緯がある。TTS でも同様の厳格な品質基準が適用される可能性があり、英語音声の品質証明が必要。

  6. for KIDS サービス終了の示唆: スタディサプリ English for KIDS(子ども向け英語学習)が 2025 年 4 月に終了しており、低年齢層向けの TTS 需要(高品質な子ども向け発話)は縮小方向。

連絡先候補

ルート 詳細
法人 ENGLISH 問い合わせ窓口 https://eigosapuri-biz.jp/inquiry (新規法人向け、最短 5 営業日対応)
学校向けスタディサプリ 問い合わせ https://teachers.studysapuri.jp/contact
採用経由(エンジニア職) https://brand.studysapuri.jp/career/ — Product Platform Engineer / AI エンジニア等
IR・コーポレート https://recruit-holdings.com/ja/ir/
技術コミュニティ RECRUIT TECH CONFERENCE(年 1 回・春開催), スタディサプリ Product Team Blog 著者へのコンタクト
業界イベント EdTechZine Summit, 日本 e-Learning 大賞(文科省後援), IVS

推奨アプローチ順序:

  1. スタディサプリ Product Team Blog の筆者(AI 英会話担当エンジニア)を特定 → X/connpass でのコンタクト
  2. RECRUIT TECH CONFERENCE への参加・登壇後の名刺交換
  3. eigosapuri-biz.jp/inquiry から技術提携・PoC 提案として問い合わせ(法人窓口経由)