ヴイストン株式会社¶
1 行サマリー¶
大阪のコミュニケーションロボットメーカー(従業員約20名)。Sota/CommUで教育・介護市場を開拓中。NTT製クラウドTTSへの依存度が高く、PoC 規模での TTS 代替需要が潜在する。
事業構造と TTS 需要¶
ヴイストンは2000年設立の大阪発ロボットベンチャーで、代表取締役・大和信夫氏が率いる非上場・資本金1億円の中小企業。主力製品は卓上型コミュニケーションロボット「Sota(ソータ)」と社会的対話ロボット「CommU(コミュー)」。売上規模は非公表だが、総資産34億円・純利益1.4億円(2025年9月期、Wikipedia記載値)の水準と推定される。
TTS 需要の所在:
- Sota 本体の音声合成:企業受付・行先案内・介護レクリエーション・教育向けサービスにSotaが会話応答で使用するTTSエンジン。現在はNTTテクノクロス「FutureVoice Crayon」をクラウド経由で採用。
- プロトロボ(受託開発):1台から相談可能なコミュニケーションロボット受託開発サービス。顧客企業の要件に合わせた音声合成の組み込みが各案件で発生する。
- 多言語対応:Sotaは日本語・英語・中国語(簡体字・繁体字)・韓国語の4言語に対応しており、多言語 TTS の品質・種類拡充は製品競争力に直結する。
- オンデバイス需要:万博会場展示(2025年)では小型ロボットユニットへの通信機能内蔵化を進めており、クラウド非依存のオンデバイス TTS へのニーズが今後顕在化しうる。
VstoneMagicへのGPT対話ブロック追加(2023年末)や ChatGPT 活用コンテンツ制作(2025年2月)から、生成AI統合に積極的な姿勢が確認できる。
現在の TTS 状況¶
| 項目 | 内容 |
|---|---|
| 採用エンジン | NTTテクノクロス FutureVoice Crayon(主力) |
| 提供形態 | クラウドサービス(Sota Cloud → ロボプラット) |
| 採用時期 | Sota 発売当初(2015年前後)から継続 |
| 多言語対応 | 英語・中国語・韓国語はオプション(有料) |
| 依存度 | 高(Sota の標準音声合成はFutureVoice Crayon 前提) |
| 置き換え障壁 | 中程度 – VstoneMagic の音声合成ブロックがFutureVoice API に直結しているが、Java/HTTP 通信レイヤーで差し替え可能な設計 |
2024年3月、NTT東日本の「ロボコネクト」サービス終了に伴い、自社クラウド基盤「ロボプラット」へ移行。クラウド依存構造は継続しているが、自社インフラ化により TTS の差し替え自由度は増している。
NTTテクノクロスは2025年12月に FutureVoice の新バージョンを発表し自社での AI 音声生成機能を追加したが、コスト・音質・多言語品質での代替余地は残る。
購買仮説¶
買う理由:
- クラウド依存からのコスト削減:ロボプラット移行後もSota Cloud の利用料が継続発生しており、オンデバイス TTS によるランニングコスト削減は ROI が立ちやすい。
- 多言語・ゼロショット需要:教育・介護・観光向けに英語・中国語・韓国語対応を拡充したい顧客が多く、FutureVoice の多言語オプションは高額。piper-plus の OSS 多言語音声は代替候補として成立する。
- プロトロボ案件への横展開:受託開発案件ごとに音声合成の組み込みが必要であり、開発パートナーとしての提案が刺さる。
- 生成AI統合の流れ:GPT対話ブロック追加・ChatGPT コンテンツ制作という動きは、TTS 部分でも OSS・API フレンドリーな選択肢への関心を示唆する。
想定決裁者: 大和信夫・代表取締役(最終決裁)、技術・製品責任者(技術評価)。社員数20名規模のためCTOと代表が事実上一体化している可能性が高い。
予算サイクル: 8月期決算(推定)。PoC 予算は50〜200万円規模で代表直決裁が可能と推定。受託案件に乗せる形での PoC が現実的。※当方推定
アプローチ戦略¶
フェーズ1:piper-plus OSS で入る
ヴイストンの技術チームが piper-plus を試せる状況を作ることが最優先。VstoneMagic の音声合成ブロックに piper-plus サーバを繋ぐサンプルコードを提供し、評価PoC を無償で支援する。
フェーズ2:ロボプラット組み込み提案
多言語音声(英語・中国語・韓国語)の品質比較デモを実施し、FutureVoice 対比の音質・コストメリットを訴求。オンデバイス(Raspberry Pi / Jetson Orin NX 対応)での動作確認も提示する。
フェーズ3:次世代 TTS(zero-shot)の提案
Sota 向けのキャラクター音声カスタマイズ・ゼロショット声質適応を訴求。プロトロボ受託案件に組み込む形でのライセンス提供。
アプローチ先: - プロトロボ受託窓口(proto-robo.vstone.co.jp)へ技術提案メールを送付 - 国際ロボット展(IREX)・ロボデックスへの出展時に対面接触 - ロボスタ・ロボットスタート等のコミュニティ媒体を通じた接触
キーフレーズ案:
「Sota/CommU の音声をクラウド不要のオンデバイス TTS に切り替え、NTT FutureVoice の月額コストをゼロに。日本語・英語・中国語・韓国語の4言語を1エンジンで対応し、プロトロボ案件への横展開でライセンス費用を回収できます。」
関連プロダクト・採用事例¶
| プロダクト / 事例 | 概要 |
|---|---|
| Sota(ソータ) | 卓上コミュニケーションロボット。FutureVoice Crayon 採用。ロボプラット経由でクラウド音声認識・合成を提供。 |
| CommU(コミュー) | 2台1組の社会的対話ロボット。Sota と同一の VstoneMagic SDK を使用。 |
| プロトロボ | コミュニケーションロボット受託開発サービス。1台から相談可。音声合成の実装も請負範囲に含む。 |
| VstoneMagic | ロボット用ビジュアルプログラミング環境。GPT対話ブロック追加済み(2023年末)。 |
| 万博出展(2025年) | 大阪・関西万博「いのちの未来」パビリオンにロボット3体(Petra/Punica/Pansy)を提供。小型ロボットユニット(通信機能内蔵)も展示。 |
| ChatGPT コンテンツ制作(2025年2月) | Sota と着ぐるみロボット「くるみちゃん」を使った YouTube 動画をChatGPT で量産。音声はVstoneMagicで合成。 |
技術スタック(推定): - OS: Linux(Intel Edison / x86系) - 音声認識: NTT メディア知性研究所の音響処理技術 / AmiVoice SDK(部分的) - 音声合成: FutureVoice Crayon(クラウド) - 開発環境: VstoneMagic(Java バックエンド、TCP/IP通信対応) - AI 統合: OpenAI ChatGPT API(GPT対話ブロック) - ロボット OS: ROS / ROS2(台車ロボット系)
リスク・注意点¶
| リスク | 詳細 |
|---|---|
| NTT との関係 | FutureVoice Crayon の採用はNTTテクノクロスとの取引関係を示唆。替えにくい可能性があるが、ロボプラット自社化でNTT依存は低下傾向。 |
| 内製方針の不在 | 従業員20名規模のため TTS 内製は困難。ベンダー依存継続は確実で、変更の意思決定は代表が握る。 |
| 予算規模の小ささ | 非上場・中小ベンチャーのため年間 TTS 予算は数百万円規模。単体での大型契約は見込みにくい。 |
| 製品更新の遅さ | Sota の基本アーキテクチャはIntel Edison(廃番)ベースで老朽化。ハード更新投資余力が限られる可能性。 |
| 競合 TTS の無償化 | Google TTS・VOICEVOX 等の無償・低コスト代替が増加しており、piper-plus の価格優位が薄れるケースあり。 |
| ロボット市場縮小リスク | Pepper 撤退等、コミュニケーションロボット市場全体が苦戦しており、Sota の新規販売数は限定的と推定。 |
連絡先候補¶
| 経路 | 詳細 |
|---|---|
| 公式問い合わせ | https://www.vstone.co.jp/contact/ |
| プロトロボ受託窓口 | https://proto-robo.vstone.co.jp/communication/ (技術提案に最適) |
| 採用ページ | https://vstone.co.jp/recruit/index.html |
| 展示会接触 | 国際ロボット展(IREX)・ロボデックス(東京ビッグサイト)でのブース接触 |
| メディア経由 | ロボスタ(robotstart.info)の取材・寄稿を通じた認知形成 |
| SNS / YouTube | ヴイストン公式 YouTube チャンネル(コンテンツ共同企画の打診) |
uPiper との位置関係: ヴイストンはコミュニケーションロボットの製造メーカーであり、TTS エンジンは自社開発しない。現在 NTTテクノクロスに依存しているクラウド TTS を piper-plus(OSS ベース・オンデバイス・多言語)で代替することで、ランニングコスト削減と多言語品質向上の両立を提案できる。将来的に次世代 TTS(ゼロショット・キャラクター音声)でSota の差別化音声体験を構築するパートナーとして位置づける。規模は小さいが TTS 代替の典型事例として参照可能な顧客になりうる。