Gradio

    # 🎵 Genie TTS - 高质量日语语音合成

Genie TTS 是基于 GPT-SoVITS V2 架构的轻量级日语语音合成系统。

✨ 特性

🎯 零样本语音合成：无需训练，直接使用预定义角色
🚀 轻量级推理：基于 ONNX Runtime，CPU 友好
🎭 多角色支持：预置多个日语语音角色

🔄 实时合成：快速响应，适合交互应用

  <div style="background: linear-gradient(90deg, #667eea 0%, #764ba2 100%); padding: 1rem; border-radius: 10px; color: white; margin: 1rem 0;">
  <strong>🌟 功能特点</strong><br>
  ✅ CPU 优化推理，无需 GPU<br>
  ✅ 基于 GPT-SoVITS V2 技术<br>
  ✅ 支持长文本自动分句<br>
  ✅ 实时音频流输出
  </div>
  
  **📖 使用说明:** 选择角色模型 → 输入日语文本 → 点击合成按钮 → 获得高质量语音

🔴 Genie TTS 安装失败: cannot import name 'DryRunError' from 'huggingface_hub.errors' (/usr/local/lib/python3.10/site-packa...
Hugging Face Spaces环境限制导致PyAudio依赖安装失败。
💡 解决方案: 请在本地环境运行此应用以获得完整功能。

👤 角色设置

🎭 选择角色

当前可用的预训练角色模型

📝 文本输入

🎯 输入日语文本

💡 支持日语文本，建议输入完整的句子以获得更好的效果

🔊 音频输出

🔊 生成的音频

📊 状态信息

项目	规格
基础模型	GPT-SoVITS V2
推理框架	ONNX Runtime
支持语言	日语 (Japanese)
音频格式	WAV, 32kHz
推理设备	CPU (无需 GPU)
模型大小	~200MB
内存需求	~500MB RAM

✨ 特性

👤 角色设置

📝 文本输入

🔊 音频输出

🎯 快速示例

📋 使用技巧

🔧 技术说明

🔍 项目信息

📊 技术规格

🔗 相关链接

🙏 致谢

⚖️ 免责声明