语音生成工具 (CosyVoice)

这是一个简单易用的语音生成工具，基于CosyVoice2模型，可以将文字转换为自然的语音。

功能特点

普通语音生成：将文字转换为自然语音
方言语音生成：可生成不同方言的语音（如四川话、东北话等）
情感语音生成：可生成带有不同情感的语音（如开心、激动、平静等）
情感标记语音：使用[laughter]等标记控制语音中的情感变化
分段处理长文本：支持将长文本分段处理，适合生成长篇语音

使用方法

运行程序：
```
python test1.py
```
选择功能类型：
- 简单语音生成：适合单段文本，可选普通、方言或情感语音
- 高级语音生成：支持情感标记或分段处理
按照界面提示操作：
- 输入要转换的文字
- 选择语音类型或高级功能
- 根据选择输入额外信息（如方言类型、情感类型等）
程序会生成语音文件并显示文件保存位置

示例

简单语音生成

===== 欢迎使用语音生成工具 =====
输入'退出'或'exit'结束程序

请选择功能:
1. 简单语音生成 - 输入一段文字，选择风格或方言
2. 高级语音生成 - 使用情感标记或分段处理
0. 退出程序

请选择 (0/1/2): 1

请输入要转换成语音的文字: 今天天气真好，我很开心！

请选择语音类型:
1. 普通语音
2. 方言语音
3. 情感语音
请选择 (1/2/3): 2
请输入方言类型 (如: 四川话、东北话): 四川话
方言语音已生成: output_今天天气真好，我_四川话.wav

高级语音生成 - 情感标记

请选择功能:
1. 简单语音生成 - 输入一段文字，选择风格或方言
2. 高级语音生成 - 使用情感标记或分段处理
0. 退出程序

请选择 (0/1/2): 2

请选择高级功能:
1. 使用情感标记 - 如[laughter]表示笑声
2. 分段处理长文本
请选择 (1/2): 1

情感标记示例: [laughter]表示笑声
请输入带情感标记的文本: 这个笑话真有趣[laughter]，我笑得停不下来了[laughter]
带情感标记的语音已生成: output_emotion_这个笑话真有趣[la.wav

高级语音生成 - 分段处理

请选择功能:
1. 简单语音生成 - 输入一段文字，选择风格或方言
2. 高级语音生成 - 使用情感标记或分段处理
0. 退出程序

请选择 (0/1/2): 2

请输入文本段落，每段一行，输入空行结束:
这是第一段文字，很简短。
这是第二段文字，稍微长一些，包含了更多的信息。
这是最后一段，总结前面的内容。

请输入语音风格 (默认'开心'): 平静
分段处理的语音已生成: output_segments_这是第一段文字，很.wav

环境要求

Python 3.6+
PyTorch 和 Torchaudio
CosyVoice2模型（需放在 pretrained_models 目录下）
提示音频文件（需放在 asset 目录下）

目录结构

CosyVoice/
├── asset/
│   └── zero_shot_prompt.wav  # 提示音频文件
├── pretrained_models/
│   └── CosyVoice2-0.5B/      # 预训练模型
├── third_party/
│   └── Matcha-TTS/           # 依赖库
├── test1.py                  # 主程序
└── README.md                 # 使用说明

常见问题

问题：程序报错"导入错误" 解决：检查是否安装了必要的Python包，执行：pip install torch torchaudio
问题：程序报错"初始化失败" 解决：确保模型文件和提示音频文件存在于正确的位置
问题：生成的语音效果不理想解决：尝试调整文本内容，或尝试不同的情感/方言类型

高级用法

如果你需要在自己的程序中使用这个语音生成功能，可以直接调用以下函数：

# 生成普通语音
output_file = generate_audio("你想要转换的文字", style="开心")

# 生成方言语音
output_file = generate_dialect("你想要转换的文字", dialect="四川话")

# 生成带情感标记的语音
output_file = generate_with_emotion_marks("这个笑话真有趣[laughter]")

# 分段处理长文本
segments = ["第一段文字", "第二段文字", "第三段文字"]
output_file = generate_from_segments(segments, style="平静")

Name		Name	Last commit message	Last commit date
Latest commit History 33 Commits
middleware		middleware
models		models
public		public
routes		routes
scripts		scripts
utils		utils
views		views
.dockerignore		.dockerignore
.env.example		.env.example
.gitignore		.gitignore
DOCKER_INSTALL.md		DOCKER_INSTALL.md
Dockerfile		Dockerfile
README.md		README.md
app.js		app.js
config.js		config.js
docker-compose.yml		docker-compose.yml
package-lock.json		package-lock.json
package.json		package.json
start-production.sh		start-production.sh
u5f00u53d1u7ecfu9a8c.md		u5f00u53d1u7ecfu9a8c.md
开发经验.md		开发经验.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

语音生成工具 (CosyVoice)

功能特点

使用方法

示例

简单语音生成

高级语音生成 - 情感标记

高级语音生成 - 分段处理

环境要求

目录结构

常见问题

高级用法

About

Uh oh!

Releases

Packages

Uh oh!

Languages

joeseesun/quickshare

Folders and files

Latest commit

History

Repository files navigation

语音生成工具 (CosyVoice)

功能特点

使用方法

示例

简单语音生成

高级语音生成 - 情感标记

高级语音生成 - 分段处理

环境要求

目录结构

常见问题

高级用法

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages