CosyVoice是一款语音相关工具,主要用来做文字转语音和声音生成。它的功能大致有三块:一是把文字变成语音,二是可以用很短的音频(大概10到20秒)去“模仿”某个人的声音,包括各种语言和方言,还可以智能纠错和口语识别错误,用户可以将自己声音录入,也可以模仿其他人的声音,适用于多种语言环境。

1、支持单击和长按两种操作方式,用语音说话来输入内容,整体体验比较自然。
2、可以识别人在说话时的自我纠正,比如说错再改的部分,会自动帮你整理成最终正确内容。
3、能把语音内容自动整理成编号列表、大纲或者表格,看起来会更清晰,整理好就可以直接发出去。
4、支持指令式输入,比如说要写邮件、会议记录或者笔记,可以直接一键生成对应内容。

1、交互方式比较灵活,既可以单击触发,也可以长按连续输入,适配不同使用习惯。
2、在语音转写过程中,会尽量保留语义连贯性,让生成内容更接近真实表达逻辑。
3、输出内容偏“可直接用”,不需要再二次整理,适合快速发送或记录场景。
4、对多种使用场景有适配能力,比如办公记录、学习整理、日常备忘等都可以覆盖。
1、支持语音输入操作,通过说话就能完成内容录入,不需要手动打字。
2、可以识别说话过程中的自我修正,比如说错后重新表达,会自动按最终意思整理。
3、能把语音内容自动结构化处理,整理成大纲、列表或表格形式,方便直接使用。
4、支持指令式生成内容,比如输入任务需求,可以快速生成邮件、会议记录等文本。
1、自动过滤「嗯、啊、那个」
实时高质量语音转文本,CosyVoice 在转写过程中自动识别并去除口语化的填充词与重复词,让你的每一句话都干净利落。
2、散乱的口述,自动排成清单
说出一堆事情,CosyVoice 自动识别其中的项目结构,整理成编号列表、表格或大纲,条理清晰,可直接发送。
3、说错了?「不对,改成…」就行
CosyVoice 能识别口语中的自我修正——「不对不对」「改成」「我意思是」——并自动应用到最终稿件,不留改口痕迹。
4、说一句指令,得到一封完整邮件
写邮件、写会议邀请、写 vlog 脚本——告诉 CosyVoice 你想要什么格式,它直接给你完成稿,称谓、问候、签名一应俱全。
5、数字、公式、单位,都帮你写对
口播中的「三点五八亿」「百分之十二点六」自动还原为「3.58 亿」「12.6%」,还能识别公式表达并补齐符号,金融、科研、媒体场景都能直接用。
6、上海话、粤语、川话,都能听懂
无缝识别上海话、粤语、四川话等多种方言,并能将其转写为标准普通话,跨地区团队、田野调研、客户访谈都不再被口音卡住。
一款语音智能输入法,软件拥有多语种实时转写,中英文自由切换等功能特色,可以助力用户更智慧高效语音输入,语音合成的速度也比较快,延迟很低,适合用在一些需要实时语音输出的场景,比如客服系统、游戏配音或者有声内容制作等。简单来说,就是一个既能“说话”,也能“学声音”的语音合成工具。