Skip to content

发布版本详情

V2.2.0

Feature/Refactor

添加Aliyun CosyVoice tts模型

调整tts合成逻辑,保持每次tts创建TtsEngine。降低了接入tts厂商时并发编程难度,易于自定义接入。

新增TtsEngine执行使用线程池

修改xfyun tts返回值判断逻辑,防止无识别文字时打断

新增实时推送asr识别结果功能,目前仅xfyun添加此功能

增加tts版本号,避免多次tts时由于tts异步的网络问题导致多段音频混合

新增实时语音识别模式的实时识别文字推送功能

新增FunAsr的实时识别文字推送

Enhancement/Refactor

优化xfyun tts异步代码逻辑

新增使用多线程处理sip,提高sip处理能力

优化先连接sip后连接client情况,让sip等待client连接

优化配置文件格式

BugFix

修复缓冲区关闭时再写数据直接抛出异常问题

V2.1.0

Feature/Refactor

新增tts无法打断功能事件----SpeakWithNoInterrupt

新增mod_easymrcp_spy模块监听某路电话做asr

新增通过client选择通话的TTS引擎和发音人功能

添加tts事件的eventId

新增静音超时时长参数设置

Enhancement/Refactor

将TTS引擎与RTP解耦,做到可以在一路通话中随意切换TTS引擎和发音人

去除结束标志位噪声问题

BugFix

修复未使用密码导致的 SIP 注册 403 问题

修复初始化问题导致tts降采样失效问题

修复asr无识别内容时导致定时器失效问题

V2.0.0

大规模重构版本的重大更新。

Feature/Refactor

重构asr的vad部分,添加双重缓冲解决vad开始语音没覆盖问题

添加sip OPTIONS探活机制

添加ASR自动中断语音流功能

添加TTS silence事件功能

为tts的多次串行执行添加队列任务

完全移除mrcp协议内容,重新设计架构

新增轻量化EasyMrcp client

新增ASR事件参数

新增ASR和TTS的中断和超时功能

新增向IPPBX注册功能

Enhancement/Refactor

替换TTS RTP中的环形缓冲区,并使用bytebus优化整个TTS RTP

用Netty替换TTS中的旧环形缓冲区

整体使用Netty重构rtp部分,优化音频流处理

重构ASR的VAD部分,增加双缓冲,解决VAD开始时语音未覆盖的问题

调整客户端和服务器事件协议之间的交互

优化字节处理、锁处理,优化程序运行整体性能和效率

BugFix

修复mrcp启动时双定时器的错误

修复VAD内存泄漏问题

添加延迟VAD的发布,以防止因执行onnxruntime本机空指针错误而导致的JVM崩溃

修复了挂断电话时无法正确取消计划任务的问题

解决某些情况下netty直接内存泄漏问题

V1.1.1

Feature/Refactor

新增发现rtp端口占用时自动重试策略

Enhancement/Refactor

优化rtp发送间隔问题,减少VoIP音频覆盖、卡顿、时间不够等问题

BugFix

修复tts降采样导致的样本数据不足问题,该bug曾导致使用24khz降采样到8khz时会偶发某段音频全部变成噪声问题。

修复通话结束后没有释放端口的问题,该bug曾导致多次通话后大量端口占用问题

修复mrcp分包读取方式,将换行读取改为按包长度读取。该bug曾导致大量tcp并发时mrcp解析报文错误

修复vad模型资源没有释放问题,该bug曾导致大量并发时占用大量系统内存

修复挂断时未能停止mrcp队列问题,该问题曾导致大量并发通话时造成线程大量积压

修复mrcp队列新增阻塞问题,该问题曾导致某些情况下结束通话mrcp队列资源仍然不释放问题

V1.1.0

优化部分asr和tts的语音流程,新增了一种腾讯云的asr和tts对接。

Feature/Refactor

新增腾讯云的实时语音识别asr、tts。

Enhancement/Refactor

优化tts发送语音时取160样本*n的字节数据,解决因为一帧中样本数不足导致的卡顿问题。

优化部分日志打印

BugFix

修复asr不关闭rtp通道问题。

修复rtp发送内存泄漏问题,该问题增导致多次tts时内存飙升问题。