发布版本详情
V2.2.0
Feature/Refactor
添加Aliyun CosyVoice tts模型
调整tts合成逻辑,保持每次tts创建TtsEngine。降低了接入tts厂商时并发编程难度,易于自定义接入。
新增TtsEngine执行使用线程池
修改xfyun tts返回值判断逻辑,防止无识别文字时打断
新增实时推送asr识别结果功能,目前仅xfyun添加此功能
增加tts版本号,避免多次tts时由于tts异步的网络问题导致多段音频混合
新增实时语音识别模式的实时识别文字推送功能
新增FunAsr的实时识别文字推送
Enhancement/Refactor
优化xfyun tts异步代码逻辑
新增使用多线程处理sip,提高sip处理能力
优化先连接sip后连接client情况,让sip等待client连接
优化配置文件格式
BugFix
修复缓冲区关闭时再写数据直接抛出异常问题
V2.1.0
Feature/Refactor
新增tts无法打断功能事件----SpeakWithNoInterrupt
新增mod_easymrcp_spy模块监听某路电话做asr
新增通过client选择通话的TTS引擎和发音人功能
添加tts事件的eventId
新增静音超时时长参数设置
Enhancement/Refactor
将TTS引擎与RTP解耦,做到可以在一路通话中随意切换TTS引擎和发音人
去除结束标志位噪声问题
BugFix
修复未使用密码导致的 SIP 注册 403 问题
修复初始化问题导致tts降采样失效问题
修复asr无识别内容时导致定时器失效问题
V2.0.0
大规模重构版本的重大更新。
Feature/Refactor
重构asr的vad部分,添加双重缓冲解决vad开始语音没覆盖问题
添加sip OPTIONS探活机制
添加ASR自动中断语音流功能
添加TTS silence事件功能
为tts的多次串行执行添加队列任务
完全移除mrcp协议内容,重新设计架构
新增轻量化EasyMrcp client
新增ASR事件参数
新增ASR和TTS的中断和超时功能
新增向IPPBX注册功能
Enhancement/Refactor
替换TTS RTP中的环形缓冲区,并使用bytebus优化整个TTS RTP
用Netty替换TTS中的旧环形缓冲区
整体使用Netty重构rtp部分,优化音频流处理
重构ASR的VAD部分,增加双缓冲,解决VAD开始时语音未覆盖的问题
调整客户端和服务器事件协议之间的交互
优化字节处理、锁处理,优化程序运行整体性能和效率
BugFix
修复mrcp启动时双定时器的错误
修复VAD内存泄漏问题
添加延迟VAD的发布,以防止因执行onnxruntime本机空指针错误而导致的JVM崩溃
修复了挂断电话时无法正确取消计划任务的问题
解决某些情况下netty直接内存泄漏问题
V1.1.1
Feature/Refactor
新增发现rtp端口占用时自动重试策略
Enhancement/Refactor
优化rtp发送间隔问题,减少VoIP音频覆盖、卡顿、时间不够等问题
BugFix
修复tts降采样导致的样本数据不足问题,该bug曾导致使用24khz降采样到8khz时会偶发某段音频全部变成噪声问题。
修复通话结束后没有释放端口的问题,该bug曾导致多次通话后大量端口占用问题
修复mrcp分包读取方式,将换行读取改为按包长度读取。该bug曾导致大量tcp并发时mrcp解析报文错误
修复vad模型资源没有释放问题,该bug曾导致大量并发时占用大量系统内存
修复挂断时未能停止mrcp队列问题,该问题曾导致大量并发通话时造成线程大量积压
修复mrcp队列新增阻塞问题,该问题曾导致某些情况下结束通话mrcp队列资源仍然不释放问题
V1.1.0
优化部分asr和tts的语音流程,新增了一种腾讯云的asr和tts对接。
Feature/Refactor
新增腾讯云的实时语音识别asr、tts。
Enhancement/Refactor
优化tts发送语音时取160样本*n的字节数据,解决因为一帧中样本数不足导致的卡顿问题。
优化部分日志打印
BugFix
修复asr不关闭rtp通道问题。
修复rtp发送内存泄漏问题,该问题增导致多次tts时内存飙升问题。
