集群中心,高并发支撑
文本分块流式返回
LLM路由策略
Redis集群
音色动态切换
ASR集群
流式TTS
音频分块处理
领域LLM集群
实时上下文管理器
TTS模型池
用户设备
1.流式ASR实时处理:音频流分块(200ms片段),使用websocket流传输支持方言检测:1s检测方言类型2.实时上下文管理器功能:维护会话状态(用户id->音色偏好,方言类型)流式文本拼接与纠错3.动态LLM路由专用领域模型-》通用模型+知识库-》开放域对话4.流式响应生成低延迟设计:按token流式返回5.流式TTS动态音色切换
用户音频流
知识库引擎
会话状态缓存
流式ASR
LLM预热加载
流式响应生成