Qwen3-ASR-Flash 是通义千问系列最新语音识别模型,基于 Qwen3 基座模型,经海量多模态及 ASR 数据训练而成。模型支持 11 种语言和多种口音,具备高精度、高鲁棒性的语音识别性能,且支持歌声识别。用户提供任意格式文本上下文,能获得定制化 ASR 结果。Qwen3-ASR-Flash 在多语种 benchmark 测试中表现最优,能应对复杂声学环境和困难文本模式,为语音转文字服务提供强大支持。