小米最新开源!覆盖600+语种方言声音克隆
小米开源重磅发布:OmniVoice 覆盖600+语种,声音克隆触手可及最近,小米在开源社区投下了一颗重磅炸弹——OmniVoice,一款最先进的大规模多语言零样本文本到语音(TTS)模型正式开源。这款模型最令人惊叹的地方在于,它支持超过600种语言和方言,几乎覆盖了全球绝大多数地区的语言需求。无论是常见的英语、汉语,还是小众的方言、少数民族语言,OmniVoice都能轻松应对。更让人兴奋的是,OmniVoice基于一种新颖的扩散语言模型架构,不仅音质出色,推理速度也快得惊人。这意味着,你只需要