Xuanwu Yun

Results 9 issues of Xuanwu Yun

Here is the bug report: ``` File "D:\github\Amphion\models\tta\ldm\audioldm_inference.py", line 42, in __init__ self.build_vocoder() File "D:\github\Amphion\models\tta\ldm\audioldm_inference.py", line 68, in build_vocoder with open(config_file) as f: FileNotFoundError: [Errno 2] No such file or...

在计算时域损失的时候,使用重建后的音频(乘以了c)减去纯净音频(dataloader的输出,未乘c),这个是bug还是有意为之?如果确实是这样,那么在推理的时候是否应该直接输出重建的音频,为何推理的时候重建的音频又除以c?

## ❓ Questions and Help wetext有c++的runtime,但是他只有中文,不满足需求 funtext可以支持到c++吗

question

他会输出:建议涂擦八减十二防晒 理想输出:建议涂擦SPF八到十二的防晒 注:SPF也有2-6 6-8 12-20..

我承认这个模型的速度已经非常快,但是在rk3566 四核心a55上,依然满足不了实时的要求 流式的模型单次推理16ms,端侧推理一次耗时14-16ms,再加上其他应用很容易就rtf>1了 有可能进一步减少模型的size吗?

serve.log最后的输出如下: ``` | | 'print_verbose': False, | | | | 'text_score': 0.5, | | | | 'use_cls': True, | | | | 'use_det': True, | | | | 'use_rec': True,...

### systemRole 系统指令: 角色定位: 作为一名精通 Home Assistant(以下简称 HA)的助手,您的主要职责是指导新手用户如何快速上手并高效使用 HA 系统。 核心任务: 在插件安装与管理、系统设置、美化界面、代码编写方面提供精确指导。 为用户提供简洁、明确的解决方案和步骤,确保用户能够快速实现个性化需求。 职责扩展: 帮助用户理解和选择合适的插件,包括功能解释与兼容性检查。 为用户提供系统美化建议,涵盖主题设置、仪表盘布局调整等。 指导用户进行 YAML 代码编写与自动化设置,提供实例代码并解释其功能。 语境与场景应用: 根据用户提供的问题背景,提供适用的案例和准则,协助用户完成特定任务。 针对用户的反馈,灵活调整建议,确保指导与用户需求紧密相符。 任务执行与标准: 强调步骤的执行性,提供逐步引导,确保用户轻松跟随并实现功能。 确保解决方案的准确性和稳定性,最低化错误发生的可能性。 复杂决策支持: 在识别复杂需求时,提供多种解决方案的利弊分析,并推荐最佳选项。 确保用户做出的每一个选择都有清晰的实现路径。 模糊点与歧义消除: 若用户问题或描述不明确,主动提问或设定前提条件以澄清问题。...

Inactive

这是loss导致的吗?当我负样本加入很多hey的音频,相同准确率下误唤醒更多了,应该怎么解决这个问题呢?还是使用ctc模型?