flymorn
flymorn
测试机型:小米5 MIUI 10.8 开发版 ,Android 8.0.0,选择文本出问题
Hi, edit SCoop.cpp, under line 184: ``` extern volatile unsigned long timer0_overflow_count; // use this variable which is incremented at each overflow static unsigned long tell_compiler_that_i_really_need_this = timer0_overflow_count; // ADD...
Hi, 这个视频属性: "codec_name": "mpeg4", "codec_long_name": "MPEG-4 part 2", "profile": "Simple Profile", "codec_type": "video", "codec_tag_string": "mp4v", "codec_tag": "0x7634706d", "width": 1024, "height": 576, 浏览器目前默认不支持 mpeg4 视频格式,可将视频文件转换为H.264编码的MP4文件。
win10 同样错误: [2024-08-10 12:51:10,862] [ WARNING] - Detected that datasets module was imported before paddlenlp. This may cause PaddleNLP datasets to be unavalible in intranet. Please import paddlenlp before datasets...
> 大佬们,请教一个关于**同字同词多音字**的问题,比如以下的: > > 1、如果大家都不随意 **倾倒(qīng dào)** 垃圾的话,最终大家都会为这片绿色的环境而 **倾倒(qīng dǎo)** 。 2、她真的很希望能真正向他 **倾吐(qīng tǔ)** 所有的委屈,但他的表现像喝多后 **倾吐(qīng tù)** 了一地那么恶心,令人极度失望。 > > 当前的模型对【倾倒】这个词的生成结果都是【qīng dǎo】,【倾吐】的结果都是【qīng tǔ】,因为字典里已经定义了,但另外的读音现在没法通过定义词的方式再放到字典里。这种情况下怎么解决多音字合成的读音问题? > > @RVC-Boss @KamioRinn 思路:用户传递文本时,使用ssml标记 自定义实现
并行,bs=1:windows10 + 12490+ 3080+ CUDA11.8 + GSV2 130it/s 不开并行推理,能到 170 it/s
2个问题确实能复现 @ChasonJiang @juntaosun 此时的修改音素无效,可能问题是在底模
能否直接返回字级别的时间戳呢? 因为 @Jin-W-FS 目前的代码返回的srt是根据句子的切割,如果切割的一段字数很多,返回的list就失去了意义。 比如: 当地时间10月7日,俄罗斯总统新闻秘书佩斯科夫表示,俄罗斯前驻美国大使安东诺夫结束任期回国,不意味着俄罗斯与美国的外交关系降级。俄方将适时任命新的驻美大使。 返回的srt是: "srt": [ [ 0.0, 14.5, "当地时间10月7日,俄罗斯总统新闻秘书佩斯科夫表示,俄罗斯前驻美国大使安东诺夫结束任期回国,不意味着俄罗斯与美国的外交关系降级。" ], [ 14.5, 18.04, "俄方将适时任命新的驻美大使。" ] ] 一个片段里太多字数了,还是不能上屏。 最好返回字级别时间戳,后续自己处理。感谢
#1480 Check this