皮特潘
皮特潘
> i can work with it using mteb-1.2.0. 可以了,多谢
> 开源的这些大多是学术性质的。即便是大公司开源的,其实也不是让你直接就能用的。而是作为论文的配套。 而产业界的东西,或许原理差不多,但做了一些改进或优化,靠这个吃饭的公司就不会开源或分享。 感谢回复,像腾讯智影这种说5分钟视频可以定制数字人,口型驱动仅仅用这5分钟微调的么?
> 当然不可能啊。。那几分钟只能起一点点左右。主要还是依靠它事先学习过的口型。 我说的是微调,就是基于大量数据训练好的模型进行finetune。
> > 那些商用的,号称使用5分钟视频就可以定制,有大佬知道方案么? > > 我们的wav2lip 优化了30多版才有了现在的效果,直接github项目商用可别想了 大佬,有demo可以参观下不?
> I can confirm that this did occur. > > I'm deploying with the following command: > > uv run \ > --python 3.12 \ > --with sglang[all] \ >...