ZhengMengbin

Results 12 comments of ZhengMengbin

@hflserdaniel 我直接说中文吧,英文说着不好准确表达怎么解决这问题。 这个问题主要是没有找到ltensorflow_framework导致的,估计作者是自行编译安装的tensorflow,而不是pip安装的(虽然作者给的环境配置是pip安装的,我猜的);你可以在tensorflow安装文件夹中查找一下(百度find指令)libtensorflow_framework.so.1该文件的路径,然后把该文件cp一份到usr/lib/目录下,然后进行软链接生成libtensorflow_framework.so,就不会报错了(可参见https://blog.csdn.net/songyu0120/article/details/46931329)

@KirillR911 This problem is mainly caused by not finding `ltensorflow_framework`. I guess that author installed tensorflow by compiling from source , not `pip install tensorflow` (although the environment configuration given...

@KirillR911 Can you find 'libtensorflow_framework.so.x' or 'libtensorflow_framework.so'?

@hflserdaniel 版本没有太大问题,是因为bazel生成的.so文件不会存放在作者指定的路径下(见作者指定的[路径](https://github.com/yiranran/Audio-driven-TalkingFace-HeadPose/blob/master/Deep3DFaceReconstruction/tf_mesh_renderer/mesh_renderer/rasterize_triangles.py#L29),你可以修改这个路径到生成的.so路径下,或者移动/复制生成的librasterize_triangles_impl.so和rasterize_triangles_kernel.so到这个路径下,生成到.so文件应该在xx/tf_mesh_renderer/bazel-tf_mesh_renderer/mesh_renderer/kernels或者xx/tf_mesh_renderer/bazel-bin/mesh_renderer/kernels下,你仔细找一找,不一定完全是我说的路径)

@hflserdaniel 编译c/c++的工具gcc版本的问题,你看看你的gcc版本是否大于4(命令`gcc --version`查看),如果大于4,则去掉[这行编译代码](https://github.com/yiranran/Audio-driven-TalkingFace-HeadPose/blob/master/Deep3DFaceReconstruction/tf_mesh_renderer/mesh_renderer/kernels/BUILD#L29)中的-D_GLIBCXX_USE_CXX11_ABI = 0选项或者设置为-D_GLIBCXX_USE_CXX11_ABI = 1,然后重新编译

@duguiming111 作者采用的是mfcc20,也就是一个bin对应5帧图像(提取mfcc的时候窗口间隔为10ms,你可以查一下savemfcc.m中的opt.Ts参数的含义,所以4个mfcc对应的其实就是40ms,也就是一帧,作者固定视频帧率为25帧/s,所以每帧是40ms;故20个mfcc就对应5帧);然后作者其实是想用五帧中的中间帧来对应每一个bin,所以第一个bin对应视频中的第2帧(从0开始计数),当然提取代码肯定会把所有帧图像都保存下来,但实际训练过程中是第一个bin,也即2.bin去和第2帧,也即2.jpg形成pair输入网络,然后为了形成匹配对方便,作者才写成了2:end,这样生成的bin标号就从2开始了,而2:26应该是作者只取每个样本的前1秒(即25帧)来作为训练样本。

@Mididou What's the meaning of the parameter --test_audio_video_length?

@Mididou I read the relevant code and know what it means. Thanks for your reply!

Using test_sample1_fake_audio_B_0_x.png to get the final video, test_sample1_real_A_x.png is the real image, test_sample1_fake_audio_B_0_x.png is synthesized by gan.