RefactorGraph
RefactorGraph copied to clipboard
国产硬件适配
测试环境:mlu590,bc9a0634e644 容器内。(mlu370 裸机上个别算子当数据规模大的时候会出现问题)
llama2 与 gpt2 推理结果正确(与 onnxruntime 相比,np.testing.assert_allclose(rtol=1.0, atol=1e-4) )。
测试环境:mlu590,bc9a0634e644 容器内。单测结果正确。
应该可以先提交一个不包含 kernel 的 pr?