YueXin Chen

Results 52 comments of YueXin Chen

根据所需吧 通过label进行机器管理 开发训练服务机器管理: 对于cpu的train/notebook/service会选择cpu=true的机器 对于gpu的train/notebook/service会选择gpu=true的机器 训练任务会选择train=true的机器 notebook会选择notebook=true的机器 服务化会选择service=true的机器 不同项目的任务会选择对应org=xx的机器。默认为org=public 可以通过gpu-type=xx表示gpu的型号 控制器机器管理: mysql=true 部署mysql服务的机器 redis=true 部署mysql服务的机器 kubeflow-dashobard=true 部署cube服务的机器 kubeflow=true 部署kubeflow的机器 isito=true 部署istio的机器 knative=true 部署knative的机器 monitoring=true 部署prometheus的机器 参考:https://github.com/tencentmusic/cube-studio/tree/master/install/kubernetes#%E9%80%9A%E8%BF%87label%E8%BF%9B%E8%A1%8C%E6%9C%BA%E5%99%A8%E7%AE%A1%E7%90%86

最新版的rancher貌似没这个问题,但是我不确定

> 还有一个问题,label都是在start.sh这个脚本里头,如果不运行它怎么通过label来管理机器呢? 单独拉出来不知道行不行,你可以试试,其实还是调用的kubectl的命令吧(个人猜测,不一定对

> > > > 唉,没有多机部署指南,对不太熟悉k8s的人不友好。。。 https://github.com/tencentmusic/cube-studio/wiki/%E5%A4%9A%E6%9C%BA%E3%80%81%E5%A4%9A%E9%9B%86%E7%BE%A4%E3%80%81%E5%A4%9A%E9%A1%B9%E7%9B%AE%E7%BB%84-%E9%83%A8%E7%BD%B2%E8%B0%83%E5%BA%A6 这个你可以参考下,不过确实需要一定的k8s基础,因为它是基于k8s的,所以可以试试单机部署熟悉一下整体环境

我是先拉去了tme-dev版本,然后解压后sh pull_image_kubeflow.sh kubectl delete -k cube/overlays kubectl apply -k cube/overlays 但是还是会这样

好滴,我应该是第二块出现了问题

UPDATE docker SET base_image = replace (base_image,'ai.tencentmusic.com/tme-public','ccr.ccs.tencentyun.com/cube-studio') WHERE args LIKE '%tencentmusic%'

> @OpenEthan Gitee 根本没有多少人用,用也是某些项目提供的备选,怎么香港也跟湾湾一样坐井观天了 赞同,自从Gitee被那啥后,鬼用啊

> do you have the "debug.log" ? you may find it in /root/.hfs Yeah,i see. i don't know how to upload it in the github,so i have no choice but...