kexi

Results 10 issues of kexi

I load the gpt2_124M.bin by the following code: ```import numpy as np import torch import tiktoken from train_gpt2 import GPT, GPTConfig def read_wightdict(weights_dict, file, L, config): idx = 256 with...

好像你用的是对一个权限总集进行独热编码的,麻烦问一下你这个权限总集选择有什么依据吗

latents = self.scheduler.step(noise_pred.cuda(), t, latents)[ "prev_sample" ] i think there is a bug in this code, it should be: latents = self.scheduler.step(noise_pred.cuda(), i, latents)[ "prev_sample" ] because if i use...

我觉得这个需求还是很大的,但是我认为没有必要做成一个软件,可以做成一个插件内嵌到微信中,当然这需要腾讯的支持,所以可以后期再和他们合作。然后功能上其实我觉得云端搜索太过鸡肋,不如直接给用户一个表情包数据库,这个数据库当然需要自己来建立,同时用户也可以根据自己的喜好添加表情包到自己的数据库中,这样我觉得一方面对于表情包而言大众都喜欢的,就不会踩雷,另一方面选择太多的话会让用户产生疲劳,不如自己替他们选择。 另外,我也对这个软件很感兴趣,如果可以的话,一起研究一下呀,邮箱[email protected]

当手机界面存在几个相同的文字的时候首先利用xml的clickable属性判断是否可以点击从而进行筛选,可以让手机控制更加精准

in_coordinate, out_coordinate = det(image, "icon", groundingdino_model) 这里返回两个值,但是方法只返回了一个值,是不是有错误啊,代码在Mobile-Agent/run.py 的149行 def det(input_image_path, caption, groundingdino_model, box_threshold=0.05, text_threshold=0.5): image = Image.open(input_image_path) size = image.size caption = caption.lower() caption = caption.strip() if not caption.endswith('.'): caption...

请问一下能不能指导一下你们V3准备用的开源模型,我使用了llava-next-72b-hf这个72B的模型,但是基本没有效果,和GPT4o没法比,你们有什么好的想法能交流一下吗

你们所说的只支持安卓和鸿蒙的原因应该是在于用到了xml文件了吧,但是我在v2版本的代码中没看到哪里用到了xml文件了

论文里面提到你们在美团内部用这个AUITest发现了一些bug,想请问一下你们用的是私有化大模型还是GPT呢,如果是私有化大模型,用的是哪个呢,非常感谢