Models issues

开源之夏：MegEngine 补充跨模态模型的实现——CLIP

8

目前完成了CLIP各个模型的前向对齐，绝对误差控制在1e-6内，精度在ImageNetV2 matched-frequency上与官方实现的精度对比，其中官方实现使用PIL前处理，本实现使用opencv，有小幅涨点 | 模型 | text误差 | image误差 | top-1 acc | top-5 acc | | ------------------------------------------------------------ | -------- | --------- | ------------------- | ------------------- | | [**RN50**](https://drive.google.com/file/d/17bsG4IiVPD3RU0XbzkignUp5vY459Cf7/view?usp=sharing) | 3.25e-07...

Asthestarsfalll

训练segmentation的时候出现nan

1

大佬，我想问下我迭代次数到了50次以后就会在某个地方损失值开始nan了，前面是有收敛的

Ctu-SiTuShenPeng

resnet分类模型无法指定分类数量

## 使用 classification resnet进行分类苹果/橘子训练时，指定分类数量为2时，无法训练 Models/official/vision/classification/resnet/model.py resnet50只支持1000分类数据集训练，我只创建2分类数据时，修改num_classes=2时，无法正常完成训练 ## 任务描述数据集格式是这样的： /path/to/imagenet train apple xxx.jpg ... orangle xxx.jpg ... ... val apple xxx.jpg ... orangle xxx.jpg ... ## 目标由于我时初学，在经过自己各种修改后，仍然无法解决，需要帮忙。谢谢

Qianlu5110

COCO数据集测试速度异常

2

## 背景 **COCO数据集测试速度异常** ![image](https://user-images.githubusercontent.com/84311688/125907829-cb264fd8-e402-4743-b8f3-ef7b731fd2f9.png) ## 任务描述按照首页readme安装megengine和Models，从 [hub.py](https://github.com/MegEngine/Models/blob/11013f6b3b252df71098b27714e39d9802d2520d/official/vision/detection/configs/atss_res50_coco_3x_800size.py#L18) 下载预训练权重，直接在coco数据集上进行测试。代码未做任何改动，采用8卡测试，最终结果mAP为42.6（正常），但是耗时将近6m30s（不正常），正常8卡时间应该在1min左右 python：3.6 megengine版本：v1.4.0 ## 目标希望多卡测试速度正常，请确认问题并帮忙修复

er-muyue

量化模型的时候出现不预期的问题

1

## 环境 1.系统环境：ubuntu1804 2.MegEngine版本：1.4.0 3.python版本：3.6.8 ## 复现步骤 1. git clone https://github.com/MegEngine/Models.git 2. python3 train.py -a resnet18 -d /path/to/imagenet --mode normal 出现此问题 ## 请提供关键的代码片段便于追查问题 1、train.py 和 finetune.py 同样出现此问题 ## 请提供完整的日志及报错信息 Traceback...

ThreeLord

请问有没有 GPT2-ML 预训练模型，希望结合 DTR 进行微调

4

## 请求实现MegEngine实现GPT2-ML(https://github.com/imcaspar/gpt2-ml) ## 任务描述实验项目微调GPT2-ML，由于GPU资源不足（RTX 3060-12GB）无法调试，通过【机器之心】得知MegEngine1.4 DTR技术解决了动态图显存优化的问题，想请问有没有参考教程让我们能通过DTR实现对GPT2-ML的微调 ## 目标采用MegEngine实现的GPT2-ML模型，通过DTR进行微调

NLPIG

question

想要直接训练好的量化模型（resnet50）来测速

1

我想测试一下resnet50 int8模型的速度，想问下有没有什么samplecode可以使用。是否有可以直接获取的训练好的量化模型？感谢！

farmpi

复现 Googlenet

4

## 任务描述 - 复现 Googlenet ，训练正常收敛，验收指标符合预期，并将代码提交到 offical/vision/classification/models 下 ## 目标 - 数据集ImageNet - 准确率和论文一致或更高 - 脚本可以完整完成训练步骤 - 提供训练后的权重文件 - 提交至 https://github.com/MegEngine/Hub

xxr3376

help-wanted

NLP部分的模型试验过程发现无法按照readme运行

1

## 环境 1.系统环境：MegStudio 2.MegEngine版本： 3.python版本：3.7 4.模型名称：bert cls mgpc ## 复现步骤 1. 下载models 2. 按照readme提示在MegStudio运行 3. 没有tuple ## 请提供关键的代码片段便于追查问题 ## 请提供完整的日志及报错信息 ![image](https://user-images.githubusercontent.com/37429336/96228812-a3bed300-0fc8-11eb-9210-92a6a076b430.png)

natureLanguageQing

改进现有的RetinaNet的量化

## 背景 1.实现fully量化的RetinaNet 2.将量化检测模型和vision/detection进行合并 ## 任务描述 1.现有RetinaNet受MegEngine版本限制仅仅量化了backbone部分，后续需要一个fully量化的RetinaNet 2.检测量化部分code有部分冗余，需要进行合并 ## 目标将quant retinanet统一合入 vision/detection

FateScript

enhancement

Models
Models copied to clipboard

Metadata

开源之夏：MegEngine 补充跨模态模型的实现——CLIP

训练segmentation的时候出现nan

resnet分类模型无法指定分类数量

COCO数据集测试速度异常

量化模型的时候出现不预期的问题

请问有没有 GPT2-ML 预训练模型，希望结合 DTR 进行微调

想要直接训练好的量化模型（resnet50）来测速

复现 Googlenet

NLP部分的模型试验过程发现无法按照readme运行

改进现有的RetinaNet的量化

← Metadata

Owner

Metadata

Models Models copied to clipboard

Metadata

← Metadata

Owner

Metadata

Models
Models copied to clipboard