Models
Models copied to clipboard
采用MegEngine实现的各种主流深度学习模型
目前完成了CLIP各个模型的前向对齐,绝对误差控制在1e-6内,精度在ImageNetV2 matched-frequency上与官方实现的精度对比,其中官方实现使用PIL前处理,本实现使用opencv,有小幅涨点 | 模型 | text误差 | image误差 | top-1 acc | top-5 acc | | ------------------------------------------------------------ | -------- | --------- | ------------------- | ------------------- | | [**RN50**](https://drive.google.com/file/d/17bsG4IiVPD3RU0XbzkignUp5vY459Cf7/view?usp=sharing) | 3.25e-07...
大佬,我想问下我迭代次数到了50次以后就会在某个地方损失值开始nan了,前面是有收敛的
## 使用 classification resnet进行分类苹果/橘子训练时,指定分类数量为2时,无法训练 Models/official/vision/classification/resnet/model.py resnet50只支持1000分类数据集训练,我只创建2分类数据时,修改num_classes=2时,无法正常完成训练 ## 任务描述 数据集格式是这样的: /path/to/imagenet train apple xxx.jpg ... orangle xxx.jpg ... ... val apple xxx.jpg ... orangle xxx.jpg ... ## 目标 由于我时初学,在经过自己各种修改后,仍然无法解决,需要帮忙。谢谢
## 背景 **COCO数据集测试速度异常**  ## 任务描述 按照首页readme安装megengine和Models,从 [hub.py](https://github.com/MegEngine/Models/blob/11013f6b3b252df71098b27714e39d9802d2520d/official/vision/detection/configs/atss_res50_coco_3x_800size.py#L18) 下载 预训练权重,直接在coco数据集上进行测试。代码未做任何改动,采用8卡测试,最终结果mAP为42.6(正常),但是耗时将近6m30s(不正常),正常8卡时间应该在1min左右 python:3.6 megengine版本:v1.4.0 ## 目标 希望多卡测试速度正常,请确认问题并帮忙修复
## 环境 1.系统环境:ubuntu1804 2.MegEngine版本:1.4.0 3.python版本:3.6.8 ## 复现步骤 1. git clone https://github.com/MegEngine/Models.git 2. python3 train.py -a resnet18 -d /path/to/imagenet --mode normal 出现此问题 ## 请提供关键的代码片段便于追查问题 1、train.py 和 finetune.py 同样出现此问题 ## 请提供完整的日志及报错信息 Traceback...
## 请求 实现MegEngine实现GPT2-ML(https://github.com/imcaspar/gpt2-ml) ## 任务描述 实验项目微调GPT2-ML,由于GPU资源不足(RTX 3060-12GB)无法调试,通过【机器之心】得知MegEngine1.4 DTR技术解决了动态图显存优化的问题,想请问有没有参考教程让我们能通过DTR实现对GPT2-ML的微调 ## 目标 采用MegEngine实现的GPT2-ML模型,通过DTR进行微调
我想测试一下resnet50 int8模型的速度,想问下有没有什么samplecode可以使用。是否有可以直接获取的训练好的量化模型?感谢!
## 任务描述 - 复现 Googlenet ,训练正常收敛,验收指标符合预期,并将代码提交到 offical/vision/classification/models 下 ## 目标 - 数据集ImageNet - 准确率和论文一致或更高 - 脚本可以完整完成训练步骤 - 提供训练后的权重文件 - 提交至 https://github.com/MegEngine/Hub
## 环境 1.系统环境:MegStudio 2.MegEngine版本: 3.python版本:3.7 4.模型名称:bert cls mgpc ## 复现步骤 1. 下载models 2. 按照readme提示在MegStudio运行 3. 没有tuple ## 请提供关键的代码片段便于追查问题 ## 请提供完整的日志及报错信息 
## 背景 1.实现fully量化的RetinaNet 2.将量化检测模型和vision/detection进行合并 ## 任务描述 1.现有RetinaNet受MegEngine版本限制仅仅量化了backbone部分,后续需要一个fully量化的RetinaNet 2.检测量化部分code有部分冗余,需要进行合并 ## 目标 将quant retinanet统一合入 vision/detection