更新时间:2023-10-26 16:13
开源深度学习框架旷视天元(MegEngine)是旷视自主研发的国产工业级深度学习框架,是旷视新一代AI生产力平台Brain++的最核心组件,在2020年3月正式向全球开发者开源。MegEngine凭借其训练推理一体、超低硬件门槛和全平台高效推理3大核心优势,能够帮助企业与开发者大幅节省产品从实验室原型到工业部署的流程,真正实现小时级的转化能力。
一套内核支撑训练到推理,无需模型转换,精度损失最小化。
前后处理可放入计算图推理,训练推理精确对齐,python C++ 不用写两遍。
traced module → megengine lite → megflow,从模型到高并发视频流处理服务只需几行python代码。
DTR 算法减少 75% 显存占用,1080 也能训 transformer。
自研 pushdown 内存分配算法,带来最低的内存/显存占用。
自动代码裁剪可使部署文件 binary size 下降 10 倍,有效降低推理硬件成本。
高效的推理性能,在各类 CPU、GPU 上均可享受到极致性能体验。
自动 layout、kernel 算法选择机制,轻松达到最优推理性能。
跨平台模型精度对齐,一套代码走天下。
2020年3月,MegEngine发布Alpha版本,正式向全球开发者开源;
2020年6月,MegEngine Beta版本正式发布,与小米的MACE深度学习推理框架、OPEN AI LAB(开放智能)的Tengine框架实现了深度集成。其中,MegEngine Beta版本迎来3项性能升级:ARM系列CPU支持、完善量化训练和推理功能、推理功能优化;
2020年9月,MegEngine V1. 0 预览版对外发布。新增5大技术特性:全新的Imperative Runtime、自动代码裁剪功能、更多的国产硬件支持、10余项推理侧性能优化、基于MLIR的静态子图优化引擎;
2020年10月,旷视深度学习框架天元(MegEngine)1. 0正式版对外发布
2021年6月,旷视深度学习框架天元(MegEngine)V1.4版本对外发布,首次引入动态图显存优化技术,可以大幅降低显存占用问题,帮助深度学习开发者节省硬件成本,用有限的硬件资源训练出更大的模型。具体而言,开发者增加 2 行代码,即可在相同显存情况下,训练 3 倍大的模型。
2021年9月,发布MegEngine Lite; 基于 MegEngine 的应用落地方案 Trace Module 正式开源。
2022年3月,发布MegEngine v1.8.2,CUDA 添加大卷积核的 direct conv 实现。
2022年9月,发布MegEngine v1.11.0,新增 CUDA INT4 支持。
MegSpot:一款高效、专业、跨平台的图片&视频对比应用。
MegFlow:提供快速视觉应用落地流程。
MegPeak:处理器测评工具,可以测试目标处理器的指令的峰值带宽、指令延迟、内存峰值带宽以及任意指令组合峰值带宽。
MegCC:面向推理的深度学习模型编译器。
MgeConvert:适用于 MegEngine 模型的转换器, 可将MegEngine导出的mge静态图模型或TracedModule模型转换为第三方模型文件。
BaseCls:极其全面的分类模型库,提供了海量模型的训练代码和预训练权重,全部算法均可以快速部署到硬件上。
旷视推出了一系列活动推动开发者生态建设:
旷视的天元模型中心提供了大量的图像分类、图像检测、图像分割、关键点、自然语言处理、生成对抗网络等方面的基础预训练模型,让开发者可以便捷上手,站在巨人的肩膀上开始自己的科研工作;
旷视推出了《深度学习实践》和《天元深度学习框架入门》系列视频课程,帮助开发者快速学习掌握天元使用方法。
旷视举办面向高校学生和全球AI青年人才的开源大赛和人才培养计划活动。2020年9月,旷视举办的人工智能开源大赛,吸引了包括清华大学、北京大学在内的全国49所高校和十余家企业参加。
2021年6月,为推动我国农业人工智能相关专业的教学改革,鼓励研究、开发和利用人工智能,加强农业人工智能领域的产学研合作,为我国农业人工智能创新创业人才的脱颖而出创造条件,由中国人工智能学会、中国农业工程学会主办,中国农业大学信息与电气工程学院、中国人工智能学会神经网络与计算智能专委会、旷视科技有限公司承办的第一届中国农业人工智能创新创业大赛暨第三届中国AI+创新创业大赛隆重举行。
旷视发起了开发者培训计划、支持计划、贡献者计划,吸引并鼓励开发者参与开源社区的生态建设。