跳转至
GiantPandaCV
专栏介绍
Initializing search
HOME
ACADEMIC
PROJECT
RESOURCES
VIDEO
History List
Github Resources
GiantPandaCV
HOME
HOME
Getting Started
ACADEMIC
ACADEMIC
算法科普
算法科普
专栏介绍
CV中的特征金字塔(质量较高)
CV中的特征金字塔(质量较高)
【CV中的特征金字塔】一,工程价值极大的YOLOv3-ASFF
【CV中的特征金字塔】二,Feature Pyramid Network
【CV中的特征金字塔】三,两阶段实时监测网络ThunderNet
【CV中的特征金字塔】四,CVPR 2018 PANet
【CV中的特征金字塔】五,Google Brain EfficientDet
【CV中的特征金字塔】六,ECCV 2018 PFPNet
【CV中的特征金字塔】七,SSD算法的改进版Rainbow SSD
【CV中的特征金字塔】八,SSD的改进版之DSSD
CV中的注意力机制(质量较高)
CV中的注意力机制(质量较高)
【CV中的Attention机制】BiSeNet中的FFM模块与ARM模块
【CV中的Attention机制】CBAM的姊妹篇-BAM模块
【CV中的Attention机制】Non-Local-neural-networks的理解与实现
【CV中的Attention机制】Non-Local改进CCNet
【CV中的Attention机制】Selective-Kernel-Networks-SE进化版
【CV中的Attention机制】融合Non-Local和SENet的GCNet
【CV中的Attention机制】易于集成的Convolutional-Block-Attention-Module-CBAM模块
【CV中的attention机制】语义分割中的scSE模块
【CV中的Attention机制】最简单最易实现的SE模块
【CV中的Attention机制】DCANet解读
【CV中的Attention机制】ShuffleAttention
深度学习中的Attention机制
深度学习中的Attention机制-Part2
结合代码看深度学习中的Attention机制
Involution(附对Involution的思考):港科大、字节跳动、北大提出“内卷”神经网络算子,在CV三大任务上提点明显
OutLook Attention:具有局部信息感知能力的ViT
ICCV2021 注意力卷积新思路CRAN_ 上下文推理注意力图像超分辨率网络(1)(1)
Deformable Attention Transformer
ViTAE
Transformer和Linear Attention结构大模型(质量较高)
Transformer和Linear Attention结构大模型(质量较高)
解析Transformer模型
解析Vision Transformer
解析 Token to Token Vision Transformer
图解swin transformer
Transformer综述
《互协方差注意力Transformer:XCiT》
OutLook Attention:具有局部信息感知能力的ViT
Vision Transformer新秀:VOLO
LightSeq Transformer高性能加速库
浅谈CMT以及复现
浅谈CSWin-Transformers
mogrifierlstm
如何将Transformer应用在移动端
DeiT:使用Attention蒸馏Transformer
Token-to-Token Transformer_LoBob
用于语言引导视频分割的局部-全局语境感知Transformer
Token Merging 你的VIT,但是更快
CVPR23-无需光流引导的视频联合去模糊和插帧transformer:针对真实世界运动模糊的插帧网络
CVPR2023 用于图像到视频转换的双路径Transformer
简单聊聊目标检测新范式RT-DETR的骨干:HGNetv2
无需nms,onnxruntime20行代码玩转RT-DETR
ICML 2023 LoSparse 低秩近似和结构化剪枝的有机组合
ICCV2023-一个模型助你实现图像分类和文本生成+论文解读+代码详细解读
ICCV 2023 ViECap论文解读
ChatRWKV 学习笔记和使用指南
ICCV2023论文精选 顶会大佬带你深入理解self-attention机制的底层逻辑
【RWKV】如何新增一个自定义的Tokenizer和模型到HuggingFace
使用MLC-LLM将RWKV 3B模型跑在Android手机上
ICCV2023 SOTA 长短距离循环更新网络--LRRU介绍
使用OpenCompass评测rwkv模型教程
Simplifying Transformer Blocks 论文解读
星辰AI大模型TeleChat-7B评测
ICLR2024 oral:小尺度Transformer如何Scale Up
新进展!Larimar-让大型语言模型像人一样记忆与遗忘
梳理RWKV 4,5(Eagle),6(Finch)架构的区别以及个人理解和建议
如何用Infini-attention实现无限上下文Transformer
在GPU上加速RWKV6模型的Linear Attention计算
性能提升,星辰AI大模型TeleChat-12B评测
ChatGPT技术体系
InstructGPT 介绍
SegGPT论文解读
ChatGPT和Claude 对比测试(以Review MLIR Codegen代码为例)更新官方ChatGPT的结果
GPT4 VS Claude In MLIR
使用GPT4做Leetcode第 102 场双周赛
OpenAI Superalignment的一种途径——Weak-to-Strong Generalization
AffineQuant 大语言模型的仿射变换量化
单节点8xA800跑起来HuggingFace DeepSeek V2踩坑
GQA,MLA之外的另一种KV Cache压缩方式:动态内存压缩(DMC)
OverlapMamba 具备超强泛化能力的定位方法
vAttention:用于在没有Paged Attention的情况下Serving LLM
大模型KV Cache节省神器MLA学习笔记(包含推理时的矩阵吸收分析)
半监督&无监督(质量较低)
半监督&无监督(质量较低)
WSCL
弱监督方法在森林病虫害检测中的应用
CVPR 2023 中的半监督学习 FixMatch 的升级版 UniMatch
ICCV2023-AlignDet 在各种检测器的所有模块实现无监督预训练
“北大-鹏城-腾讯”新视角:从势能的角度探讨模型的可迁移性-ICCV2023开源
尽览卷积神经网络(质量一般)
尽览卷积神经网络(质量一般)
卷积神经网络学习路线(一) 卷积神经网络的组件以及卷积层是如何在图像中起作用的?
卷积神经网络学习路线(二) 卷积层有哪些参数及常用卷积核类型盘点?
卷积神经网络学习路线(三) 盘点不同类型的池化层、11卷积的作用和卷积核是否一定越大越好?
卷积神经网络学习路线(四) 如何减少卷积层计算量,使用宽卷积的好处及转置卷积中的棋盘效应?
卷积神经网络学习路线(五) 卷积神经网络参数设置,提高泛化能力?
卷积神经网络学习路线(六) 经典网络回顾之LeNet
卷积神经网络学习路线(七) 经典网络回顾之AlexNet
卷积神经网络学习路线(八) 经典网络回顾之ZFNet和VGGNet
卷积神经网络学习路线(九) 经典网络回顾之GoogLeNet系列
卷积神经网络学习路线(十) 里程碑式创新的ResNet
卷积神经网络学习路线(十一) Stochastic Depth(随机深度网络)
卷积神经网络学习路线(十二) 继往开来的DenseNet
卷积神经网络学习路线(十三) CVPR2017 Deep Pyramidal Residual Networks
卷积神经网络学习路线(十四) CVPR 2017 ResNeXt(ResNet进化版)
卷积神经网络学习路线(十五) NIPS 2017 Dual Path Network(ResNeXt+DensetNet结合版)
卷积神经网络学习路线(十六) ICLR 2017 SqueezeNet
卷积神经网络学习路线(十七) Google CVPR 2017 MobileNet V1
卷积神经网络学习路线(十八) Google CVPR 2018 MobileNet V2
卷积神经网络学习路线(十九) 旷世科技 2017 ShuffleNetV1
卷积神经网络学习路线(二十) Google ICCV 2019 MobileNet V3
卷积神经网络学习路线(二十二) Google Brain EfficientNet
卷积神经网络学习路线(二十三) 经典网络回顾之XceptionNet
卷积神经网络学习路线(二十一) 旷世科技 ECCV 2018 ShuffleNet V2
【CNN结构设计】深入理解深度可分离卷积
CNN骨干网络新选择HS-ResNet
CSPNet
EffNet
HRNet
ghostnet
ThunderNet
IBN-Net 提升模型的域自适应性
NAS OR 手工设计网络,RegNet这样说
轻量级CNN架构设计
(图解)一步一步使用CPP实现深度学习中的卷积
图解RepVG
我卷我自己——cvpr2021:Involution
白给的性能不要?cvpr2021-Diverse branch block
图解MLP
深度学习中的重参数机制总结与代码实现
百度团队新作:Spatial Shift MLP
RMNet图解
RepOptimizer 其实是RepVGG2
开集识别 A Good Closed-Set Classifier is All You Need
CVPR 2023 LargeKernel3D 在3D稀疏CNN中使用大卷积核
可变形卷积(质量较低)
可变形卷积(质量较低)
DCN V1代码阅读笔记
MSRA DCN(可变形卷积) 算法笔记
再思考可变形卷积
频域中的CNN(质量较低)
频域中的CNN(质量较低)
CVPR 2020 在频域中学习的DCTNet
ECCV2020 F3-Net 商汤Deepfake检测模型
深度学习基础(质量较高)
深度学习基础(质量较高)
CNN一定需要池化层吗?
Rethinking ImageNet Pre-training
SVM Loss以及梯度推导
回炉重造:计算图
深度学习中的优化算法与实现
优化器文章
Kaiming He初始化详解
InstanceNorm梯度公式推导
Pytorch中的四种经典Loss源码解析
谈谈我眼中的Label Smooth
CVPR2021-Representative BatchNorm
ResNet与常见ODE初值问题的数值解法
welford算法小记
A Battle of Network Structure_pprp
CVPR2022:计算机视觉中长尾数据平衡对比学习
ICCV2023 基准测试:MS-COCO数据集的可靠吗?
手工调参Tricks(质量较高)
手工调参Tricks(质量较高)
【CNN结构设计】无痛的涨点技巧:ACNet
【CNN调参】目标检测算法优化技巧
【CNN调参】图像分类算法优化技巧
【损失函数合集】ECCV2016 Center Loss
【损失函数合集】Yann Lecun的Contrastive Loss 和 Google的Triplet Loss
【损失函数合集】超详细的语义分割中的Loss大盘点
CNN结构设计技巧-兼顾速度精度与工程实现
快2020年了,你还在为深度学习调参而烦恼吗?
深度学习的多个loss如何平衡 & 有哪些「魔改」损失函数,曾经拯救了你的深度学习模型?
激活还是不激活?CVPR2021-Activate Or Not
浅谈混合精度训练ImageNet
Piecewise Linear Unit:分段线性激活函数
余弦退火重启动学习率机制
如何让你的分类性能提升之LARS_蒋神
提升分类性能之bag of tricks_蒋神
提升分类性能之优化调参
浅谈LabelSmooth的两种实现以及推导_蒋
Google提出面向长尾分布的logit的调整新方法
Mitigating Neural Network Overconfidence with Logit Normalization
ICLR 2022 基于不确定性的域外泛化
AutoML(质量一般)
AutoML(质量一般)
你所需要知道的关于AutoML和NAS的知识点
【神经网络搜索】1. NAS-RL(ICLR 2017)
【神经网络搜索】DARTS
【神经网络搜索】ENAS
【神经网络搜索】NasBench101
【神经网络搜索】Once for all
【神经网络搜索】Single Path One Shot
AutoML/Attention Transfer
Bag of Tricks for NAS
Fixing the train-test resolution
NetAug 韩松团队新作
Towards Oracle Knowledge Distillation with NAS_pprp
【知识蒸馏】Knowledge Review
【知识蒸馏】Deep Mutual Learning
知识蒸馏综述-知识的类型
知识蒸馏综述_网络结构搜索应用
PointDistiller面向高效紧凑3D检测的结构化知识蒸馏
SLAM和3D重建(质量较低)
SLAM和3D重建(质量较低)
基于学习视觉里程计的动态稠密RGB-D SLAM
DID-M3D用于单目3D物体检测的解耦实例深度
SSL-Lanes用于自动驾驶中运动预测的自监督学习
分布式概率SLAM图中的增量抽象
动态稠密SLAM的自监督场景运动分解
结构PLP-SLAM针对单目、RGB-D和双目相机使用点线面的高效稀疏建图及定位
CVPR 2022:利用CLIP高效处理三维点云_Garfield
DynaVINS用于动态环境的视觉惯性SLAM
DytanVO动态环境中视觉里程计和运动分割的联合优化_泡椒味的口香糖
FusionPortable 用于评估不同平台上的定位和建图精度的多传感器校园数据集
具有负平面的相机姿态引导回环
通过整合IMU运动动力学实现尺度感知、鲁棒和可推广的无监督单目深度估计
DeepLSD基于深度图像梯度的线段检测和细化
SceneRF具有辐射场的自监督单目三维场景重建
Wayve 从源头讲起,如何实现以对象为中心的自监督感知方法
ICCV2023论文精读:用于三维分析的基于聚类的点云表示学习
P2C-自监督点云补全, 只需用单一部分点云
多项SOTA!SVDFormer-自增强自结构双生点云补全算法-ICCV2023论文详解
ICCV2023开源 DistillBEV 巧妙利用跨模态知识蒸馏方法,斩获目标检测SOTA
ICCV2023 室内场景自监督单目深度估计
ICCV2023 SOTA U-BEV:基于高度感知的鸟瞰图分割和神经地图的重定位
CVPR2023开源SOTA!用于实时激光雷达全景分割的中心聚焦网络
最新SOTA 隐式学习场景几何信息进行全局定位
FlashOcc 无需微调,即插即用的占据预测模型
NID-SLAM:动态环境中基于神经隐式表示的RGB-D SLAM
Attention SLAM一种从人类注意中学习的视觉单目SLAM
复杂动态环境下的多模态语义SLAM
多模态(质量一般)
多模态(质量一般)
恺明团队新作:更快的CLIP训练模式
ICCV 2023 TinyCLIP解读
对比学习(质量一般)
对比学习(质量一般)
Nearest-Neighbor Contrastive Learning of Visual Representations
CVPR 2021 如何理解对比学习中的温度系数?
NeurIPS 2022最新接收:面向测试阶段的prompt搜索方式
MAK 基于开放世界取样提升不平衡对比学习
NeurIPS19 用分类模型完成生成任务
【域自适应】Graph-Relational Domain Adaptation
利用语言模型为视觉模型提供提示
如何把视觉语言模型应用到视频里
扩散模型(质量一般)
扩散模型(质量一般)
Diffusion Model的演进 NeurIPS 2022最佳论文:Imagen
Google Brain提出基于Diffusion的新全景分割算法
一文弄懂DiffusionModel
不需要训练来纠正文本生成图像模型的错误匹配
如何简单高效地定制自己的文本作画模型?
当 TransFormer 遇到 Diffusion
斯坦福大学最新扩散模型工作DID用于低光照文字识别的扩散模型
扩散模型大杀器 ControlNet 解析
Tune-A-Video论文解读
ICLR 2023:基于 diffusion adversarial representation learning 的血管分割
论文解读 Open-Set Grounded Text-to-Image Generation
CVPR 2023 把人放在他们的位置,把人自然地插到图像里
ControlVideo:可控的Training-free的文本生成视频
无需训练的框约束Diffusion:ICCV 2023揭秘BoxDiff文本到图像的合成技术
ICCV 2023 探索基于生成模型的 Backbone 预训练
ICCV 2023 StyleInV论文解读
Diffusion Models 10 篇必读论文(0)
Diffusion Models 10 篇必读论文(1)DDPM
Diffusion Models 10 篇必读论文(2)DDIM
Diffusion Models 10 篇必读论文(3)Classifier-guided Diffusion Model
ICCV 2023 SVDiff论文解读
Diffusion Models 10 篇必读论文(4)Classifier-Free Diffusion Guidance
基于 Discrete Diffusion 的模型不可知分割细化
最新SOTA 利用扩散模型精准识别UDC环境下的面部表情
Sora生成具有惊人几何一致性的视频,评估指标来了
ICLR 2024 spotlight WURSTCHEN - 一个高效的大规模文本到图像扩散模型的架构
综述类(质量较高)
综述类(质量较高)
【综述】Dropout模式和发展
【综述】图像去雾的前世今生
precision和recall重新理解
pytorch中的模型可复现性
池化
关于目标检测和感受野的一点总结和想法
卷积核梳理
盘点当前最流行的激活函数及选择经验
思考NLP和CV中的Local和Global建模
其它方向论文解读(质量一般)
其它方向论文解读(质量一般)
一文读懂AlphaTensor论文
AAAI22 Panini-Net 基于GAN先验的退化感知特征插值人脸修复网络
ECCV22 Oral VQFR 基于矢量量化字典与双解码器的人脸盲修复网络
ICLR 2023 oral论文:一种除了卷积和ViT以外的新视觉框架-Image as Set of Points
微软亚洲研究院最新工作DeepMIM-MIM中引入深度监督方法
计算机视觉中的主动学习介绍
CVPR 2023 Stare at What You See讲解
thinktwice:用于端到端自动驾驶的可扩展解码器
Continual Test-Time 的领域适应
CVPR 2023 中的领域适应 一种免反向传播的 TTA 语义分割方法
CVPR 2023 中的领域适应 通过自蒸馏正则化实现内存高效的 CoTTA
自动驾驶建图道路边界生成方案
语义及实例分割(质量一般)
语义及实例分割(质量一般)
专栏介绍
DeepLab语义分割算法源码解析
当UNet遇见ResNet会发生什么?
实例分割算法之Mask R-CNN论文解读.md
语义分割算法之CVPR 2017 RefineNet(精度高且对稠密物体分割效果好,已开源).md
语义分割算法之Deeplab V1论文理解
语义分割算法之DeepLab V2论文理解
语义分割算法之DeepLab V3论文理解
语义分割算法之DeepLab V3+论文理解及代码分析
语义分割算法之ENet论文理解
语义分割算法之FCN论文理解
语义分割算法之ICNet论文理解
语义分割算法之PSPNet论文理解
语义分割算法之SegNet论文理解
语义分割算法之Unet论文理解
图像分割的一些理解
用Pytorch实现三个优秀的自然图像分割框架!(4)
TransBTS_ 3D 多模态脑肿瘤分割 Transformer 阅读笔记
UTNet:用于医学图像分割的混合 Transformer 网络阅读笔记
轻量级的肝脏与肝肿瘤 2.5D 分割网络阅读笔记
GitNet:基于几何先验变换的鸟瞰图分割
CVPR 2022:Generalized Few-shot Semantic Segmentation 解读
CVPR22 迈向无监督的Zeroshot 分割_Garfield
MICCAI 2022:基于 MLP 的快速医学图像分割网络—UNeXt
【MICCAI 2022】PHTrans:并行聚合全局和局部表示以进行医学图像分割
ECCV 2022:跨域小样本语义分割新基准(也提出 PATNet)
MICCAI 2022:使用自适应条形采样和双分支 Transformer 的 DA-Net
医学图像的 AI 框架 MONAI 详细教程(一)
TMI 2023:对比半监督学习的领域适应(跨相似解剖结构)分割
MedSegDiff:基于 Diffusion Probabilistic Model 的医学图像分割
将Segment Anything扩展到医学图像领域
Segment Anything模型部分结构和代码解析
ImgX-DiffSeg 基于 DDPMs 的 3D 医学图像分割
用于语义分割的解码器 diffusion 预训练方法
CVPR 2023 中的领域适应-用于切片方向连续的无监督跨模态医学图像分割
IPMI 2023:Test Time Adaptation 的医学图像分割解决
ICCV 2023:CLIP 驱动的器官分割和肿瘤检测通用模型
MICCAI 2023 Continual Learning 的腹部多器官和肿瘤分割
三维场景零样本分割新突破:SAMPro3D技术解读
超分和GAN(质量一般)
超分和GAN(质量一般)
专栏介绍
MSFSR:一种通过增强人脸边界精确表示人脸的多级人脸超分辨率算法
DeepFake系列之FakeSpotter
基于Kaggle DeepFake比赛的代码实战
生成对抗网络中的数据增广 一种可微分的数据增广方法
仅使用少量数据训练生成对抗网络
Deblurring by Realistic Blurring 图像去模糊论文解读
基于GAN来做低光照图像增强,EnlightenGAN论文解读
CVPR21 Oral 图像风格化鲁棒性的再思考和提升 论文解读
Deepfake视频中的时空不一致性学习
Rethinking and Improving the Robustness of Image Style Transfer
ICCVW2021 SDWNet
Model-driven Deep Neural Network for Single Image Rain Removal
Towards Compact Single Image Super-resolution via Contrastive self-distillation_owen
CVPRW22 UWNR
基于卷积神经网络的雾天智能停车位检测一种新方法
Instance-GAN
CVPR 2023 无需借助文本训练来定制自己的生成模型
【综述】无监督学习在盲超分任务中的应用论文串烧
Arxiv2023 TriA-GAN 任意人物,任何地方,任何姿势的合成
目标检测及跟踪(已过时)
目标检测及跟踪(已过时)
专栏介绍
Darknet
Darknet
Darknet源码阅读综合版
基于CS231N和Darknet解析BatchNorm层的前向和反向传播
YOLOV3特色专题
YOLOV3特色专题
YOLOV3损失函数再思考 Plus
官方DarkNet YOLO V3损失函数完结版
你对YOLOV3损失函数真的理解正确了吗?
史上最详细的Yolov3边框预测分析
经典检测算法代码解析
经典检测算法代码解析
CenterNet
CenterNet
Centernet0-数据集配置
CenterNet1-数据集构建
CenterNet2-骨干网络之hourglass
CenterNet3-骨干网络之DeepLayerAgregation
CenterNet4-Loss计算
CenterNet5-测试推理过程
CenterNet 电子书
用CenterNet对旋转目标进行检测
FasterRCNN
FasterRCNN
【Faster RCNN理解】1. 整体框架
【Faster R-CNN】2. Faster RCNN代码解析第一弹
【Faster R-CNN】3. Faster RCNN代码解析第二弹
【Faster R-CNN】4. Faster RCNN代码解析第三弹
【Faster R-CNN】5. Faster RCNN代码解析第四弹
【Faster RCNN】概述(番外)
SSD
SSD
目标检测算法之SSD代码解析(万字长文超详细)
目标检测算法之SSD的数据增强策略
YOLOV3
YOLOV3
【从零开始学习YOLOv3】1. YOLO cfg文件解析
【从零开始学习YOLOv3】2. 代码配置和数据集处理
【从零开始学习YOLOv3】3. YOLOv3的数据组织与处理
【从零开始学习YOLOv3】4. YOLOv3中的参数进化
【从零开始学习YOLOv3】5. 网络模型的构建
【从零开始学习YOLOv3】6. 模型构建中的YOLOLayer
【从零开始学习YOLOv3】7. 教你在YOLOv3模型中添加Attention机制
【从零开始学习YOLOv3】8. YOLOv3中Loss部分计算
从零开始学习YOLOv3汇总版_GiantPandaCV公众号
来自AlexeyAB的目标检测建议
利用Darket 和YOLOV3训练自己的数据集(制作VOC)
目标检测算法之NMS后处理相关
目标检测算法之YOLO系列算法的Anchor聚类
目标检测算法之评价标准和常见数据集盘点
比NMS更优的Confluence论文复现
论文解析
论文解析
anchor free模型
anchor free模型
【目标检测Anchor-Free】CVPR 2019 CenterNet
【目标检测Anchor-Free】CVPR 2019 ExtremeNet(相比CornerNet涨点5.3%)
【目标检测Anchor-Free】CVPR 2019 Object as Points(CenterNet)
【目标检测Anchor-Free】ECCV 2018 CornerNet
CenterNet-Object As Points
目标检测算法之Anchor Free的起源:CVPR 2015 DenseBox
RepPoint及RepPointv2初探
one stage模型
one stage模型
目标检测算法之YOLOv1
目标检测算法之YOLOv2
目标检测算法之YOLOv2损失函数详解
目标检测算法之YOLOv3及YOLOV3-Tiny
一张图梳理YOLOv4
目标检测算法之AAAI2019 Oral论文GHM Loss
目标检测算法之AAAI 2020 《Distance-IoU Loss Faster and Better Learning for Bounding Box Regression》已开源
目标检测算法之CVPR 2018 RefineDet
目标检测算法之CVPR2019 GIoU Loss
目标检测算法之ECCV 2018 RFBNet,在检测中调感受野
目标检测算法之ICCV 2019 TridentNet(三叉戟网络,刷新COCO纪录,已开源)
目标检测算法之ICCV2019 Gaussian YOLOv3
在小目标检测上另辟蹊径的SNIP
Repulsion Loss 遮挡场景下的目标检测
SNIP的升级版SNIPER(效果比Mosaic更佳)
YOLT 大尺寸图像目标检测的解决方案
不需要预训练模型的目标检测算法DSOD
PPYOLO
检测器backbone和neck哪个更重要,达摩院新作有不一样的答案
Detectors for the 2020s 目标检测算法最新进展
YOLOE,2022年新版YOLO解读_陈e
CVPR2022 Oral:StreamYOLO-流感知实时检测器(1)
YOLOv7来临:图解网络结构模块
YOLOv7来临:论文详读和解析
YOLOV1 - V4 第二次阅读
YOLOv7-Pose尝鲜,基于YOLOv7的关键点模型测评
two stage模型
two stage模型
Group Sample:一个简单有效的目标检测升点Trick
目标检测算法之CVPR 2018 Cascade R-CNN
目标检测算法之CVPR 2019 Guided Anchoring
目标检测算法之Fast-RCNN
目标检测算法之Faster-RCNN
目标检测算法之FPN
目标检测算法之Light-Head R-CNN
目标检测算法之NIPS 2016 R-FCN(来自微软何凯明团队)
目标检测算法之RCNN
目标检测算法之RetinaNet(引入Focal Loss)
Towards Open World Object Detection -CVPR2021 Oral(开放世界中的目标检测)
Towards Open-Set Object Detection and Discovery
基于CNN的区域特定多尺度特征提取的两阶段停车位检测_泡椒味的口香糖
Towards Open World Object Detection -CVPR2021 Oral(开放世界中的目标检测)
嵌入式端小模型
嵌入式端小模型
Pelee 移动端实时检测骨干网络
其它类型
其它类型
KNN-OOD
OOD_LogitNorm
CVPR 2022 oral 面向丰富数据集的out-of-distribution检测
ICML2022:一种解决overconfidence的简洁方式
Deformable DETR 端到端目标检测
扩散模型用于目标检测 DiffusionDet
Windows 版的3D目标检测框架 smoke PyTorch 实现
车道线检测 Ultra Fast Deep Lane Detection V2 讲解
目标跟踪
目标跟踪
darklabel教程
deepsort框架梳理
多目标跟踪数据集解析
deep sort论文
Deep Sort多目标跟踪算法解析(上)
Deep Sort多目标跟踪算法解析(下)
DeepSORT算法代码解析(全)
多目标跟踪快速入门
MUTR3D通过3D到2D查询的多相机跟踪框架
基于多传感器的3DMot
人脸识别
人脸识别
CPU上的实时人脸检测算法FaceBoxes
InsightFace力作:RetinaFace单阶段人脸检测器
一个实用价值很大的人脸关键点检测算法PFLD
人脸识别系列一 特征脸法
人脸识别系列二 FisherFace,LBPH算法及Dlib人脸检测
人脸识别系列三 MTCNN算法详解上篇
人脸轻量级
利用渐进校准网络(PCN)的实时角度无关人脸检测
在小尺寸人脸检测上发力的S3FD
小目标人脸检测SOTA网络PyramidBox++
用于人脸检测的SSH算法
百度 PyramidBox 人脸检测器
旋转目标检测
旋转目标检测
旋转目标检测中anchor匹配机制的问题和一些思考
高分遥感图像解决方案
基于任务耦合和角度近似的高精度旋转目标检测
文献综述
文献综述
【综述】Pytorch YOLO项目推荐 建议收藏学习
深度学习检测网络论文阅读50篇--第一章
深度学习检测网络论文阅读50篇--第二章
深度学习检测网络论文阅读50篇--第三章
深度学习检测网络论文阅读50篇--第四章
深度学习检测网络论文阅读50篇汇总
从检测角度理解label assign当前进展
目标检测算法是如何生成正负样本的(一)
科研及竞赛分享(质量较高)
科研及竞赛分享(质量较高)
专栏介绍
红外目标检测实验结果收集
如何改进yolov3
验证码识别竞赛解决方案
关键点定位红外小目标
2019 天池县域农业大脑AI挑战赛冠军方案分享
ACCV国际细粒度识别比赛复盘
基于CenterFace的模型优化记录
人物属性模型移动端实验记录
基于深度学习的RGBD深度图补全算法文章鉴赏
Kaggle StarFish挑战赛金牌分享_cydiaChen
如何更快的训练Vision Transformer
双非硕的毕设复盘:数据库篇(文末附半自动标注工具包)
CVPR 2023年AQTC挑战赛第一名解决方案:以功能-交互为中心的时空视觉语言对齐方法
CVPR VISION 23挑战赛第1赛道亚军解决方案 - 数据高效缺陷检测
单目深度估计挑战赛冠军方案-ICCV2023
视觉类表面缺陷检测项目相关技术总结
传统图像(已过时)
传统图像(已过时)
专栏介绍
一些有趣的图像算法(已过时)
一些有趣的图像算法(已过时)
OpenCV图像处理专栏一 盘点常见颜色空间互转
OpenCV图像处理专栏二 《Local Color Correction 》论文阅读及C++复现
OpenCV图像处理专栏三 灰度世界算法原理和实现
OpenCV图像处理专栏四 自动白平衡之完美反射算法原理及C++实现
OpenCV图像处理专栏五 《Real-time adaptive contrast enhancement for imaging sensors》论文解读及实现
OpenCV图像处理专栏六 来自何凯明博士的暗通道去雾算法(CVPR 2009最佳论文)
OpenCV图像处理专栏七 直方图均衡化算法及代码实现
OpenCV图像处理专栏八 《Contrast image correction method》 论文阅读及代码实现
OpenCV图像处理专栏九 基于直方图的快速中值滤波算法
OpenCV图像处理专栏十 利用中值滤波进行去雾
OpenCV图像处理专栏十一 IEEE Xplore 2015的图像白平衡处理之动态阈值法
OpenCV图像处理专栏十二 《基于二维伽马函数的光照不均匀图像自适应校正算法》
OpenCV图像处理专栏十三 利用多尺度融合提升图像细节
OpenCV图像处理专栏十四 基于Retinex成像原理的自动色彩均衡算法(ACE)
OpenCV图像处理专栏十五 《一种基于亮度均衡的图像阈值分割技术》
OpenCV图像处理专栏十六 合理选用Side Window Filter辅助矩形框检测
OpenCV图像处理专栏十七 清华大学《基于单幅图像的快速去雾》C++复现(有一定工程意义)
OpenCV图像处理专栏十八 手动构造Sobel算子完成边缘检测
OpenCV图像处理专栏十九 手动实现基于Canny算子的边缘检测
OpenCV图像处理专栏二十 《Adaptive Logarithmic Mapping For Displaying High Contrast Scenes》复现
《Optimized contrast enhancement for real-time image and video dehazin》论文C++复现
《Single Image Haze Removal Using Dark Channel Prior》论文阅读及复现番外
《改进非线性亮度提升模型的逆光图像恢复》论文复现
CVPR论文《100+ Times Faster Weighted Median Filter (WMF)》的实现和解析
一些基础的图像算法(已过时)
一些基础的图像算法(已过时)
《Adaptive Local Tone Mapping Based on Retinex for High Dynamic Range Images》C++实现
RGB和CIELAB颜色空间转换及偏色检测
肤色检测算法 - 基于不同颜色空间简单区域划分的皮肤检测算法
高斯滤波的C++实现与优化
基于二次多项式混合模型肤色检测算法
色彩均衡化算法
双边滤波原理及Opencv调用
同态滤波 原理及实现
图像处理中的分水岭算法
图像处理中的模糊算法
图像处理中的锐化算
引导滤波 原理及实现
PROJECT
PROJECT
CUDA相关的文章分享(质量较高)
CUDA相关的文章分享(质量较高)
专栏介绍
Oneflow 实现强化学习玩 Flappy Bird 小游戏
以OneFlow为例梳理深度学习框架的那些插值方法
在OneFlow实现数据类型自动提升
于OneFlow实现Unfold Fold算子
基于OneFlow实现量化感知训练
深度学习框架OneFlow是如何和ONNX交互的
深度学习框架量化感知训练的思考及OneFlow的一种解决方案
Oneflow 添加算子实践 ---- 实现 Expand 和 Repeat
使用OneFlow完成基于U型网络的ISBI细胞分割任务
深度学习框架如何优雅的做算子对齐任务?
一个Tensor在OneFlow的执行流程
CUDA WarpReduce 学习笔记
浅谈NVIDIA-H100白皮书
HugeCTR源码简单走读
基于 Flowflops 详解深度学习网络的 FLOPs 和 MACs 计算方案
详解 NVIDIA H100 TransformerEngine
【BBuf的CUDA笔记】一,解析OneFlow Element-Wise 算子实现
【BBuf的CUDA笔记】二,解析 OneFlow BatchNorm 相关算子实现
【BBuf的CUDA笔记】三,reduce优化入门学习笔记
【BBuf的CUDA笔记】四,介绍三个高效实用的CUDA算法实现(OneFlow ElementWise模板,FastAtomicAdd模板,OneFlow UpsampleNearest2d模板)
【BBuf的CUDA笔记】五,解读 PyTorch index_add 操作涉及的优化技术
【BBuf的CUDA笔记】六,总结 FasterTransformer Encoder(BERT) 的cuda相关优化技巧
【BBuf的CUDA笔记】七,总结 FasterTransformer Decoder(GPT) 的cuda相关优化技巧
【BBuf的CUDA笔记】八,对比学习OneFlow 和 FasterTransformer 的 Softmax Cuda实现
【BBuf的CUDA笔记】九,使用newbing(chatgpt)解析oneflow softmax相关的fuse优化
CodeGeeX 130亿参数大模型的调优笔记:比FasterTransformer更快的解决方案
ChatGPT和Claude 对比测试以Review MLIR Codegen代码为例
【BBuf的cuda学习笔记十】Megatron-LM的gradient_accumulation_fusion优化
【BBuf的CUDA笔记】十,Linear Attention的cuda kernel实现解析
【BBuf的CUDA笔记】十一,Linear Attention的cuda kernel实现补档
乱谈CUTLASS GTC2020 SLIDES
可能是讲得最清楚的WeightOnlyGEMM
【BBuf的CUDA笔记】十二,LayerNorm,RMSNorm的重计算实现
【BBuf的CUDA笔记】十三,OpenAI Triton 入门笔记一
【BBuf的CUDA笔记】十四,OpenAI Triton入门笔记二
【BBuf的CUDA笔记】十五,OpenAI Triton入门笔记三 FusedAttention
flash-linear-attention的fused_recurrent_rwkv6 Triton实现精读
在GPU上加速RWKV6模型的Linear Attention计算
flash-linear-attention中的Chunkwise并行算法的理解
硬件高效的线性注意力机制Gated Linear Attention论文阅读
PyTorch(质量较高)
PyTorch(质量较高)
专栏介绍
用沐神的方法阅读PyTorch FX论文
一文理解PyTorch中的SyncBatchNorm
【DeepSpeed 教程翻译】开始,安装细节和CIFAR-10 Tutorial
大语言模型中的常用评估指标
【DeepSpeed 教程翻译】二,Megatron-LM GPT2,Zero 和 ZeRO-Offload
DeepSpeed结合Megatron-LM训练GPT2模型笔记上
DeepSpeed-Chat 打造类ChatGPT全流程 笔记一
DeepSpeed-Chat 打造类ChatGPT全流程 笔记二之监督指令微调
【DeepSpeed 教程】四,DeepSpeed ZeRO++博客和代码解析
XLA和PyTorch的桥接
《PytorchConference2023 翻译系列》1-Pytorch2.0与社区现状介绍
《PytorchConference2023 翻译系列》2-PyTorch开发者基础设施
《PytorchConference2023 翻译系列》3- TorchFix
《PytorchConference2023 翻译系列》4-探索PyTorch在MPS后端的最新增强功能:提升应用程序性能
《PytorchConference2023 翻译系列》6-Triton编译器
《PytorchConference2023 翻译系列》7-深入探索CUTLASS:如何充分利用Tensor Cores
《PytorchConference2023 翻译系列》9,在PyTorch 2.X中使用TensorRT加速推理
《PytorchConference2023 翻译系列》11-使用新的ONNX导出器简化模型导出
《PytorchConference2023 翻译系列》15-PyTorch-Edge-在边缘设备上部署AI模型的开发者之旅
《PytorchConference2023 翻译系列》16.PyTorch 边缘部署之编译器和后端的供应商集成之旅
《PytorchConference2023 翻译系列》18-如何在TorchServe上提供LLMs的分布式推理
《PytorchConference2023翻译系列》19-使用TorchBench for PyTorch标准化CPU基准测试
《PytorchConference2023翻译系列》22. PT2 Export - 用于PyTorch的全图捕获机制
《PytorchConference2023翻译系列》25 数据及加载技术的演进
AI Infra论文阅读之通过打表得到训练大模型的最佳并行配置
AI Infra论文阅读之将流水线并行气泡几乎降到零(附基于Meagtron-LM的ZB-H1开源代码解读)
AI Infra论文阅读之LIGHTSEQ(LLM长文本训练的Infra工作)
AI Infra论文阅读之《在LLM训练中减少激活值内存》
MsnhNet(已过时)
MsnhNet(已过时)
专栏介绍
多平台轻量级PyTorch模型推理框架MsnhNet
Pytorch直转Msnhnet思路分享
人脸106点Caffe模型如何部署到MsnhNet
图解神秘的NC4HW4
使用Msnhnet实现最优化问题(1)一(无约束优化问题)
基于Msnhnet实现最优化问题(中)一(无约束优化问题)
基于YOLOV5的数据集标注,训练,WindowsLinuxJetson Nano多平台部署全流程
部署优化
部署优化
专栏介绍
AI PC端优化(已过时)
AI PC端优化(已过时)
【AI PC端算法优化】一,一步步优化RGB转灰度图算法
【AI PC端算法优化】二,一步步优化自然饱和度算法
【AI PC端算法优化】三,深入优化RGB转灰度图算法
【AI PC端算法优化】四,一步步将Sobel边缘检测加速22倍
【AI PC端算法优化】五,常量阶最大值最小值滤波算法
【AI PC端算法优化】六,优化一个简单的肤色检测算法
【AI PC端算法优化】七,RGB和YUV图像颜色空间互转SSE优化
【AI PC端算法优化】八,小半径中值滤波的SSE极速优化
Yolo系列模型的部署、精度对齐与int8量化加速
AI 移动端算法优化(质量较高)
AI 移动端算法优化(质量较高)
移动端arm cpu优化学习笔记
移动端arm cpu优化学习笔记
移动端arm cpu优化学习笔记----一步步优化盒子滤波(Box Filter)
移动端arm cpu优化学习笔记第2弹--常量阶时间复杂度中值滤波
移动端arm cpu优化学习笔记第3弹--绑定cpu(cpu affinity)
移动端arm cpu优化学习笔记第4弹--内联汇编入门
AI移动端优化之Im2Col+Pack+Sgemm
CNN不用乘法 AdderNet和DeepShift论文阅读
ICCV2019 高通Data-Free Quantization论文解读
Im2Col+GEMM的改进方法MEC,一种更加高效的卷积计算策略
基于NCNN的3x3可分离卷积再思考盒子滤波
基于how-to-optimize-gemm初探矩阵乘法优化
详解卷积中的Winograd加速算法
一份朴实无华的移动端盒子滤波算法优化笔记
EasyQuant 后量化算法论文解读
Side Window Filtering 论文解读和C++实现
如何判断算法是否有可优化空间?
海思NNIE之Mobilefacenet量化部署
海思NNIE之RetinaFace量化部署
海思NNIE之PFPLD训练与量化
深入理解深度学习中的反(转置)卷积
道阻且长_再探矩阵乘法优化
ARM Neon Intrinsics 学习指北:从入门、进阶到学个通透
NCNN+INT8+YOLOV4量化模型和实时推理
Atlas基础知识
NCNN+Int8+yolov5部署和量化
PPLcnet和YOLO的碰撞,真的能在cpu上快到起飞?
【详细图解】再次理解im2col
工程部署(一)_ 移动端算子的选择_陈e
工程部署(三):低算力平台模型性能的优化_陈e
Windows 上基于 TensorRT 的 YOLOV6 部署保姆级教程
用于ARM Cortex-M系列的芯片的神经网络推理库CMSIS-NN详解
NEON做色域变化_ 用单核性能无限逼近八核并行OpenCV
60行代码加速20倍_NEON实现深度学习OD任务后处理绘框
深度学习编译器(质量较高)
深度学习编译器(质量较高)
多面体模型在深度学习编译器的应用
【从零开始学深度学习编译器】一,深度学习编译器及TVM介绍
【从零开始学深度学习编译器】二,TVM中的scheduler
【从零开始学TVM】三,基于ONNX模型结构了解TVM的前端
【从零开始学深度学习编译器】四,解析TVM算子
【从零开始学深度学习编译器】五,TVM Relay以及Pass简介
【从零开始学深度学习编译器】六,TVM的编译流程详解
【从零开始学深度学习编译器】七,万字长文入门TVM Pass
【从零开始学深度学习编译器】八,TVM的算符融合以及如何使用TVM Pass Infra自定义Pass
【从零开始学深度学习编译器】九,TVM的CodeGen流程
【从零开始学深度学习编译器】番外一,Data Flow和Control Flow
【从零开始学深度学习编译器】番外二,在Jetson Nano上玩TVM
【从零开始学深度学习编译器】十一,初识MLIR
【从零开始学深度学习编译器】十二,MLIR Toy Tutorials学习笔记一
【从零开始学深度学习编译器】十三,如何在MLIR里面写Pass?
【从零开始学深度学习编译器】十四,MLIR Toy Tutorials学习笔记之部分Lowering
【从零开始学深度学习编译器】十五,MLIR Toy Tutorials学习笔记之Lowering到LLVM IR
【从零开始学深度学习编译器】十六,MLIR ODS要点总结上篇
【从零开始学深度学习编译器】十七,MLIR ODS要点总结下篇
【从零开始学深度学习编译器】十八,MLIR中的Interfaces
【从零开始学深度学习编译器】十九,MLIR的Pass机制实践
【从零开始学深度学习编译器】二十,MLIR的Pattern Rewrite机制
以OneFlow为例探索MLIR的实际开发流程
Ansor论文阅读笔记&&论文翻译
TVM源语=Compute篇
可以让深度学习编译器来指导算子优化吗
MLIR论文
MLIR:摩尔定律终结的编译器基础结构 论文解读
【论文解读】基于MLIR生成矩阵乘法的高性能GPU代码,性能持平cuBLAS
MLSys 15_884 Course Introduction
【TVM 三代优化巡礼】在X86上将普通的矩阵乘法算子提速90倍
【社区实践】为 TVM 新增 OneFlow 前端
踩坑记 如何编译所有版本的TVM
OSDI 2021 PET 论文解读(代码生成相关工作)
Roller
TVM 学习指南
MLSys入门资料整理
OpenAI Triton MLIR 第零章 源码编译
OpenAI Triton MLIR 第一章 Triton DSL
深度学习编译器之Layerout Transform优化
OpenAITriton MLIR 第二章 Batch GEMM benchmark
OpenAI-Triton MLIR 第三章 Triton-shared开箱
OpenAI Triton MLIR 第四章 ROCm-triton配置
深度学习编译器之公共子表达式消除和死代码消除实现
MLC-LLM 部署RWKV World系列模型实战(3B模型Mac M2解码可达26tokens每s)
mlc-llm 推理优化和大语言模型搭建解析
AI 部署及其它优化算法(质量一般)
AI 部署及其它优化算法(质量一般)
NCNN(已过时)
NCNN(已过时)
Keras2NCNN?Yes
OpenVINO(质量一般)
OpenVINO(质量一般)
vs2015 movidius 神经计算棒一代 ncsdk windows c++调用
YOLOv3-tiny在VS2015上使用Openvino部署
如何使用OpenVINO部署以Mobilenet做Backbone的YOLOv3模型?
c++实现yolov5的OpenVINO部署
手把手教你使用OpenVINO部署NanoDet模型
基于Pytorch对YOLOV5 进行简易实现
TensorRT(质量一般)
TensorRT(质量一般)
一,TensorRT介绍,安装及如何使用?
二,TensorRT Mnist数字识别使用示例
三,如何使用tensorRT C++ API搭建网络
四,TensorRT 如何进行细粒度的Profiling
五,在VS2015上利用TensorRT部署YOLOV3-Tiny模型
六,利用TensorRT部署YOLOV3-Tiny INT8量化模型
基于TensorRT量化部署RepVGG模型
基于TensorRT量化部署YOLOV5s 4.0模型
基于TensorRT完成NanoDet模型部署
如何让你的YOLOV3模型更小更快?
基于Pytorch构建一个可训练的BNN
基于Pytorch构建三值化网络TWN
低比特量化之XNOR-Net
低比特量化之DoreFa-Net理论与实践
YOLOV3剪枝方法汇总
Pytorch实现卷积神经网络训练量化(QAT)
ICCV 2017 Learning Efficient Convolutional Networks through Network Slimming(模型剪枝)
VGG,ResNet,DenseNe模型剪枝代码实战
快速exp算法
折叠BN层
并发编程
Pytorch量化感知训练详解
一文带你了解NeurlPS2020的模型剪枝研究
如何阅读一个前向推理框架?以NCNN为例
ONNX学习笔记
ThiNet:模型通道结构化剪枝
基于一阶泰勒展开式的结构化剪枝
ONNX再探
浅谈深度学习模型量化
onnx simplifier和onnx optimizer
onnx2pytorch和onnx-simplifier新版介绍
基于Caffe部署YOLOV5模型
Int 4量化用于目标检测
INT8 量化训练
EagleEye:一种用模型剪枝的快速衡量子网络性能的方法
追求极致:Repvgg重参化对YOLO工业落地的实验和思考_陈TEL
F8Net只有8比特乘法的神经网络量化
EWSG 基于元素级梯度缩放_LoBob
深度学习Int8的部署推理原理和经验验证
Windows上基于TensorRT的YOLOV6部署保姆级教程
CVPR 2023 基于可恢复性度量的少样本剪枝方法
大模型部署框架 FastLLM 简要解析
大模型部署框架 FastLLM 实现细节解析
AiDB一个集合了6大推理框架的AI工具箱加速你的模型部署
nndeploy:一款最新上线的支持多平台、简单易用、高性能的机器学习部署框架
如何使用“LoRa”的方式加载Onnx模型:StableDiffusion相关模型 的C++推理
csapp-第九章-虚拟内存-读书笔记
csapp 第八章 异常控制流 读书笔记
RESOURCES
RESOURCES
专栏介绍
Pytorch YOLOV3(已过时)
Pytorch YOLOV3(已过时)
超详细的Pytorch版yolov3代码中文注释汇总
超详细的Pytorch版yolov3代码中文注释详解(二)
超详细的Pytorch版yolov3代码中文注释详解(三)
超详细的Pytorch版yolov3代码中文注释详解(四)
Faster R-CNN原理及代码讲解电子书(已过时)
Faster R-CNN原理及代码讲解电子书(已过时)
整体框架
概述
Faster R-CNN原理及代码讲解电子书
【资源】Faster R-CNN原理及代码讲解电子书
【资源】CenterNet代码解析
【资源】DeepSORT原理及代码讲解
【资源】PyramidBox代码解析
【资源】从零开始学习YOLOv3
【资源】卷积神经网络中的即插即用模块电子书
【资源】数据增强开源库推荐
【资源】超详细的Pytorch版yolov3代码中文注释汇总
快速学习使用tikz绘制CNN示意图
计算机视觉 书籍数据集标注工具学习路线整理(已过时)
Pytorch_lightning工具推荐
如何标准化管理深度学习实验
如何阅读和学习项目代码
让vscode在远程连接服务器时候如本地般顺滑地debug
如何让vscode远程连接服务器上的docker环境进行debug
我们是如何搭建GiantPandaCV网站的
Linux中Shell编程语法
Docker基础知识分享
CASIA标注工具
Darklabel教程
简易关键点标注软件
ffcv让数据加载不再是瓶颈
ALITA用于自动驾驶的大规模增量数据集
VIDEO
VIDEO
video
History List
History List
History List
Github Resources
Github Resources
Github Resources
PyTorch相关的文章分享
¶
这个专栏记录一些PyTorch以及AI Infra相关的学习笔记。
为正常使用来必力评论功能请激活JavaScript
本文总阅读量
次