当前位置: 首页 > news >正文

(论文阅读11/100)Fast R-CNN

文献阅读笔记

简介

题目

Fast R-CNN

作者

Ross Girshick

原文链接

https://arxiv.org/pdf/1504.08083.pdf

目标检测系列——开山之作RCNN原理详解-CSDN博客

Fast R-CNN讲解_fast rcnn-CSDN博客

Rcnn、FastRcnn、FasterRcnn理论合集_rcnn fastrcnn fasterrcnn_沫念·的博客-CSDN博客

关键词

NUll

研究问题

目标检测任务背景:首先确定大量候选对象位置;其次对候选对象细化以确定目标位置。这些问题的解决往往折中了速度、精度或者简单性。

之前的方法:

RCNN提取2000个候选框冗余工作太多。

SPP算法也有缺点:仅使用log损失函数微调无法更新空间金字塔池化前的卷积层,限制了非常深的网络的准确性。

研究方法

Fast R - CNN:用全连接层分类。

ROI pooling:感兴趣区域池化。使用最大池化将任何有效感兴趣区域内的特征转换为具有固定空间范围H × W (例如, 7 × 7)的小特征映射,其中H和W是独立于任何特定RoI的层超参数。每个RoI由一个四元组特征(r,c,h,w)定义,该(r,c,h,w)指定其左上角(r,c)及其高度和宽度(h,w)。是SSp的特例,其中只有一个金字塔层。

从预训练的网络中初始化:将最后一个最大池化层替换为RoI池化层,通过设置H和W与网络的第一个全连接层(例如,对于VGG16 , H = W = 7)兼容来配置RoI池化层。其次,将网络的最后一个全连接层和softmax (分别训练用于1000 - way ImageNet分类)替换为前面描述的两个兄弟层( K + 1个类别上的全连接层和softmax以及类别特定的边界框回归)。第三,修改网络以获取两个数据输入:图像列表和这些图像中的RoIs列表。

Multi-task loss.

Mini-batch sampling.

研究结论

1.比R - CNN、SPPnet拥有更高的检测质量 2.训练是单阶段的,使用多任务损失3.训练可以更新所有的网络层4.特征缓存不需要磁盘存储

创新不足

候选区域的选择仍然不是很高效

额外知识

RCNN网络

相关文章:

  • Vue自定义组件学习笔记
  • ElasticSearch集群环境搭建
  • 为什么要停止在 SpringBoot 中使用字段注,改用构造器注入
  • 蓝桥杯每日一题2023.11.2
  • 计算机服务器中了locked勒索病毒怎么办,勒索病毒解密,数据恢复
  • 187. 重复的DNA序列-滑动窗口
  • Java使用pdfbox进行pdf和图片之间的转换
  • pix2tex - LaTeX OCR 安装使用记录
  • Rocky9 上安装 redis-dump 和redis-load 命令
  • uinapp微信小程序隐私政策授权
  • httpclient工具类(支持泛型转换)
  • Vue3.0 provide与inject依赖注入:VCA
  • 线程同步——互斥量解锁、解锁
  • Python教程---Python交互界面
  • idea 配置checkstyle全过程
  • [译]CSS 居中(Center)方法大合集
  • 《深入 React 技术栈》
  • 【391天】每日项目总结系列128(2018.03.03)
  • Android系统模拟器绘制实现概述
  • Angular数据绑定机制
  • Docker 笔记(1):介绍、镜像、容器及其基本操作
  • DOM的那些事
  • EventListener原理
  • JS变量作用域
  • js作用域和this的理解
  • node-glob通配符
  • PHP 使用 Swoole - TaskWorker 实现异步操作 Mysql
  • Puppeteer:浏览器控制器
  • 阿里中间件开源组件:Sentinel 0.2.0正式发布
  • 入门到放弃node系列之Hello Word篇
  • 使用 Docker 部署 Spring Boot项目
  • 手机app有了短信验证码还有没必要有图片验证码?
  • 小程序开发之路(一)
  • 云大使推广中的常见热门问题
  • 云栖大讲堂Java基础入门(三)- 阿里巴巴Java开发手册介绍
  • 中文输入法与React文本输入框的问题与解决方案
  • #Lua:Lua调用C++生成的DLL库
  • $var=htmlencode(“‘);alert(‘2“); 的个人理解
  • (33)STM32——485实验笔记
  • (附源码)spring boot校园拼车微信小程序 毕业设计 091617
  • (附源码)ssm考生评分系统 毕业设计 071114
  • (转)菜鸟学数据库(三)——存储过程
  • .NET CF命令行调试器MDbg入门(一)
  • .NET Core 项目指定SDK版本
  • .Net Core缓存组件(MemoryCache)源码解析
  • .Net 知识杂记
  • .Net中ListT 泛型转成DataTable、DataSet
  • ??在JSP中,java和JavaScript如何交互?
  • @angular/cli项目构建--http(2)
  • @JoinTable会自动删除关联表的数据
  • @serverendpoint注解_SpringBoot 使用WebSocket打造在线聊天室(基于注解)
  • @staticmethod和@classmethod的作用与区别
  • [ 环境搭建篇 ] 安装 java 环境并配置环境变量(附 JDK1.8 安装包)
  • [ 云计算 | AWS 实践 ] 基于 Amazon S3 协议搭建个人云存储服务
  • [2015][note]基于薄向列液晶层的可调谐THz fishnet超材料快速开关——