当前位置: 首页 > 时讯

【光电智造】YOLO系列的演进，从v1到v7

发布时间：2023-03-24 19:09:33 来源：面包芯语

性能比较

Pascal VOC 2007上的实时系统。YOLO是有记录以来最快的Pascal VOC检测检测器，其准确性仍然是任何其他实时检测器的两倍。

(资料图片)

结构

在结构上，YOLO 模型由以下部分组成：

该网络的第一个版本基于GoogLeNet的架构。卷积层接MaxPool层级联，最后以两个全连接层的级联作为结束。

此外，作者训练了Fast YOLO架构的更快版本，包含更少的卷积层（9而不是24）。两个模型的输入分辨率均为 448x448，但网络主要部分的预训练通过分辨率为 224x224 的分类器训练。

在此结构中，原始图片被划分为 S x S 单元格（在原始 7 x 7 中），每个单元格预测 B 个边界框，这些 bbox 中存在目标的置信度，以及 C 类的概率。每条边的单元格数是奇数，因此图像的中心有一个单元格。这比偶数具有优势，因为照片的中心通常有一个主要目标，在这种情况下，主要的预测是在中心单元格中进行的。在区域数量为偶数的情况下，中心可能位于四个中央区域中的某个位置，这降低了网络的置信水平。

置信度值表示模型对给定 bbox 包含某个目标的置信度，以及 bbox 预测其位置的准确度。事实上，这是IoU存在物体概率的乘积。如果单元格中没有目标，则置信度为零。

每个 bbox 由 5 个数字组成：x、y、w、h 和置信度。（x， y）为单元格内 bbox 中心的坐标，w 和 h为 bbox相对于整个图片尺寸的归一化的宽度和高度，即归一化从 0 到 1 的值。置信度是预测的 bbox 和GT框之间的 IoU。每个单元格还预测目标类的 C 个条件概率。每个单元格仅预测一组类别，而不考虑 bbox的数量。

因此，在一次前向中，预测了 S×S×B个包围框。他们中的大多数框的置信度都很低，但是，通过设置一定的阈值，我们可以去除其中的很大一部分。但最重要的是，（与竞争对手相比）检测率提高了几个数量级。这是非常合乎逻辑的，因为所有类别的所有 bbox 现在只需一次预测。对于不同的实现，原始文章给出了从 45 到 155 的FPS。尽管与以前的算法相比，mAP的准确性仍然有所下降，但在某些问题中，实时检测更为重要。

得到检测框

由于与物体中心相邻的单元格也可以产生bbox，从而导致框过多，因此有必要选择其中最好的。为此，使用NMS技术，其工作原理如下。此类的所有 bbox，置信度低于给定阈值的那些将被丢弃。对于其余部分，执行IoU的成对比较过程。如果两个框的 IoU > 0.5，则丢弃置信度较低的框。否则，两个框都会保留在列表中。因此，类似的框被抑制了。

损失函数是组合的，具有以下形式：

第一项是目标中心坐标的损失，第二项是框尺寸的损失，第三项是目标的类损失，如果目标不存在，则第四项是类的损失，第五项是在框中找到某个目标的概率。

需要 lambda 系数来防止置信度变为零，因为大多数单元格中没有目标。1(obj,i)表示的中心是否出现在单元格 i 中，1(obj,i,j)表示单元格 i 中的第 j 个 bbox 负责此预测。

优势

高速

局限性

YOLOv2 / YOLO9000

作者

Joseph Redmon, Ali Farhadi

主要论文

“YOLO9000: Better, Faster, Stronger”, publication date 2016/12

代码仓库

性能比较

Pascal VOC 2007的检测框架。YOLOv2 比以前的检测方法更快、更准确。它还可以以不同的分辨率运行，以便在速度和准确性之间轻松权衡。每个 YOLOv2 条目实际上是具有相同权重的相同训练模型，只是以不同的大小进行评估。所有计时信息均在 Geforce GTX Titan X 上测试。

结构特点

具有维度先验和位置预测的边界框。我们将框的宽度和高度预测为聚类质心的偏移量。我们使用 sigmoid 函数预测框相对于中心坐标的偏移。

训练分类器后，从网络中删除最后一个卷积层，添加三个具有 1024 个滤波器的 3x3 卷积层和一个具有检测所需输出数量的最终 1x1的卷积层。在 VOC 的情况下，它是 5 个 bbox，每个 bbox 有 5 个坐标，每个 bbox 有 20 个类，总共有 125 个滤波器。

ImageNet vs WordTree上的预测。大多数 ImageNet 模型使用一个大的 softmax 来预测概率分布。使用WordTree，我们对共同下义词执行多个softmax操作。

使用 WordTree 层次结构合并数据集。使用WordNet概念图，我们构建了一个视觉概念的分层树。然后，我们可以通过将数据集中的类映射到树中的合成集来将数据集合并在一起。这是 WordTree 的简化视图，用于说明目的。

优势

YOLOv3

作者

Joseph Redmon, Ali Farhadi

主要论文

“YOLOv3: An Incremental Improvement”, publication date 2018/04

代码仓库

性能比较

YOLOv3 的运行速度明显快于具有相当性能的其他检测方法。从M40或Titan X开始，它们基本上是相同的GPU。

结构

这是模型的增量更新，即没有根本上更改，只有一组改进技巧。

总体结构

不起作用的方法

优势

声明：部分内容来源于网络，仅供读者学习、交流之目的。文章版权归原作者所有。如有不妥，请联系删除。

来源：新机器视觉

----与智者为伍为创新赋能----

联系邮箱：uestcwxd@126.com

QQ：493826566

标签：

自然资源部：狠抓风险隐患排查治理确保安全稳定

2022-08-15

企业

新当家人相继到位白酒行业发展也进入量质并进阶段

财经

争创全国法治政府建设示范市扬州这样做

2022-05-21

全国“100个城市消费者满意度”排名出炉宜昌位居第12位

2022-03-18

【光电智造】YOLO系列的演进，从v1到v7

YOLOv2 / YOLO9000

YOLOv3

【光电智造】YOLO系列的演进，从v1到v7

今日光电 有人说，20世纪是电的世纪，21世纪是光的世纪；知光解电，再小的个体都可以被赋能。欢迎来到今日光电！----与智者为伍为创新

985大学多少分录取600分能上985大学吗_2023参考|热门看点

985大学是我国名牌大学的象征，是很多都梦寐以求的名校。那么考上985最低多少分？985大学录取分数线是多少分？985大

什么是创投公司_快播

1、创投是创业投资的简称。创业投资是指专业投资人员(创业投资家)为以高科技为基础的新创公司提供融资的活动。与一般的投资家不同,创业投资家

世界快资讯：闻库：通感网络是利用移动通信设施感知未来物理世界的重要方案

飞象网讯（魏德龄 文）3月24日，在“2023全球6G技术大会”中的“6G通感算架构及关键技术”论坛上，中国通信标准化协会理事长闻库表示，通感一

ChatGPT概念股集体走高 美图公司上涨10%阅文集团上涨5% 今日精选

ChatGPT概念股集体走高，美图公司（01357）上涨10 23%，报2 91港元；阅文集团（00772）上涨5 20%，报42 45港元；百度集团-SW（0

带君的诗句唯美_带君的诗句

1、带君的诗句有：与君长相知，长命无绝衰。2、山无棱，江水为竭，冬雷震震，夏雨雪，天地合，乃敢与军绝。3、2、知我意，感

黑龙江2023年普通高校专升本考试成绩24日公布

记者从省教育厅获悉，我省2023年普通高校专升本考试成绩于3月24日公布。届时，考生可登陆“黑龙江省招生考试信息港，进入

世界快讯:贵公司与俄罗斯有没有存在较多钢铁业务？沙钢股份：公司目前暂未与俄罗斯有相关业务合作

有投资者在投资者互动平台提问：请问贵公司，与俄罗斯有没有存在较多钢铁业务？沙钢股份(002075 SZ)3月24日在投资者互动平台表示，公司目前暂

和讯个股快报：2023年03月24日 电魂网络 （603258），该股突破长期盘整

股价突破长期盘整：前30日在上下30%的幅度内整理，今日有效突破。资金流向数据：主力资金净流入294 39万元，占总成交额9%，

哥斯拉2怪兽之王票房 环球观点

1、《哥斯拉2怪兽之王》票房成绩大概有9亿美元左右。《哥斯拉2：怪兽之王》是由迈克尔·道赫蒂执导，凯尔·钱德勒、维拉·法梅加、米莉·博比

3月24日生意社硫磺基准价为1170.00元/吨

3月24日，生意社硫磺基准价为1170 00元 吨，与本月初(1116 67元 吨)相比，上涨了4 78%。硫磺年度统计(2022-03-24--2023-

速读：温氏股份获249家机构调研：公司现阶段有能繁母猪超140万头，后备母猪约50-60万头（附调研问答）

温氏股份3月23日发布投资者关系活动记录表，公司于2023年3月21日接受249家机构调研，机构类型为QFII、保险公司、其他、基金公司、海外机构、证

缺钾的症状与危害是什么_缺钾的症状与危害 当前快讯

1、缺钾症状与缺钾程度有关，缺钾越严重危害越大。2、轻度缺钾症状包括全身无力，特别是双下肢无力；有的因为呼吸肌无力，呼吸

第一次没出血怎么回事_第一次没出血为什么呢

1、女性第一次同房没有出血也是正常的。2、主要原因如下：第一，有些女性天生没有处女膜，所以同房时没有处女膜破裂，自然也就

四部门：开展农村能源革命试点县建设

据中国国家能源局网站23日消息，国家能源局、生态环境部、农业农村部、国家乡村振兴局近日决定联合组织开展农村能源革命试点县建设。

天天热消息：观音菩萨生日是哪几天

观音菩萨有三个生日。分别是农历的二月十九，六月十九和九月十九。之所以观音菩萨有3个生日诞辰是因为（农历二月十九），是她为人的生日，这天

【报资讯】C罗晒国家队训练照：面带微笑，认真训练＆与队友轻松互动

北京时间明天凌晨03:45，欧洲杯预选赛J组，葡萄牙将对阵列支敦士登。C罗也在社媒晒出了自己在葡萄牙国家队的照片，其中既包括认真训练的场景，

脖子后面长了个疙瘩怎么治疗_脖子后面长了个疙瘩怎么回事

1、脖子后面有丘疹，取决于丘疹的数量和大小，以及相应的伴随症状，如明显的瘙痒或肿痛。2、如果脖子后面的疙瘩很大，并伴有明

世界热议:鹏辉能源：公司聚阴离子体系的钠离子电池循环次数已达6000次以上

鹏辉能源：公司聚阴离子体系的钠离子电池循环次数已达6000次以上

海南橡胶召开标准胶园建设实施情况验收启动会

海南橡胶召开标准胶园建设实施情况验收启动会 为贯彻落实聚焦主责主业，夯实产业根基，海南橡胶于2022年启动了标准胶园建设，率先制定《海

天天热推荐：东软载波：目前各省网公司陆续开始招标，公司也正在积极参入

同花顺金融研究中心3月23日讯，有投资者向东软载波提问，每年三月和十月都是国网南网集中采购重要时刻，公司双膜技术领域领先地位，采购订单供

勇士客场连胜终于摆脱阴影？被东契奇打爆敲响防守警钟 微动态

北京时间3月23日，西部迎来一场焦点战，去年的西决对手勇士和独行侠在收官阶段只差0 5个胜场，两队都在为直通季后赛煞费苦心，而谁能赢下这场

以色列国土有多少面积有多少人口-热头条

1、以色列国土面积1 49万平方公里。2014年人口已超过813万，其中犹太人611万人。人口不断变化。2、以色列是中东地区唯一一个自由民主制国家。

开封市2023年中招理化生实验操作考试市区考试安排 每日播报

一、开封市市区2023年中招理化生实验操作考试由开封市教育体育局统一组织实施，由开封市教育技术装备管理中心承办。二、市区考试时间为2023年4

期待“村晚”奏响乡村文化大戏序曲

【文化评析】据媒体报道，为全面推进乡村文化振兴，文旅部定于2023年开展“四季村晚”活动，鼓励引导具备条件的乡村在农闲期间开展村民自编自

自然资源部：狠抓风险隐患排查治理 确保安全稳定

新当家人相继到位 白酒行业发展也进入量质并进阶段

争创全国法治政府建设示范市 扬州这样做

全国“100个城市消费者满意度”排名出炉宜昌位居第12位

今日光电有人说，20世纪是电的世纪，21世纪是光的世纪；知光解电，再小的个体都可以被赋能。欢迎来到今日光电！----与智者为伍为创新

飞象网讯（魏德龄文）3月24日，在“2023全球6G技术大会”中的“6G通感算架构及关键技术”论坛上，中国通信标准化协会理事长闻库表示，通感一

ChatGPT概念股集体走高美图公司上涨10%阅文集团上涨5% 今日精选

和讯个股快报：2023年03月24日电魂网络（603258），该股突破长期盘整

哥斯拉2怪兽之王票房环球观点

3月24日，生意社硫磺基准价为1170 00元吨，与本月初(1116 67元吨)相比，上涨了4 78%。硫磺年度统计(2022-03-24--2023-

缺钾的症状与危害是什么_缺钾的症状与危害当前快讯

海南橡胶召开标准胶园建设实施情况验收启动会　　为贯彻落实聚焦主责主业，夯实产业根基，海南橡胶于2022年启动了标准胶园建设，率先制定《海

勇士客场连胜终于摆脱阴影？被东契奇打爆敲响防守警钟微动态

开封市2023年中招理化生实验操作考试市区考试安排每日播报

自然资源部：狠抓风险隐患排查治理确保安全稳定

新当家人相继到位白酒行业发展也进入量质并进阶段

争创全国法治政府建设示范市扬州这样做