论文名称:Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间:2014年 论文地址: 针对问题: 从Alexnet提出后,作者等人思考如何利用卷积网络来完成检测任务,即输入一张图,实现图上目标的定位(目标在哪)和分类(目标是什么)两个目标,并最终完成了RCNN网络模型。 创新点: RCNN提出时,检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢,作者采用的是Selective Search候选区域提取算法,来获得当前输入图上可能包含目标的不同图像块,再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。 参考博客: 。 论文题目:OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间:2014年 论文地址: 针对问题: 该论文讨论了,CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后,在网络后端组织两组卷积或全连接层,一组用于实现定位,输出当前图像上目标的最小外接矩形框坐标,一组用于分类,输出当前图像上目标的类别信息。也是以此为起点,检测网络出现基础主干网络(backbone)+分类头或回归头(定位头)的网络设计模式雏形。 创新点: 在这篇论文中还有两个比较有意思的点,一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的,而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制,那用1x1卷积来替换FC层,是否可行呢?作者在测试时通过将全连接层替换为1x1卷积核证明是可行的;二是提出了offset max-pooling,也就是对池化层输入特征不能整除的情况,通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练,然后切换分类头为回归头,再训练回归头的参数,最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。 参考博客: 论文题目:Scalable Object Detection using Deep Neural Networks 提出时间:2014年 论文地址: 针对问题: 既然CNN网络提取的特征可以直接用于检测任务(定位+分类),作者就尝试将目标框(可能包含目标的最小外包矩形框)提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。 创新点: 本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心,(800个anchor box)然后学习预测不考虑目标类别的二分类网络,背景or前景。用到了多尺度下的检测。 参考博客: 论文题目:DeepBox: Learning Objectness with Convolutional Networks 提出时间:2015年ICCV 论文地址: 主要针对的问题: 本文完成的工作与第三篇类似,都是对目标框提取算法的优化方案,区别是本文首先采用自底而上的方案来提取图像上的疑似目标框,然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序;而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点: 本文作者想通过CNN学习输入图像的特征,从而实现对输入网络目标框是否为真实目标的情况进行计算,量化每个输入框的包含目标的可能性值。 参考博客: 论文题目:AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间:2015年ICCV 论文地址: 主要针对的问题: 对检测网络的实现方案进行思考,之前的执行策略是,先确定输入图像中可能包含目标位置的矩形框,再对每个矩形框进行分类和回归从而确定目标的准确位置,参考RCNN。那么能否直接利用回归的思路从图像的四个角点,逐渐得到目标的最小外接矩形框和类别呢? 创新点: 通过从图像的四个角点,逐步迭代的方式,每次计算一个缩小的方向,并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。 参考博客: 论文题目:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间:2014年 论文地址: 针对问题: 如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络,在处理过程中就造成了图像块信息的损失。在实际的场景中,输入网络的目标尺寸很难统一,而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点: 作者提出的SPPnet中,通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸,在训练的时候,池化的操作还是通过滑动窗口完成的,池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。 参考博客 : 论文题目:Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间:2015年 论文地址: 针对问题: 既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位,本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点: 作者通过对输入网络的region进行一定的处理(通过数据增强,使得网络利用目标周围的上下文信息得到更精准的目标框)来增加网络对目标回归框的精度。具体的处理方式包括:扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置,使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性,从而提高了回归框的精度。 参考博客 : 论文题目:Fast-RCNN 提出时间:2015年 论文地址: 针对问题: RCNN中的CNN每输入一个图像块就要执行一次前向计算,这显然是非常耗时的,那么如何优化这部分呢? 创新点: 作者参考了SPPNet(第六篇论文),在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸,从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图,再将原图上用Selective Search算法得到的目标框映射到特征图上,避免了特征的重复提取。 参考博客 : 论文题目:DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间:2015年 论文地址: 主要针对的问题: 本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文,作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。 创新点: 作者在不同的激活层上以滑动窗口的方式生成了假设,并表明最终的卷积层可以以较高的查全率找到感兴趣的对象,但是由于特征图的粗糙性,定位性很差。相反,网络的第一层可以更好地定位感兴趣的对象,但召回率降低。 论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间:2015年NIPS 论文地址: 主要针对的问题: 由multibox(第三篇)和DeepBox(第四篇)等论文,我们知道,用CNN可以生成目标待检测框,并判定当前框为目标的概率,那能否将该模型整合到目标检测的模型中,从而实现真正输入端为图像,输出为最终检测结果的,全部依赖CNN完成的检测系统呢? 创新点: 将当前输入图目标框提取整合到了检测网络中,依赖一个小的目标框提取网络RPN来替代Selective Search算法,从而实现真正的端到端检测算法。 参考博客 :
深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理。 目标检测可以理解为是物体识别和物体定位的综合 ,不仅仅要识别出物体属于哪个分类,更重要的是得到物体在图片中的具体位置。 2014年R-CNN算法被提出,基本奠定了two-stage方式在目标检测领域的应用。它的算法结构如下图 算法步骤如下: R-CNN较传统的目标检测算法获得了50%的性能提升,在使用VGG-16模型作为物体识别模型情况下,在voc2007数据集上可以取得66%的准确率,已经算还不错的一个成绩了。其最大的问题是速度很慢,内存占用量很大,主要原因有两个 针对R-CNN的部分问题,2015年微软提出了Fast R-CNN算法,它主要优化了两个问题。 R-CNN和fast R-CNN均存在一个问题,那就是 由选择性搜索来生成候选框,这个算法很慢 。而且R-CNN中生成的2000个左右的候选框全部需要经过一次卷积神经网络,也就是需要经过2000次左右的CNN网络,这个是十分耗时的(fast R-CNN已经做了改进,只需要对整图经过一次CNN网络)。这也是导致这两个算法检测速度较慢的最主要原因。 faster R-CNN 针对这个问题, 提出了RPN网络来进行候选框的获取,从而摆脱了选择性搜索算法,也只需要一次卷积层操作,从而大大提高了识别速度 。这个算法十分复杂,我们会详细分析。它的基本结构如下图 主要分为四个步骤: 使用VGG-16卷积模型的网络结构: 卷积层采用的VGG-16模型,先将PxQ的原始图片,缩放裁剪为MxN的图片,然后经过13个conv-relu层,其中会穿插4个max-pooling层。所有的卷积的kernel都是3x3的,padding为1,stride为1。pooling层kernel为2x2, padding为0,stride为2。 MxN的图片,经过卷积层后,变为了(M/16) x (N/16)的feature map了。 faster R-CNN抛弃了R-CNN中的选择性搜索(selective search)方法,使用RPN层来生成候选框,能极大的提升候选框的生成速度。RPN层先经过3x3的卷积运算,然后分为两路。一路用来判断候选框是前景还是背景,它先reshape成一维向量,然后softmax来判断是前景还是背景,然后reshape恢复为二维feature map。另一路用来确定候选框的位置,通过bounding box regression实现,后面再详细讲。两路计算结束后,挑选出前景候选框(因为物体在前景中),并利用计算得到的候选框位置,得到我们感兴趣的特征子图proposal。 卷积层提取原始图像信息,得到了256个feature map,经过RPN层的3x3卷积后,仍然为256个feature map。但是每个点融合了周围3x3的空间信息。对每个feature map上的一个点,生成k个anchor(k默认为9)。anchor分为前景和背景两类(我们先不去管它具体是飞机还是汽车,只用区分它是前景还是背景即可)。anchor有[x,y,w,h]四个坐标偏移量,x,y表示中心点坐标,w和h表示宽度和高度。这样,对于feature map上的每个点,就得到了k个大小形状各不相同的选区region。 对于生成的anchors,我们首先要判断它是前景还是背景。由于感兴趣的物体位于前景中,故经过这一步之后,我们就可以舍弃背景anchors了。大部分的anchors都是属于背景,故这一步可以筛选掉很多无用的anchor,从而减少全连接层的计算量。 对于经过了3x3的卷积后得到的256个feature map,先经过1x1的卷积,变换为18个feature map。然后reshape为一维向量,经过softmax判断是前景还是背景。此处reshape的唯一作用就是让数据可以进行softmax计算。然后输出识别得到的前景anchors。 另一路用来确定候选框的位置,也就是anchors的[x,y,w,h]坐标值。如下图所示,红色代表我们当前的选区,绿色代表真实的选区。虽然我们当前的选取能够大概框选出飞机,但离绿色的真实位置和形状还是有很大差别,故需要对生成的anchors进行调整。这个过程我们称为bounding box regression。 假设红色框的坐标为[x,y,w,h], 绿色框,也就是目标框的坐标为[Gx, Gy,Gw,Gh], 我们要建立一个变换,使得[x,y,w,h]能够变为[Gx, Gy,Gw,Gh]。最简单的思路是,先做平移,使得中心点接近,然后进行缩放,使得w和h接近。如下:我们要学习的就是dx dy dw dh这四个变换。由于是线性变换,我们可以用线性回归来建模。设定loss和优化方法后,就可以利用深度学习进行训练,并得到模型了。对于空间位置loss,我们一般采用均方差算法,而不是交叉熵(交叉熵使用在分类预测中)。优化方法可以采用自适应梯度下降算法Adam。 得到了前景anchors,并确定了他们的位置和形状后,我们就可以输出前景的特征子图proposal了。步骤如下: 1,得到前景anchors和他们的[x y w h]坐标。 2,按照anchors为前景的不同概率,从大到小排序,选取前pre_nms_topN个anchors,比如前6000个 3,剔除非常小的anchors。 4,通过NMS非极大值抑制,从anchors中找出置信度较高的。这个主要是为了解决选取交叠问题。首先计算每一个选区面积,然后根据他们在softmax中的score(也就是是否为前景的概率)进行排序,将score最大的选区放入队列中。接下来,计算其余选区与当前最大score选区的IOU(IOU为两box交集面积除以两box并集面积,它衡量了两个box之间重叠程度)。去除IOU大于设定阈值的选区。这样就解决了选区重叠问题。 5,选取前post_nms_topN个结果作为最终选区proposal进行输出,比如300个。 经过这一步之后,物体定位应该就基本结束了,剩下的就是物体识别了。 和fast R-CNN中类似,这一层主要解决之前得到的proposal大小形状各不相同,导致没法做全连接。全连接计算只能对确定的shape进行运算,故必须使proposal大小形状变为相同。通过裁剪和缩放的手段,可以解决这个问题,但会带来信息丢失和图片形变问题。我们使用ROI pooling可以有效的解决这个问题。 ROI pooling中,如果目标输出为MxN,则在水平和竖直方向上,将输入proposal划分为MxN份,每一份取最大值,从而得到MxN的输出特征图。 ROI Pooling层后的特征图,通过全连接层与softmax,就可以计算属于哪个具体类别,比如人,狗,飞机,并可以得到cls_prob概率向量。同时再次利用bounding box regression精细调整proposal位置,得到bbox_pred,用于回归更加精确的目标检测框。 这样就完成了faster R-CNN的整个过程了。算法还是相当复杂的,对于每个细节需要反复理解。faster R-CNN使用resNet101模型作为卷积层,在voc2012数据集上可以达到的准确率,超过yolo ssd和yoloV2。其最大的问题是速度偏慢,每秒只能处理5帧,达不到实时性要求。 针对于two-stage目标检测算法普遍存在的运算速度慢的缺点, yolo创造性的提出了one-stage。也就是将物体分类和物体定位在一个步骤中完成。 yolo直接在输出层回归bounding box的位置和bounding box所属类别,从而实现one-stage。通过这种方式, yolo可实现45帧每秒的运算速度,完全能满足实时性要求 (达到24帧每秒,人眼就认为是连续的)。它的网络结构如下图: 主要分为三个部分:卷积层,目标检测层,NMS筛选层。 采用Google inceptionV1网络,对应到上图中的第一个阶段,共20层。这一层主要是进行特征提取,从而提高模型泛化能力。但作者对inceptionV1进行了改造,他没有使用inception module结构,而是用一个1x1的卷积,并联一个3x3的卷积来替代。(可以认为只使用了inception module中的一个分支,应该是为了简化网络结构) 先经过4个卷积层和2个全连接层,最后生成7x7x30的输出。先经过4个卷积层的目的是为了提高模型泛化能力。yolo将一副448x448的原图分割成了7x7个网格,每个网格要预测两个bounding box的坐标(x,y,w,h)和box内包含物体的置信度confidence,以及物体属于20类别中每一类的概率(yolo的训练数据为voc2012,它是一个20分类的数据集)。所以一个网格对应的参数为(4x2+2+20) = 30。如下图 其中前一项表示有无人工标记的物体落入了网格内,如果有则为1,否则为0。第二项代表bounding box和真实标记的box之间的重合度。它等于两个box面积交集,除以面积并集。值越大则box越接近真实位置。 分类信息: yolo的目标训练集为voc2012,它是一个20分类的目标检测数据集 。常用目标检测数据集如下表: | Name | # Images (trainval) | # Classes | Last updated | | --------------- | ------------------- | --------- | ------------ | | ImageNet | 450k | 200 | 2015 | | COCO | 120K | 90 | 2014 | | Pascal VOC | 12k | 20 | 2012 | | Oxford-IIIT Pet | 7K | 37 | 2012 | | KITTI Vision | 7K | 3 | | 每个网格还需要预测它属于20分类中每一个类别的概率。分类信息是针对每个网格的,而不是bounding box。故只需要20个,而不是40个。而confidence则是针对bounding box的,它只表示box内是否有物体,而不需要预测物体是20分类中的哪一个,故只需要2个参数。虽然分类信息和confidence都是概率,但表达含义完全不同。 筛选层是为了在多个结果中(多个bounding box)筛选出最合适的几个,这个方法和faster R-CNN 中基本相同。都是先过滤掉score低于阈值的box,对剩下的box进行NMS非极大值抑制,去除掉重叠度比较高的box(NMS具体算法可以回顾上面faster R-CNN小节)。这样就得到了最终的最合适的几个box和他们的类别。 yolo的损失函数包含三部分,位置误差,confidence误差,分类误差。具体公式如下: 误差均采用了均方差算法,其实我认为,位置误差应该采用均方差算法,而分类误差应该采用交叉熵。由于物体位置只有4个参数,而类别有20个参数,他们的累加和不同。如果赋予相同的权重,显然不合理。故yolo中位置误差权重为5,类别误差权重为1。由于我们不是特别关心不包含物体的bounding box,故赋予不包含物体的box的置信度confidence误差的权重为,包含物体的权重则为1。 Faster R-CNN准确率mAP较高,漏检率recall较低,但速度较慢。而yolo则相反,速度快,但准确率和漏检率不尽人意。SSD综合了他们的优缺点,对输入300x300的图像,在voc2007数据集上test,能够达到58 帧每秒( Titan X 的 GPU ),的mAP。 SSD网络结构如下图: 和yolo一样,也分为三部分:卷积层,目标检测层和NMS筛选层 SSD论文采用了VGG16的基础网络,其实这也是几乎所有目标检测神经网络的惯用方法。先用一个CNN网络来提取特征,然后再进行后续的目标定位和目标分类识别。 这一层由5个卷积层和一个平均池化层组成。去掉了最后的全连接层。SSD认为目标检测中的物体,只与周围信息相关,它的感受野不是全局的,故没必要也不应该做全连接。SSD的特点如下。 每一个卷积层,都会输出不同大小感受野的feature map。在这些不同尺度的feature map上,进行目标位置和类别的训练和预测,从而达到 多尺度检测 的目的,可以克服yolo对于宽高比不常见的物体,识别准确率较低的问题。而yolo中,只在最后一个卷积层上做目标位置和类别的训练和预测。这是SSD相对于yolo能提高准确率的一个关键所在。 如上所示,在每个卷积层上都会进行目标检测和分类,最后由NMS进行筛选,输出最终的结果。多尺度feature map上做目标检测,就相当于多了很多宽高比例的bounding box,可以大大提高泛化能力。 和faster R-CNN相似,SSD也提出了anchor的概念。卷积输出的feature map,每个点对应为原图的一个区域的中心点。以这个点为中心,构造出6个宽高比例不同,大小不同的anchor(SSD中称为default box)。每个anchor对应4个位置参数(x,y,w,h)和21个类别概率(voc训练集为20分类问题,在加上anchor是否为背景,共21分类)。如下图所示: 另外,在训练阶段,SSD将正负样本比例定位1:3。训练集给定了输入图像以及每个物体的真实区域(ground true box),将default box和真实box最接近的选为正样本。然后在剩下的default box中选择任意一个与真实box IOU大于的,作为正样本。而其他的则作为负样本。由于绝大部分的box为负样本,会导致正负失衡,故根据每个box类别概率排序,使正负比例保持在1:3。SSD认为这个策略提高了4%的准确率 另外,SSD采用了数据增强。生成与目标物体真实box间IOU为 的patch,随机选取这些patch参与训练,并对他们进行随机水平翻转等操作。SSD认为这个策略提高了的准确率。 和yolo的筛选层基本一致,同样先过滤掉类别概率低于阈值的default box,再采用NMS非极大值抑制,筛掉重叠度较高的。只不过SSD综合了各个不同feature map上的目标检测输出的default box。 SSD基本已经可以满足我们手机端上实时物体检测需求了,TensorFlow在Android上的目标检测官方模型,就是通过SSD算法实现的。它的基础卷积网络采用的是mobileNet,适合在终端上部署和运行。 针对yolo准确率不高,容易漏检,对长宽比不常见物体效果差等问题,结合SSD的特点,提出了yoloV2。它主要还是采用了yolo的网络结构,在其基础上做了一些优化和改进,如下 网络采用DarkNet-19:19层,里面包含了大量3x3卷积,同时借鉴inceptionV1,加入1x1卷积核全局平均池化层。结构如下 yolo和yoloV2只能识别20类物体,为了优化这个问题,提出了yolo9000,可以识别9000类物体。它在yoloV2基础上,进行了imageNet和coco的联合训练。这种方式充分利用imageNet可以识别1000类物体和coco可以进行目标位置检测的优点。当使用imageNet训练时,只更新物体分类相关的参数。而使用coco时,则更新全部所有参数。 YOLOv3可以说出来直接吊打一切图像检测算法。比同期的DSSD(反卷积SSD), FPN(feature pyramid networks)准确率更高或相仿,速度是其1/3.。 YOLOv3的改动主要有如下几点:不过如果要求更精准的预测边框,采用COCO AP做评估标准的话,YOLO3在精确率上的表现就弱了一些。如下图所示。 当前目标检测模型算法也是层出不穷。在two-stage领域, 2017年Facebook提出了mask R-CNN 。CMU也提出了A-Fast-RCNN 算法,将对抗学习引入到目标检测领域。Face++也提出了Light-Head R-CNN,主要探讨了 R-CNN 如何在物体检测中平衡精确度和速度。 one-stage领域也是百花齐放,2017年首尔大学提出 R-SSD 算法,主要解决小尺寸物体检测效果差的问题。清华大学提出了 RON 算法,结合 two stage 名的方法和 one stage 方法的优势,更加关注多尺度对象定位和负空间样本挖掘问题。 目标检测领域的深度学习算法,需要进行目标定位和物体识别,算法相对来说还是很复杂的。当前各种新算法也是层不出穷,但模型之间有很强的延续性,大部分模型算法都是借鉴了前人的思想,站在巨人的肩膀上。我们需要知道经典模型的特点,这些tricks是为了解决什么问题,以及为什么解决了这些问题。这样才能举一反三,万变不离其宗。综合下来,目标检测领域主要的难点如下: 一文读懂目标检测AI算法:R-CNN,faster R-CNN,yolo,SSD,yoloV2 从YOLOv1到v3的进化之路 SSD-Tensorflow超详细解析【一】:加载模型对图片进行测试 YOLO C#项目参考: 项目实践贴个图。
论文名称:Rich feature hierarchies for accurate object detection and semantic segmentation 提出时间:2014年 论文地址: 针对问题: 从Alexnet提出后,作者等人思考如何利用卷积网络来完成检测任务,即输入一张图,实现图上目标的定位(目标在哪)和分类(目标是什么)两个目标,并最终完成了RCNN网络模型。 创新点: RCNN提出时,检测网络的执行思路还是脱胎于分类网络。也就是深度学习部分仅完成输入图像块的分类工作。那么对检测任务来说如何完成目标的定位呢,作者采用的是Selective Search候选区域提取算法,来获得当前输入图上可能包含目标的不同图像块,再将图像块裁剪到固定的尺寸输入CNN网络来进行当前图像块类别的判断。 参考博客: 。 论文题目:OverFeat: Integrated Recognition, Localization and Detection using Convolutional Networks 提出时间:2014年 论文地址: 针对问题: 该论文讨论了,CNN提取到的特征能够同时用于定位和分类两个任务。也就是在CNN提取到特征以后,在网络后端组织两组卷积或全连接层,一组用于实现定位,输出当前图像上目标的最小外接矩形框坐标,一组用于分类,输出当前图像上目标的类别信息。也是以此为起点,检测网络出现基础主干网络(backbone)+分类头或回归头(定位头)的网络设计模式雏形。 创新点: 在这篇论文中还有两个比较有意思的点,一是作者认为全连接层其实质实现的操作和1x1的卷积是类似的,而且用1x1的卷积核还可以避免FC对输入特征尺寸的限制,那用1x1卷积来替换FC层,是否可行呢?作者在测试时通过将全连接层替换为1x1卷积核证明是可行的;二是提出了offset max-pooling,也就是对池化层输入特征不能整除的情况,通过进行滑动池化并将不同的池化层传递给后续网络层来提高效果。另外作者在论文里提到他的用法是先基于主干网络+分类头训练,然后切换分类头为回归头,再训练回归头的参数,最终完成整个网络的训练。图像的输入作者采用的是直接在输入图上利用卷积核划窗。然后在指定的每个网络层上回归目标的尺度和空间位置。 参考博客: 论文题目:Scalable Object Detection using Deep Neural Networks 提出时间:2014年 论文地址: 针对问题: 既然CNN网络提取的特征可以直接用于检测任务(定位+分类),作者就尝试将目标框(可能包含目标的最小外包矩形框)提取任务放到CNN中进行。也就是直接通过网络完成输入图像上目标的定位工作。 创新点: 本文作者通过将物体检测问题定义为输出多个bounding box的回归问题. 同时每个bounding box会输出关于是否包含目标物体的置信度, 使得模型更加紧凑和高效。先通过聚类获得图像中可能有目标的位置聚类中心,(800个anchor box)然后学习预测不考虑目标类别的二分类网络,背景or前景。用到了多尺度下的检测。 参考博客: 论文题目:DeepBox: Learning Objectness with Convolutional Networks 提出时间:2015年ICCV 论文地址: 主要针对的问题: 本文完成的工作与第三篇类似,都是对目标框提取算法的优化方案,区别是本文首先采用自底而上的方案来提取图像上的疑似目标框,然后再利用CNN网络提取特征对目标框进行是否为前景区域的排序;而第三篇为直接利用CNN网络来回归图像上可能的目标位置。创新点: 本文作者想通过CNN学习输入图像的特征,从而实现对输入网络目标框是否为真实目标的情况进行计算,量化每个输入框的包含目标的可能性值。 参考博客: 论文题目:AttentionNet: AggregatingWeak Directions for Accurate Object Detection 提出时间:2015年ICCV 论文地址: 主要针对的问题: 对检测网络的实现方案进行思考,之前的执行策略是,先确定输入图像中可能包含目标位置的矩形框,再对每个矩形框进行分类和回归从而确定目标的准确位置,参考RCNN。那么能否直接利用回归的思路从图像的四个角点,逐渐得到目标的最小外接矩形框和类别呢? 创新点: 通过从图像的四个角点,逐步迭代的方式,每次计算一个缩小的方向,并缩小指定的距离来使得逐渐逼近目标。作者还提出了针对多目标情况的处理方式。 参考博客: 论文题目:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition 提出时间:2014年 论文地址: 针对问题: 如RCNN会将输入的目标图像块处理到同一尺寸再输入进CNN网络,在处理过程中就造成了图像块信息的损失。在实际的场景中,输入网络的目标尺寸很难统一,而网络最后的全连接层又要求输入的特征信息为统一维度的向量。作者就尝试进行不同尺寸CNN网络提取到的特征维度进行统一。创新点: 作者提出的SPPnet中,通过使用特征金字塔池化来使得最后的卷积层输出结果可以统一到全连接层需要的尺寸,在训练的时候,池化的操作还是通过滑动窗口完成的,池化的核宽高及步长通过当前层的特征图的宽高计算得到。原论文中的特征金字塔池化操作图示如下。 参考博客 : 论文题目:Object detection via a multi-region & semantic segmentation-aware CNN model 提出时间:2015年 论文地址: 针对问题: 既然第三篇论文multibox算法提出了可以用CNN来实现输入图像中待检测目标的定位,本文作者就尝试增加一些训练时的方法技巧来提高CNN网络最终的定位精度。创新点: 作者通过对输入网络的region进行一定的处理(通过数据增强,使得网络利用目标周围的上下文信息得到更精准的目标框)来增加网络对目标回归框的精度。具体的处理方式包括:扩大输入目标的标签包围框、取输入目标的标签中包围框的一部分等并对不同区域分别回归位置,使得网络对目标的边界更加敏感。这种操作丰富了输入目标的多样性,从而提高了回归框的精度。 参考博客 : 论文题目:Fast-RCNN 提出时间:2015年 论文地址: 针对问题: RCNN中的CNN每输入一个图像块就要执行一次前向计算,这显然是非常耗时的,那么如何优化这部分呢? 创新点: 作者参考了SPPNet(第六篇论文),在网络中实现了ROIpooling来使得输入的图像块不用裁剪到统一尺寸,从而避免了输入的信息丢失。其次是将整张图输入网络得到特征图,再将原图上用Selective Search算法得到的目标框映射到特征图上,避免了特征的重复提取。 参考博客 : 论文题目:DeepProposal: Hunting Objects by Cascading Deep Convolutional Layers 提出时间:2015年 论文地址: 主要针对的问题: 本文的作者观察到CNN可以提取到很棒的对输入图像进行表征的论文,作者尝试通过实验来对CNN网络不同层所产生的特征的作用和情况进行讨论和解析。 创新点: 作者在不同的激活层上以滑动窗口的方式生成了假设,并表明最终的卷积层可以以较高的查全率找到感兴趣的对象,但是由于特征图的粗糙性,定位性很差。相反,网络的第一层可以更好地定位感兴趣的对象,但召回率降低。 论文题目:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 提出时间:2015年NIPS 论文地址: 主要针对的问题: 由multibox(第三篇)和DeepBox(第四篇)等论文,我们知道,用CNN可以生成目标待检测框,并判定当前框为目标的概率,那能否将该模型整合到目标检测的模型中,从而实现真正输入端为图像,输出为最终检测结果的,全部依赖CNN完成的检测系统呢? 创新点: 将当前输入图目标框提取整合到了检测网络中,依赖一个小的目标框提取网络RPN来替代Selective Search算法,从而实现真正的端到端检测算法。 参考博客 :
深度学习目前已经应用到了各个领域,应用场景大体分为三类:物体识别,目标检测,自然语言处理。 目标检测可以理解为是物体识别和物体定位的综合 ,不仅仅要识别出物体属于哪个分类,更重要的是得到物体在图片中的具体位置。 2014年R-CNN算法被提出,基本奠定了two-stage方式在目标检测领域的应用。它的算法结构如下图 算法步骤如下: R-CNN较传统的目标检测算法获得了50%的性能提升,在使用VGG-16模型作为物体识别模型情况下,在voc2007数据集上可以取得66%的准确率,已经算还不错的一个成绩了。其最大的问题是速度很慢,内存占用量很大,主要原因有两个 针对R-CNN的部分问题,2015年微软提出了Fast R-CNN算法,它主要优化了两个问题。 R-CNN和fast R-CNN均存在一个问题,那就是 由选择性搜索来生成候选框,这个算法很慢 。而且R-CNN中生成的2000个左右的候选框全部需要经过一次卷积神经网络,也就是需要经过2000次左右的CNN网络,这个是十分耗时的(fast R-CNN已经做了改进,只需要对整图经过一次CNN网络)。这也是导致这两个算法检测速度较慢的最主要原因。 faster R-CNN 针对这个问题, 提出了RPN网络来进行候选框的获取,从而摆脱了选择性搜索算法,也只需要一次卷积层操作,从而大大提高了识别速度 。这个算法十分复杂,我们会详细分析。它的基本结构如下图 主要分为四个步骤: 使用VGG-16卷积模型的网络结构: 卷积层采用的VGG-16模型,先将PxQ的原始图片,缩放裁剪为MxN的图片,然后经过13个conv-relu层,其中会穿插4个max-pooling层。所有的卷积的kernel都是3x3的,padding为1,stride为1。pooling层kernel为2x2, padding为0,stride为2。 MxN的图片,经过卷积层后,变为了(M/16) x (N/16)的feature map了。 faster R-CNN抛弃了R-CNN中的选择性搜索(selective search)方法,使用RPN层来生成候选框,能极大的提升候选框的生成速度。RPN层先经过3x3的卷积运算,然后分为两路。一路用来判断候选框是前景还是背景,它先reshape成一维向量,然后softmax来判断是前景还是背景,然后reshape恢复为二维feature map。另一路用来确定候选框的位置,通过bounding box regression实现,后面再详细讲。两路计算结束后,挑选出前景候选框(因为物体在前景中),并利用计算得到的候选框位置,得到我们感兴趣的特征子图proposal。 卷积层提取原始图像信息,得到了256个feature map,经过RPN层的3x3卷积后,仍然为256个feature map。但是每个点融合了周围3x3的空间信息。对每个feature map上的一个点,生成k个anchor(k默认为9)。anchor分为前景和背景两类(我们先不去管它具体是飞机还是汽车,只用区分它是前景还是背景即可)。anchor有[x,y,w,h]四个坐标偏移量,x,y表示中心点坐标,w和h表示宽度和高度。这样,对于feature map上的每个点,就得到了k个大小形状各不相同的选区region。 对于生成的anchors,我们首先要判断它是前景还是背景。由于感兴趣的物体位于前景中,故经过这一步之后,我们就可以舍弃背景anchors了。大部分的anchors都是属于背景,故这一步可以筛选掉很多无用的anchor,从而减少全连接层的计算量。 对于经过了3x3的卷积后得到的256个feature map,先经过1x1的卷积,变换为18个feature map。然后reshape为一维向量,经过softmax判断是前景还是背景。此处reshape的唯一作用就是让数据可以进行softmax计算。然后输出识别得到的前景anchors。 另一路用来确定候选框的位置,也就是anchors的[x,y,w,h]坐标值。如下图所示,红色代表我们当前的选区,绿色代表真实的选区。虽然我们当前的选取能够大概框选出飞机,但离绿色的真实位置和形状还是有很大差别,故需要对生成的anchors进行调整。这个过程我们称为bounding box regression。 假设红色框的坐标为[x,y,w,h], 绿色框,也就是目标框的坐标为[Gx, Gy,Gw,Gh], 我们要建立一个变换,使得[x,y,w,h]能够变为[Gx, Gy,Gw,Gh]。最简单的思路是,先做平移,使得中心点接近,然后进行缩放,使得w和h接近。如下:我们要学习的就是dx dy dw dh这四个变换。由于是线性变换,我们可以用线性回归来建模。设定loss和优化方法后,就可以利用深度学习进行训练,并得到模型了。对于空间位置loss,我们一般采用均方差算法,而不是交叉熵(交叉熵使用在分类预测中)。优化方法可以采用自适应梯度下降算法Adam。 得到了前景anchors,并确定了他们的位置和形状后,我们就可以输出前景的特征子图proposal了。步骤如下: 1,得到前景anchors和他们的[x y w h]坐标。 2,按照anchors为前景的不同概率,从大到小排序,选取前pre_nms_topN个anchors,比如前6000个 3,剔除非常小的anchors。 4,通过NMS非极大值抑制,从anchors中找出置信度较高的。这个主要是为了解决选取交叠问题。首先计算每一个选区面积,然后根据他们在softmax中的score(也就是是否为前景的概率)进行排序,将score最大的选区放入队列中。接下来,计算其余选区与当前最大score选区的IOU(IOU为两box交集面积除以两box并集面积,它衡量了两个box之间重叠程度)。去除IOU大于设定阈值的选区。这样就解决了选区重叠问题。 5,选取前post_nms_topN个结果作为最终选区proposal进行输出,比如300个。 经过这一步之后,物体定位应该就基本结束了,剩下的就是物体识别了。 和fast R-CNN中类似,这一层主要解决之前得到的proposal大小形状各不相同,导致没法做全连接。全连接计算只能对确定的shape进行运算,故必须使proposal大小形状变为相同。通过裁剪和缩放的手段,可以解决这个问题,但会带来信息丢失和图片形变问题。我们使用ROI pooling可以有效的解决这个问题。 ROI pooling中,如果目标输出为MxN,则在水平和竖直方向上,将输入proposal划分为MxN份,每一份取最大值,从而得到MxN的输出特征图。 ROI Pooling层后的特征图,通过全连接层与softmax,就可以计算属于哪个具体类别,比如人,狗,飞机,并可以得到cls_prob概率向量。同时再次利用bounding box regression精细调整proposal位置,得到bbox_pred,用于回归更加精确的目标检测框。 这样就完成了faster R-CNN的整个过程了。算法还是相当复杂的,对于每个细节需要反复理解。faster R-CNN使用resNet101模型作为卷积层,在voc2012数据集上可以达到的准确率,超过yolo ssd和yoloV2。其最大的问题是速度偏慢,每秒只能处理5帧,达不到实时性要求。 针对于two-stage目标检测算法普遍存在的运算速度慢的缺点, yolo创造性的提出了one-stage。也就是将物体分类和物体定位在一个步骤中完成。 yolo直接在输出层回归bounding box的位置和bounding box所属类别,从而实现one-stage。通过这种方式, yolo可实现45帧每秒的运算速度,完全能满足实时性要求 (达到24帧每秒,人眼就认为是连续的)。它的网络结构如下图: 主要分为三个部分:卷积层,目标检测层,NMS筛选层。 采用Google inceptionV1网络,对应到上图中的第一个阶段,共20层。这一层主要是进行特征提取,从而提高模型泛化能力。但作者对inceptionV1进行了改造,他没有使用inception module结构,而是用一个1x1的卷积,并联一个3x3的卷积来替代。(可以认为只使用了inception module中的一个分支,应该是为了简化网络结构) 先经过4个卷积层和2个全连接层,最后生成7x7x30的输出。先经过4个卷积层的目的是为了提高模型泛化能力。yolo将一副448x448的原图分割成了7x7个网格,每个网格要预测两个bounding box的坐标(x,y,w,h)和box内包含物体的置信度confidence,以及物体属于20类别中每一类的概率(yolo的训练数据为voc2012,它是一个20分类的数据集)。所以一个网格对应的参数为(4x2+2+20) = 30。如下图 其中前一项表示有无人工标记的物体落入了网格内,如果有则为1,否则为0。第二项代表bounding box和真实标记的box之间的重合度。它等于两个box面积交集,除以面积并集。值越大则box越接近真实位置。 分类信息: yolo的目标训练集为voc2012,它是一个20分类的目标检测数据集 。常用目标检测数据集如下表: | Name | # Images (trainval) | # Classes | Last updated | | --------------- | ------------------- | --------- | ------------ | | ImageNet | 450k | 200 | 2015 | | COCO | 120K | 90 | 2014 | | Pascal VOC | 12k | 20 | 2012 | | Oxford-IIIT Pet | 7K | 37 | 2012 | | KITTI Vision | 7K | 3 | | 每个网格还需要预测它属于20分类中每一个类别的概率。分类信息是针对每个网格的,而不是bounding box。故只需要20个,而不是40个。而confidence则是针对bounding box的,它只表示box内是否有物体,而不需要预测物体是20分类中的哪一个,故只需要2个参数。虽然分类信息和confidence都是概率,但表达含义完全不同。 筛选层是为了在多个结果中(多个bounding box)筛选出最合适的几个,这个方法和faster R-CNN 中基本相同。都是先过滤掉score低于阈值的box,对剩下的box进行NMS非极大值抑制,去除掉重叠度比较高的box(NMS具体算法可以回顾上面faster R-CNN小节)。这样就得到了最终的最合适的几个box和他们的类别。 yolo的损失函数包含三部分,位置误差,confidence误差,分类误差。具体公式如下: 误差均采用了均方差算法,其实我认为,位置误差应该采用均方差算法,而分类误差应该采用交叉熵。由于物体位置只有4个参数,而类别有20个参数,他们的累加和不同。如果赋予相同的权重,显然不合理。故yolo中位置误差权重为5,类别误差权重为1。由于我们不是特别关心不包含物体的bounding box,故赋予不包含物体的box的置信度confidence误差的权重为,包含物体的权重则为1。 Faster R-CNN准确率mAP较高,漏检率recall较低,但速度较慢。而yolo则相反,速度快,但准确率和漏检率不尽人意。SSD综合了他们的优缺点,对输入300x300的图像,在voc2007数据集上test,能够达到58 帧每秒( Titan X 的 GPU ),的mAP。 SSD网络结构如下图: 和yolo一样,也分为三部分:卷积层,目标检测层和NMS筛选层 SSD论文采用了VGG16的基础网络,其实这也是几乎所有目标检测神经网络的惯用方法。先用一个CNN网络来提取特征,然后再进行后续的目标定位和目标分类识别。 这一层由5个卷积层和一个平均池化层组成。去掉了最后的全连接层。SSD认为目标检测中的物体,只与周围信息相关,它的感受野不是全局的,故没必要也不应该做全连接。SSD的特点如下。 每一个卷积层,都会输出不同大小感受野的feature map。在这些不同尺度的feature map上,进行目标位置和类别的训练和预测,从而达到 多尺度检测 的目的,可以克服yolo对于宽高比不常见的物体,识别准确率较低的问题。而yolo中,只在最后一个卷积层上做目标位置和类别的训练和预测。这是SSD相对于yolo能提高准确率的一个关键所在。 如上所示,在每个卷积层上都会进行目标检测和分类,最后由NMS进行筛选,输出最终的结果。多尺度feature map上做目标检测,就相当于多了很多宽高比例的bounding box,可以大大提高泛化能力。 和faster R-CNN相似,SSD也提出了anchor的概念。卷积输出的feature map,每个点对应为原图的一个区域的中心点。以这个点为中心,构造出6个宽高比例不同,大小不同的anchor(SSD中称为default box)。每个anchor对应4个位置参数(x,y,w,h)和21个类别概率(voc训练集为20分类问题,在加上anchor是否为背景,共21分类)。如下图所示: 另外,在训练阶段,SSD将正负样本比例定位1:3。训练集给定了输入图像以及每个物体的真实区域(ground true box),将default box和真实box最接近的选为正样本。然后在剩下的default box中选择任意一个与真实box IOU大于的,作为正样本。而其他的则作为负样本。由于绝大部分的box为负样本,会导致正负失衡,故根据每个box类别概率排序,使正负比例保持在1:3。SSD认为这个策略提高了4%的准确率 另外,SSD采用了数据增强。生成与目标物体真实box间IOU为 的patch,随机选取这些patch参与训练,并对他们进行随机水平翻转等操作。SSD认为这个策略提高了的准确率。 和yolo的筛选层基本一致,同样先过滤掉类别概率低于阈值的default box,再采用NMS非极大值抑制,筛掉重叠度较高的。只不过SSD综合了各个不同feature map上的目标检测输出的default box。 SSD基本已经可以满足我们手机端上实时物体检测需求了,TensorFlow在Android上的目标检测官方模型,就是通过SSD算法实现的。它的基础卷积网络采用的是mobileNet,适合在终端上部署和运行。 针对yolo准确率不高,容易漏检,对长宽比不常见物体效果差等问题,结合SSD的特点,提出了yoloV2。它主要还是采用了yolo的网络结构,在其基础上做了一些优化和改进,如下 网络采用DarkNet-19:19层,里面包含了大量3x3卷积,同时借鉴inceptionV1,加入1x1卷积核全局平均池化层。结构如下 yolo和yoloV2只能识别20类物体,为了优化这个问题,提出了yolo9000,可以识别9000类物体。它在yoloV2基础上,进行了imageNet和coco的联合训练。这种方式充分利用imageNet可以识别1000类物体和coco可以进行目标位置检测的优点。当使用imageNet训练时,只更新物体分类相关的参数。而使用coco时,则更新全部所有参数。 YOLOv3可以说出来直接吊打一切图像检测算法。比同期的DSSD(反卷积SSD), FPN(feature pyramid networks)准确率更高或相仿,速度是其1/3.。 YOLOv3的改动主要有如下几点:不过如果要求更精准的预测边框,采用COCO AP做评估标准的话,YOLO3在精确率上的表现就弱了一些。如下图所示。 当前目标检测模型算法也是层出不穷。在two-stage领域, 2017年Facebook提出了mask R-CNN 。CMU也提出了A-Fast-RCNN 算法,将对抗学习引入到目标检测领域。Face++也提出了Light-Head R-CNN,主要探讨了 R-CNN 如何在物体检测中平衡精确度和速度。 one-stage领域也是百花齐放,2017年首尔大学提出 R-SSD 算法,主要解决小尺寸物体检测效果差的问题。清华大学提出了 RON 算法,结合 two stage 名的方法和 one stage 方法的优势,更加关注多尺度对象定位和负空间样本挖掘问题。 目标检测领域的深度学习算法,需要进行目标定位和物体识别,算法相对来说还是很复杂的。当前各种新算法也是层不出穷,但模型之间有很强的延续性,大部分模型算法都是借鉴了前人的思想,站在巨人的肩膀上。我们需要知道经典模型的特点,这些tricks是为了解决什么问题,以及为什么解决了这些问题。这样才能举一反三,万变不离其宗。综合下来,目标检测领域主要的难点如下: 一文读懂目标检测AI算法:R-CNN,faster R-CNN,yolo,SSD,yoloV2 从YOLOv1到v3的进化之路 SSD-Tensorflow超详细解析【一】:加载模型对图片进行测试 YOLO C#项目参考: 项目实践贴个图。
电力系统自动化是一项综合性质的技术,包含内容广泛,并且随着时代的发展,经济水平的提高,生活质量的提升,对于电力的需求和利用也就越来越大。下文是我为大家搜集整理的关于电力系统自动化毕业论文范文的内容,欢迎大家阅读参考! 电力系统自动化毕业论文范文篇1 试析电力系统调度自动化 【摘 要】阐述了我国电网的现状、电力系统调度运营所包含的内容、所要实现的目标以及电力系统自动化的组成和目前所存在问题的解决方案,并对电力系统调度自动化的未来进行了展望。 【关键词】电力系统;调度自动化;信息 一、传统配电网实现电力系统自动化研究现状分析 电力系统的自动化发展主要是在配电网的上加强其自动化,因此为了提高其供点质量以及供电的可靠性,在进行电力系统自动化分析的时候,主要从配电网上实现其自动化,使得整个电力系统的发展符合当前的科技要求。目前配电网在实现自动化下,通常在10kv辐射线或者是树状的线路进行重合器以及分段器的方式来构成配电网,由于这种方式在现实自动化的过程中,不需要在配置通道上与主站的系统组成上,需要依靠重合器以及分段器本身的功能来实现电力的隔离和恢复功能,从而到电力系统的自动化,此种方法不仅具备相应容易实施的特点,而且还有节省投资的优点。同时还有其他实现电力系统自动化的接线方式,对于这些配电网的接线方式以及整个系统的构成,都具有一定的缺陷性,因此随着科学技术的提高,目前计算机网络技术正在快速的发展,使得在实现电力系统自动化发展的阶段可以对其进行改进,期改进的状态也在不断的发生着变化。 二、电力系统调度与运营包含的内容和要实现的目标 (一)电力系统调度的任务。 电力系统的调度就是对电力系统中所有的设备及其运行状态进行监控和调节,是一个指挥者。目前电力调度涵盖的范围较大,有自动化系统、继电保护等等。电力系统调度的任务主要是:尽设备最大能力满足负荷需要,使整个电网安全可靠连续供电,保证电能质量,经济合理利用能源,保证发电、供电、用电各方合法利益。 (二)调度自动化的必要。 电力系统是一个庞大而且复杂的系统,有几十个到几百个发电厂、变电所和成千上万个电力用户,通过多种电压等级的电力线路,互相连接成网进行生产运行。电能的生产输送过程是瞬间完成的,而且要满足发电量和用户用电量的平衡。现在电力系统的发展趋势是电网日益庞大,运行操作日益复杂,所以当电网发生故障后其影响也越来越大。另一方面,用户对供电可靠性和供电质量的要求日趋严格,这就对电力系统运行调度人员和电力系统调度的自动化水平提出了更高的要求。电网调度自动化具有较大的经济效益,可以提高电网的安全运行水平。当发生事故时调度员能及时掌握情况,迅速进行处置,防止事故扩大,减少停电损失。地调采用自动化调度系统能减少停电率。当装备有直接监护用户的自动装置以后,可压低尖峰负荷。若采用分时和交换电价自动计量等经济办法管理电网,经济效益更大。因此,电网调度自动化是一项促进电力生产技术进步和有显著经济效益的重要工作,是电力系统不可缺少的组成部分。 (三)电网调度自动化的组成部分及其功能。 电网调度自动化系统,其基本结构包括控制中心主站系统、厂站端(RTU)和信息通道三大部分。根据功能的不同,可以将此系统划分为信息采集和执行子系统、信息传输子系统、信息处理子系统和人机联系子系统。信息采集和执行子系统的基本功能是在各发电厂、变电所采集各种表征电力系统运行状态的实时信息,此外还负责接收和执行上级调度控制中心发出的操作、调度或控制命令。信息传输子系统为信息采集和执行子系统与调度控制中心提供了信息交换的桥梁,其核心是数据通道,它经调制解调器与RTU及主站前置机相连。信息处理子系统是整个调度自动化系统的核心,以计算机为主要组成部分。该子系统包含大量直接面向电网调度、运行人员的计算机应用软件,完成从采集到信息的各种处理及分析计算,乃至实现对电力设备的自动控制与操作。人机联系子系统将传输到调度控制中心的各类信息进行加工处理,通过各种显示设备、打印设备和其他输出设备,为调度人员提供完整实用的电力系统实时信息。调度人员发出的遥控、遥调指令也通过此系统输入,传送给执行机构。 我国调度自动化水平与世界上先进的国家相比,还有一些差距。尽管在近几年新投入运行的变电所采取了比较新的技术,但是总体而言,电网调度系统还存在一些需要解决问题。例如:系统计算机CPU负载率问题,即便是目前计算机容量和运算速度成倍或成几十倍提高的情况下,其负载率仍很高;CDT和Polling远动规约的选用问题,CDT和Polling两类规约在我国得到了广泛应用,并且这两类规约远动装置并存使用的现状将持续下去,选用哪一类规约的远动装置,原则上应视通道的质量与数量及本电网的调度自动化系统现状来决定,不宜盲目追求采用Polling远动;系统的开放性问题,系统应该是开放的,能够支持不同的硬件平台,支持平台采用国际标准开发,所有功能模块之间的接口标准应统一,支持能过户应用软件程序开发,保证能和其他系统互联和集成一体或者方便实现与其他系统间的接口,系统应能提供开放式环境。此外,现在的电力系统由于还依赖高压机械开关(油断路器、六氟化硫断路器、真空开关等)实现线路、设备、负荷的投切,尚不能做到完全可控。这是因为机械的慢过程不可能控制电的快过程引起的。“电网控制”目前只能做到部分控制,本质上仍然是一个调度员的决策支持系统。如果电力系统的高压机械开关一旦被大功率的电子开关取代,则电力系统真正的灵活调节控制便将成为现实 三、电力系统调度自动化存在问题的解决方法 (一)管理方面 统一思想,加强调度管理,提高认识。必须杜绝人为的一切误调度、误操作事故以及不服从调度指令擅自投停运设备。抓好防治误操作的思想教育工作,增强广大调度人员的安全意识、责任心和技术素质,最大限度避免误操作事故的发生。加大奖惩力度,严格考核,加强安全监督检查。认真落实各级安全生产责任制;严格执行“两票三制”制度,严把安全关。加强调度专业培训,提高调度员业务水平。 (二)技术方面 积极开发更高级实用的装置和软件,努力提高自动化水平和保证通信的清晰畅通,避免工作中出现因电话不清楚、自动化画面显示不正确而造成的错误。 随着计算机技术、通信技术的发展以及电力系统控制技术的不断进步,在不远的将来,电力系统调度自动化将会取得飞速的发展。以这些科学技术的进步为依托,能更好地维持供需平衡,保证良好的电能质量。 电力系统自动化毕业论文范文篇2 浅析电力系统自动化技术 【摘 要】随着电力电子技术、微电子技术沟迅猛发展,原有的电力传动(电子拖动)控制的概念已经不能充分概抓现代生产自动化系流中承担第一线任务的全部控制设备。而且,电力拖动控制已经走出工厂,在交通、农场、办公室以及家用电器等领域获得了广泛运用。它的研究对象已经发展为运动控制系统,下面仅对有关电气自动化技术的新发展作一些介绍。 【关键词】电力自动化;现场总线;无线通讯技术;变频器 0 引言 现今,创新的自动化系统控制着复杂的工艺流程,并确保过程运行的可靠及安全,为先进的维护策略打造了相应的基础。 电力过程自动化技术的日新月异和控制水平的不断提高搜企网版权所有,为电力工业解决能源资源和环境约束的矛盾创造了条件。随着社会及电力工业的发展,电力自动化的重要性与日剧增。传统的信息、通信和自动化技术之间的障碍正在逐渐消失。最新的技术,包括无线网络、现场总线、变频器及人机界面、控制软件等,大大提升了过程系统的效率和安全性能。 电力系统自动化系统一般是指电工二次系统,即电力系统自动化指采用各种具有自动检测、决策和控制功能的装置并通过信号系统和数据传输系统对电力系统各个元件、局部系统或全系统进行就地或远方自动监视、协调、调节和控制以保证电力系统安全稳定健康地运行和具有合格的电能质量[1]。 1 电力自动化的发展 我国是从20世纪60年代开始研制变电站自动化技术。变电站自动化技术经过数十年的发展已经达到一定的水平,在我国城乡电网改造与建设中不仅中低压变电站采用了自动化技术实现无人值班,而且在220kV及以上的超高压变电站建设中也大量采用自动化新技术,从而大大提高了电网建设的现代化水平,增强了输配电和电网调度的可能性,降低了变电站建设的总造价,这已经成为不争的事实。然而,技术的发展是没有止境的,随着智能化开关、光电式电流电压互感器、一次运行设备在线状态检测、变电站运行操作培训仿真等技术日趋成熟,以及计算机高速网络在实时系统中的开发应用,势必对已有的变电站自动化技术产生深刻的影响,全数字化的变电站自动化系统即将出现。 2 电力自动化的实现技术 现场总线(Fieldbus)被誉为自动化领域的计算机局域网。信息技术的飞速发展,引起了自动化系统结构的变革,随着工业电网的日益复杂工业自动化网版权所有,人们对电网的安全要求也越来越高,现场总线控制技术作为一门新兴的控制技术必将取代过去的控制方式而应用在电力自动化中。 3 无线技术 无线通讯技术因其不必在厂区范围内进行繁杂、昂贵的布线,因而有着诱人的特质。位于现场的巡视和检修维护人员借此可保持和集中控制室等控制管理中心的联系,并实现信息共享。此外,无线技术还具有高度灵活性、易于使用、通过远程链接可实现远方设备或系统的可视化、参数调整和诊断等独特功能。无线技术的出现及快速进步,正在赋予电力工业领域以一种崭新的视角来观察问题,并由此在电力流程工业领域及资产管理领域,开创一个激动人心的新纪元。 尽管目前存在多种无线技术汉阳科技,但仅有几种特别适用于电力流程工业。这是因为无线信号通过空间传播的过程、搭载的数据容量(带宽)、抗RFI(射频干扰)/EMI(电磁干扰)干扰性、对物理屏障的易感性、可伸缩性、可靠性,还有成本,都因无线技术网络的不同而不同。因此,很多用户都倾向于“依据具体的应用场合,来选定合适的无线技术”。控制用的无线技术主要有GSM/GPRS(蜂窝)、9OOMHzRadios、wi-Fi()、WIMAX()、ZigBee()、自组织网络等,其中尤以Wi-Fi和WIMAX应用增长速度最快,这是因为其在带宽和安全性能方面较优、在数据集中和网络化方面具备卓越的安全框架、具有主机数据集成的高度灵活性、高的鲁棒性及低的成本。 4 信息化技术 电力信息化包括电力生产、调度自动化和管理信息化两部分。厂站自动化历来是电力信息化的重点,大部分水电厂、火力发电厂以及变电站配备了计算机监控系统;相当一部分水电厂在进行改造后还实现了无人值班、少人值守。发电生产自动化监控系统的广泛应用大大提高了生产过程自动化水平。电力调度的自动化水平更是国际领先,目前电力调度自动化的各种系统,如SCADA、AGC以及EMS等已建成,省电力调度机构全部建立了SCADA系统,电网的三级调度100%实现了自动化。华北电力调度局自动化处处长郭子明说,早在20世纪70年代华北电力调度局就用晶体管计算机调度电力,从国产121机到176机,再到176双机,华北电力调度局全用过,到1978年已经基本实现了电网调度自动化。 5 安全技术 电力是社会的命脉之一,当今人类社会对电力系统的依赖已到了难以想象的程度。电力系统发生大灾变对于社会的影响是不可估量的,因此电力系统最重要的是运行的安全性,但这个问题在全世界均未得到很好解决,电力系统发生大灾变的概率小但后果极其严重,我国电力系统也出现过稳定破坏的重大事故。由于我国经济快速发展的需求,电力工业将会继续以空前的速度和规模发展。随着三峡电站、西电东送、南北互供和全国联网等重大工程的实施,我国必将出现世界上最大规模的电力系统。 6 传动技术 实现变频调速的装置称为变频器。变频器一般由整流器、滤波器、驱动电路、保护电路以及控制器(MCU/DSP)等部分组成。变频器作为节能降耗减排的利器之一,在电力设备中的应用已经极为广泛而成熟。对于变频器厂商而言,在未来30年,变频器,尤其是高压变频器在电力节能降耗中的作用极为明显,变频器也成为越来越多电力行业改造技术的首选。 在业内,以ABB为首的电力自动化技术领导厂商,ABB建立了全球最大的变压器生产基地及绝缘体制造中心。自1998年成立以来,公司多次参与国家重点电力建设项目,凭借安全可靠、高效节能的产品性能而获得国内外用户的好评。其公司多种产品,包括:PLC、变流器、仪器仪表、机器人等产品都在电力行业中得到很好的应用。 7 人机界面 发电站、变电站、直流电源屏是十分重要的设备,随着科学技术的不断发展,搜企网,单片机技术的日趋完善,电力行业中对发电站、变电站设备提出了更高精密、更高质量的要求,直流电源屏是发电站、变电站二次设备中非常重要的设备,直流电源屏承担着向发电站、变电站提供直流控制保护电源的作用,同时提供给高压开关及断路器的操作电源,因此直流电源屏的可靠性将直接关系到发电站的安全运行,直流电源屏的发展已经经历了很长的时间,从早期的直流发电机、磁饱和直流充电机到集成电路可控硅控制直流充电机、单片机控制可控硅充电机、高频开关电源充电机等,至目前直流电源屏已很成熟。 直流电源屏整流充电部分仍然采用目前国际最流行的软开关技术,将工频交流经过多级变换,最后形成稳定的直流输出,直流电源屏系统控制的核心部件是V80系列可编程控制器PLC,它将系统采集的输入输出模拟量以及开关量经过运算处理,最终控制高频开关电源模块使其按电池曲线及有人为设置的工作要求更可靠地工作。 8 结束语 电气自动化技术是当今世界最活跃、最充满生机、最富有开发前景的综合性学科与众多高新技术的合成。其应用范围十分广泛,几乎渗透到国民经济各个部门,随着我国科技技术的发展,电气自动化技术也随之提高。 【参考文献】 [1]汪秀丽.中国电力系统自动化综述[J].水利电力科技,2005(02). [2]唐亮.论电力系统自动化中智能技术的应用[J].硅谷,2008(02). [3]夏永平,唐建春.浅议电力系统自动化[J].硅谷,2010(06). 猜你喜欢: 1. 电力系统自动化论文范文 2. 电力工程自动化专业论文范文 3. 电力系统毕业论文范文 4. 电气自动化专业毕业论文范文 5. 电力工程自动化论文优秀范文
2006年第1期 (总第174期) 农业装备与车辆工程 AGRICULTURAL EQUIPMENT&VEHICLE ENGINEERING No.1 2006 (Totally 174) 汽车线控转向系统综述 于蕾艳林逸李玉芳 (北京理工大学机械与车辆工程学院,北京100081) 摘要:线控转向(Steer—By—W ire)~.-种先进的转向技术。由于取消了方向盘和车轮的机械连接,可以任意设计传 动比,对转向轮进行主动控制,并对随车速变化的参数进行补偿,实现理想的转向特性,提高操纵稳定性。综述了国 内外线控转向的研究发展,介绍了线控转向的结构、关键技术、研究方法,并提出了线控转向的发展趋势。 关键词:线控转向;操纵稳定性 中圈分类号:U463.4 文献标识码:A 文章编号:1673—3142(2006)01—0032—06 Summarization of Automobile Steer——by..W ire System Yu Leiyan Lin Yi Li Yufang (School of Mechanism and Vehicle Engineering,Beijing Institute of Technology,Beijing 100081,China) Abstract:Steer-By-Wire is an advanced steering technology.As the mechanical connections between steering wheel and turning wheels are eliminated,the drive ratio can be designed according to needs,the turning wheels can be controlled actively compensating the parameters with vehicle speed variation,thus ideal steering characteristics is realized and handling stability is improved.Research development of home and abroad of Steer-by-Wire technology is summarized,structure,key technologies and study methods of Steer-by-Wire is introduced and developing trend of Steer-by-Wire is presented. Key Words:Steer-by-Wire(sBw)system;handling stability 1 前言 汽车发展的趋势是安全、节能、环保。转向系统 是关系主动安全的重要系统,其操纵稳定性好坏对 汽车性能影响很大。操纵性是汽车准确跟踪驾驶员 意图行驶;稳定性是要求危险工况(高速行驶,侧向 加速度大,离心力大,超过轮胎侧偏力而发生大的侧 滑;小附着系数路面的侧滑;对开路面上轮胎左右侧 偏力不相等、侧向风引起的横摆)下汽车仍稳定行 驶。为提高操纵稳定性,出现了ESP(电子稳定程 序)、主动转向、4WS(4轮转向)等。ESP判断产生不 足转向或过度转向时相应在后轮、前轮产生制动力, 产生横摆力矩即纠偏力矩。四轮转向的后轮也参与 转向。低速时,后轮与前轮反向转向,减小转弯半径, 提高机动灵活性。高速时,后轮与前轮同向转向,提 高汽车的稳定性。其控制目标是质心侧偏角为零。 然而这些汽车转向系统却处于机械传动阶段,由于 其转向传动比固定,汽车的转向响应特性随车速而 收稿日期:2oo5—10—24 作者简介:于蕾艳(1980-)。女,北京理工大学车辆工程系博士,主要 从事汽车电子、线控转向方面的研究。 ·32· 变化。因此驾驶员就必须提前针对汽车转向特性的 幅值和相位变化进行一定的操作补偿,从而控制汽 车按其意愿行驶。 如果能够将驾驶员的转向操作与转向车轮之间 通过信号及控制器连接起来,驾驶员的转向操作仅 仅是向车辆输入自己的驾驶指令,由控制器根据驾 驶员指令、当前车辆状态和路面状况确定合理的前 轮转角,从而实现转向系统的智能控制,必将对车辆 操纵稳定性带来很大的提高,降低驾驶员的操纵负 担,改善人一车闭环系统性能。因而线控转向系统 (Steering-By-Wire System,简称SBW)应运而生。 SBW 是X-By-Wire的一种。X—By—W 的全称是 “没有机械和液力后备系统的安全相关的容错系 统”。“x”表示任何与安全相关的操作,包括转向、制 动等等。“By—Wire”表示X—By—wire是一个电子系 统。在X—By—Wire系统中,所有元件的控制和通讯 都通过电子来实现。x—By—Wire系统是没有机械和 液力后备系统的,传统的机械和液力系统由于结构 的原因(间隙、运动惯量等),从控制指令发出到指令 执行会有一定的延迟,这在极限情况下是不能允许 维普资讯 2006年1月于蕾艳等: 汽车线控转向系统综述 的。X—By—Wire系统用电来控制会大大地减小延迟, 为危险情况下的紧急处理赢得了宝贵的时间。 2 线控转向系统的发展概况 2O世纪5O年代,TRW 等转向系统开发商就做 了大胆的假设,将方向盘与转向车轮之间用控制信 号代替原有的机械连接。在2001年的第71届日内 瓦国际汽车展览会上,意大利的Bertone汽车设计 及开发公司展示了新型概念车“FILO”。“FILO”采用 了“drive—by—wire”系统,所有的驾驶动作都通过信 号传递的。它使用操纵杆进行转向操作,并采用了 最新的42V供电系统。 美国的德尔福公司继成功推出了EPS系统后, 又开发出了自己的前轮和四轮线控转向系统,并应 用于加州的自动高速公路系统(automated highway system,AHS)中。1997年德尔福公司与意大利菲亚 特公司签订了应用于小型车的线控转向系统研制 合同。到2000年上半年德尔福公司已经与欧美等 地的汽车生产厂家签订了关于开发线控转向系统 的合同。 在欧洲,以Daimler—Chrysler、Fiat、Ford Europe 和Volvo等汽车公司、Bosch等电子公司和 Chalmers、Vienna等大学联合发起了“Brite—EuRam ‘X_by—wire’计划”进行线控转向系统的实现以及安 全性和可靠性方面的研究。Daimler—Chrysler已经开 发出电子驱动概念车“R 129”。它取消了方向盘、加 速踏板和制动踏板,完全采用操纵杆控制,实现了 Drive—by—wire技术。此项技术被列为2000年汽车 十大新技术之一。 第59届法兰克福汽车展的雪铁龙越野概念车 “C—CROSSER”,也采用了线控转向系统。 目前由于蓄电池电压和功率等因素的影响,线 控转向系统只能使用24V或36V电源,难以提供较 大的转向功率,现阶段线控转向系统的研究以及近 期的应用对象主要是针对轿车。要在重型卡车上应 用,还必须采用液压执行机构。随着蓄电池技术发 展和42V电子设备在汽车上的应用,全线控转向系 统将应用到中型和重型汽车上。目前42V电源已经 在一些概念车上得到应用,其中通用的“自主魔力” 概念车和Bertone公司的“FILO”概念车就采用了 42V电源。 预估在两三年之后,传统的如煞车、操控等机械 系统将会由线缆与电子信号取代,其中有部分车厂 投下巨资与电子业共同合作,研发一套名为 FlexRay的新一代应用于汽车上的网络通讯系统。 FlexRay网络通讯系统是用以整合包括Brake—by— Wire(电子制动)、Steer—by—Wire(电子转向)等“线传 控制”系统(目前最快数据传送速度为10Mbit/s),让 汽车发展成百分之百的由单一电子系统控制车辆, 完全不需要机械系统的支持。 3 线控转向系统的结构及性能特点 3.1 线控转向系统的结构 线控转向系统由方向盘总成、转向执行总成和 主控制器(ECU)-个主要部分以及自动防故障系统、 电源等辅助系统组成,如图1。 图1 线控转向系统结构示意图 方向盘总成包括:方向盘、方向盘转角传感器、 力矩传感器、方向盘回正力矩电机。方向盘总成的主 要功能是将驾驶员的转向意图(通过测量方向盘转 角)转换成数字信号,并传递给主控制器;同时接受 主控制器送来的力矩信号,产生方向盘回正力矩,以 提供给驾驶员相应的路感信息。 转向执行总成包括前轮转角传感器、转向执行 电机、转向电机控制器和前轮转向组件等组成。转向 执行总成的功能是接受主控制器的命令,通过转向 电机控制器控制转向车轮转动,实现驾驶员的转向 意图。 主控制器对采集的信号进行分析处理,判别汽 车的运动状态,向方向盘回正力电机和转向电机发 送指令,控制两个电机的工作,保证各种工况下都具 有理想的车辆响应,以减少驾驶员对汽车转向特性 随车速变化的补偿任务,减轻驾驶员负担。 同时控制器还可以对驾驶员的操作指令进行识 别,判定在当前状态下驾驶员的转向操作是否合理。 · 33· 维普资讯 农业装备与车辆工程2006年第1期 当汽车处于非稳定状态或驾驶员发出错误指令时, 线控转向系统会将驾驶员错误的转向操作屏蔽,而 自动进行稳定控制,使汽车尽快地恢复到稳定状态。 自动防故障系统是线控转向系的重要模块,它 包括一系列的监控和实施算法,针对不同的故障形 式和故障等级做出相应的处理,以求最大限度地保 持汽车的正常行驶。作为应用最广泛的交通工具之 一 ,汽车的安全性是必须首先考虑的因素,是一切研 究的基础,因而故障的自动检测和自动处理是线控 转向系统最重要的组成系统之一。它采用严密的故 障检测和处理逻辑,以更大地提高汽车安全性能。 电源系统承担着控制器、两个执行马达以及其 它车用电器的供电任务,其中仅前轮转角执行马达 的最大功率就有500—8ooW,加上汽车上的其它电 子设备,电源的负担已经相当沉重。所以要保证电 网在大负荷下稳定工作,电源的性能就显得十分重 要。在42V供电系统中这个问题将得到圆满的解 决。 3.2 线控转向系统的性能特点 1)取消了方向盘和转向车轮之间的机械连接, 通过软件协调它们之间的运动关系,因而取消了它 们之间的机械约束和干涉,使之可以相对独立运动, 因而可以实现传动比的任意设置,可以根据车速和 驾驶员喜好由程序根据汽车的行驶工况实时设置传 动比。同时还可以从信号中提出最能够反映汽车行 驶状态的信息,作为方向盘回正力矩的控制变量,使 方向盘仅仅提供驾驶员有用信息,以减轻驾驶员的 体力脑力负荷,提高“人一车闭环系统”对道路的跟 踪特性。同时由于减少了机构部件数量,而减少了 从执行机构到转向车轮之间的传递过程,使系统惯 性、系统摩擦和传动部件之间的总间隙都得以降低, 从而使系统的响应速度和响应的准确性得以提高。 2)线控转向系统采用了软件控制,因而可以把 转向系统与其它主动安全设备如ABS、汽车动力学 控制、防碰撞、轨道跟踪、自动导航以及自动驾驶等 功能相结合,实现对汽车的整体控制,提高汽车整体 稳定性,且实现了ITS中的汽车辅助转向功能。 3)线控转向系统在实现上述操作性能上的突破 的同时也带来了可观的经济性和环境效益。 4)线控转向系统是通过一个通用的执行器来调 整转向的。要对汽车转向的动力性进行调整,必须 使用一个转角传感器,这并不影响方向盘对车轮的 快速调整。另一方面,一个力矩传感器也是必须的, - 34- 它将对汽车转向的调整和自动驾驶起重要作用。因 此,驾驶员通过提供到方向盘的力矩知道正确的方 向,并通过进一步的引导控制系统来进行评估。 5)与“电子驾驶”和“电子停车”一起,它提供了 把它们实际化的条件,并且把动力性和汽车控制统 一到一个系统中。 6)对汽车生产商的好处。传统转向系中转向柱 安装要求提供足够的空间(左手或右手驾驶),而线 控转向严格地控制了转向柱在发动机间隔内的自由 度,表明了机械式的转向柱没有很好地利用发动机 的空间。 7)对将来的好处 · 提供转向的舒适性,路况作为评估系统,只有 有用的信息才提供给驾驶员。 - 方向盘的回馈力矩和转向传动比能通过软件 不断地调整,因此,可以使转向系统对任何目标和环 境进行调整,而不需要对系统进行重新设计。 · 没有转向柱减少了驾驶员在事故中受伤的危 险。 · 转向行为(减速、加速、自动转向)都被软件记 录,为再以后的继续完善提供了第一手的资料。 4 线控转向系统的关键技术 虚拟现实技术、人工神经网络、模糊控制等新思 想、新技术的提出,为研究者站在一个新的高度研究 汽车操纵稳定性提供了可能,汽车操纵稳定性的研 究从单一的汽车本身的特性研究到汽车一驾驶员一 环境闭环系统的研究,人工神经网络、模糊控制理论 和模糊神经等新思想、新理论也应用到汽车操纵稳 定性的研究中,在研究方法上采用虚拟试验技术。线 控转向可以利用这些成果研究。 2自由度的整车动力学模型称为经典模型。这2 个自由度为质心侧偏角和横摆角速度。其中质心侧 偏角表示汽车方向特性。横摆角速度与侧向加速度 在描述侧向动力学特性有同等作用,可选其一作系 统变量。加入线控转向系统的仿真模型见图2。也可 借助advisor、vedyna的整车模型进行仿真研究。 4.1前轮转角算法 前轮转向执行电机根据传感器测得的车轮行驶 状态与驾驶员意图,实时修正前轮转角,使得汽车的 转向特性如横摆角速度增益不随车速变化,减轻驾 驶员负担。 方案1:在驾车过程中,不论车速怎么变化,驾 驶员的预瞄时间基本不变(或变化很小)。如果能够 维普资讯 2006年1月于蕾艳等:汽车线控转向系统综述 图2 线控转向系统的仿真模型 合理设计车辆的转向特性,使在一定预瞄时间下,车 辆达到前方某侧向位置的方向盘转角不随车速变 化,将在很大程度上减少驾驶员对车辆特性变化的 补偿,减轻驾驶员的负担,见图3。 目标点 ,Y ) I x {I 11. , 。,Y。) 图3 理想传动比示意图 方案2:转向系传动比随方向盘转角变化:低速 小方向盘转角时传动比小,驾驶员可以少打方向盘 就实现大的转向任务;高速大方向盘转角时,传动比 大,减少汽车对转向盘输入的敏感程度。图4中,Is 一4o0 —2o0 O 2o0 400 方向盘转角(。) 图4 随方向盘转角变化的传动比方案 2比较理想。 4.2方向盘回正力矩模拟 由于方向盘和转向车轮间没有机械连接,路面 的不平冲击不会传到方向盘,但同时驾驶员缺少对 车辆行驶状态和路况的把握,所以模拟恰当的方向 盘回正力矩很重要。可以通过以下公式模拟: T~=-[Fo( ,8~)sign(Sh)+ (V, )+ ) + ( ,q)】 (1) ( , )是系统的干摩擦, ( , )体现了转向 系刚度,其设置要保证当方向盘偏离中间位置时,方 向盘回正力矩能够在一定程度上迅速增大,也就是 在方向盘中间位置应该有足够的或合理的力矩梯 度,让驾驶员感知方向盘偏离了中间位置。随着方向 盘转角增大,力矩梯度应该减小到一个合理值,保证 方向盘回正力矩不会超过合理范围。)体现了转 向系统的阻尼,车辆高速行驶时,方向盘回正力矩主 要受函数( , )的影响严重。 4.3 汽车稳定性控制算法 由于车辆系统本身存在滞后和非线性,同时车 辆的行驶环境十分复杂,在驾驶员的合理操作范围 内我们希望车辆能够准确执行驾驶员指令。一旦车 辆处于危险状态,我们则希望车辆能够自动恢复到 正常状态。 4.3.1 横摆角速度反馈控制 如图5的横摆角速度反馈控制在一定程度上改 善了车辆的动态特性,这种作用在高速时尤为明显。 当车速较高时,横摆角速度反馈不但使横摆角速度 响应的带宽增大,而且同时使横摆角速度阻尼增大。 使车辆重心侧偏角的超调量较无横摆角速度反馈控 制的车辆有所减小,且车辆重心侧偏角响应的过渡 时间减小,可以使其更快速地到达稳态值。横摆角速 度反馈控制还可以减小车辆重心侧偏角的稳态增 ·35· / 一 / ~ ,/ 一 ./ / 一 / p - , / / 一 / / 一 维普资讯 农业装备与车辆工程2006年第l期 图5 横摆角速度反馈框图 ^ I 壬:自自l~ l I Lr l, ] --,、l r ]l 『::= l 上J 一-1转I司盘一.1~L ’。I- 一一兰车辆 , ) + 一 ◆ 一。D yV . 回正力矩电机l· 6T. K }..— ) 一口 图6 横摆角速度、侧向加速度综合控制 益,使车辆具有良好的方向特性。这种形式的横摆角 速度反馈控制,使得侧向加速度超调量减小,转向运 动更加平稳。但同时这种反馈控制也使得侧向加速 度增益减小,这意味着有横摆角速度反馈控制的车 辆驾驶员要多打方向盘,这在低速和中等车速工况 下加重了驾驶员的负担。 4.3.2 横摆角速度、侧向加速度综合控制 按D = . + Vy (2) 进行横摆角速度、侧向加速度综合控制,如图6。 4.4 安全与可靠性设计 线控转向系统若真正走向消费市场,首先要解 决其安全可靠性问题, 因而必须采用容错控制技 术。容错控制设计方法有硬件冗余和解析冗余。硬 件冗余对重要部件及易发生故障部件提供备份;解 析冗余是通过设计控制器的软件提高整个系统的 冗余度。SBW 中,相对于CU,传感器和执行机构更 容易发生故障,一些传感器和执行机构存在冗余。 现阶段采用机械、液压的备份转向系统,一旦线控 转向出现故障,备份转向仍然可以工作,完成基本 转向任务。 ·36- 5 线控转向系统的前景展望 未来汽车的主体是低排放汽车(LEV)、混合动力 汽车(HEV)、燃料电池汽车(FCEV)、电动汽车(EV)四 大EV汽车,这给线控转向系统带来了更加广阔的 应用前景。除了安全性和可靠性外,还有模拟路感的 电机振动、电源、传感器的精度和成本问题等。模拟 路感的电机振动控制在EPS的研发过程中,已经有 成熟的技术和经验可以借鉴。车用42V电源预计在 未来的几年内将会快速发展并普及,届时汽车电子 附件的供电问题将会得到圆满解决。车用各种传感 器如非接触扭矩、转角传感器、横摆角速度传感器等 的精度在不断提高,成本下降,在未来的几年内将会 在精度和价格方面满足各种电控系统的要求。预计, 到2010年40%的欧洲生产的汽牟将全部采用X— By—Wire技术。随着X—By—Wire的发展,Brake—By— W ire,Thrust—By—Wire,Steer—By—Wire,Shift-By— Wire等By-Wire系统将成为x—By—Wire系统的各 个子系统,它们之问会有一些数据要共享,将有一个 更大的通讯系统来实现它们之间的通讯,从而使整 个汽车成为一个完全的x—By—Wire系统。
传动系异响故障则是由于零件因磨损、变形及损坏,使零件间配合变坏,引起震动和响声。传动系各机件、总成产生磨损、变形、断裂、松动及平衡破坏,将导致传动系发生异响。它是故障的现象,又是功能性故障的先兆。应根据其特有规律予以迅速排除。一、故障现象1·发动机怠速运转时,踩下离合器踏板,有“沙、沙”响声,在离合器分离或接合时,有“沙沙”或“喇喀”声响;当踏板放松时,异响消失。2·变速器空挡位置时出现有节奏响声,这是第一轴与中间轴常啮齿轮响,有时在不同挡位有声响。3·万向节传动系统异响,车速越高响声越大,脱挡滑行时响声更清晰;也有低速时响,滑行时更响(如万向节轴承过紧);或在车速突然变化时,有突发冲击声;有的异响伴有震抖,随车速增快,震抖越烈。4·驱动桥在行驶时有异响,但在脱挡滑行时异响消失。或在行驶时有异响,脱挡滑行时异响不消失。有时在直线行驶时无异响,但在车辆转弯时出现异响;有的上坡响下坡不响,有的下坡响而上坡不响,有的上坡下坡均有异响。(并非原创)资料来自网络仅供参考如有侵权请联系删除
液压传动系统的故障分析与排故液压传动是以液压油为工作介质进行能量转换和动力传递的,它具有传送能量大、布局容易、结构紧凑、换向方便、转动平稳均匀、容易完成复杂动作等优点,因而广泛应用于工程机械领域。但是,液压传动的故障往往不容易从外部表面现象和声响特征中准确地判断出故障发生的部位和原因,而准确迅速地查出故障发生的部位和原因,并及时排除。在工程机械的使用、管理和维修中是十分重要的。��1 液压系统的主要故障��在相对运动的液压元件表面、液压油密封件、管路接头处以及控制元件部分,往往容易出现泄漏、油温过高、出现噪音以及电液结合部分执行动作失灵等现象。具体表现:一是管子、管接头处及密封面处的泄漏,它不仅增加了液压油的耗油量,脏污机器的表面,而且影响执行元件的正常工作。二是执行动作迟缓和无力,表现为推土机铲刀提升缓慢、切土困难,挖掘机挖掘无力、油马达转不起来或转速过低等。三是液压系统产生振动和噪音。四是其他元件出现异常。��2 故障的检查�� 直接检查法 �凭借维修人员的感觉、经验和简单工具,定性分析判断故障产生的原因,并提出解决的办法。 � 仪器仪表检测法 �在直接观察的基础上,根据发生故障的特征和经验,采取各种检查仪器仪表,对液压系统的流量、压力、油温及液压元件转速直通式检测,对振动噪音和磨损微粒进行量的分析。 � 元件置换法 �以备用元件逐一换下可能发生故障的元件,观察液压系统的故障是否消除,继而找出发生故障的部位和原因,予以排除。在施工现场,体积较大、不易拆装且储备件较少的元件,不宜采用这种方法。但对于如平衡阀、溢流阀及单向阀之类的体积小,易拆装的元件,采用置换法是比较方便的。 � 定期按时监控和诊断�根据各种机械型号、检查内容和时间的规定,按出厂要求的时间和部位,通过专业检测、监控和诊断来检测元器件技术状况,及时发现可能出现的异常隐患,这是使液压系统的故障消灭在发生之前的一种科学技术手段。当然,执行定期检测法,首先要培养一些专业技术检测人员,使他们既精通工程机械液压元件的构造和原理,又掌握和钻研检测液压传动系统的各种诊断技术,在不断积累靠人的直感判断故障经验的同时,逐步发展不解体诊断技术,来完成技术数据采集,辅以电脑来分析判断故障的原因及排除方法。��3 液压系统的故障预防�� 保证液压油的清洁度 �正确使用标定的和要求使用的液压油及其相应的替代品(详参《工程机械油料手册》),防止液压油中侵入污物和杂质。因为在液压传动系统中,液压油既是工作介质,又是润滑剂,所以油液的清洁度对系统的性能,对元件的可靠性、安全性、效率和使用寿命等影响极大。液压元件的配合精度极高,对油液中的污物杂质所造成的淤积、阻塞、擦伤和腐蚀等情况反应更为敏感。 �造成污物杂质侵入液压油的主要原因,一是执行元件外部不清洁;二是检查油量状况时不注意;三是加油时未用120目的滤网过滤;四是使用的容器和用具不洁净; 五是磨损严重和损坏的密封件不能及时更换;六是检查修理时,热弯管路和接头焊修产生的锈皮杂质清理不净;七是油液贮存不当等等。�在使用检查修理过程中,应注意解决这些问题,以减少和防止液压系统故障的发生。 � 防止液压油中混入空气 �液压系统中液压油是不可压缩的,但空气可压缩性很大,即使系统中含有少量空气,它的影响也是非常大的。溶解在油液中的空气,在压力较低时,就会从油中逸出产生气泡,形成空穴现象;到了高压区,在压力的冲击下,这些气泡又很快被击碎,急剧受到压缩,使系统产生噪音。同时,气体突然受到压缩时,就会放出大量的热能,因而引起局部受热,使液压元件和液压油受到损坏,工作不稳定,有时会引起冲击性振动。 �故必须防止空气进入液压系统。具体做法:一是避免油管破裂、接头松动、密封件损坏;二是加油时,避免不适当地向下倾倒;三是回油管插入油面以下;四是避免液压泵入口滤油器阻塞使吸油阻力增大,不能把溶解在油中的空气分离出来。 � 防止液压油温度过度�液压系统中的油液的工作温度一般在30℃~80℃范围内比较好,在使用时必须注意防止油温过高。如油箱中的油面不够,液压油冷却器散热性能不良,系统效率太低,元件容量小,流速过高,选用油液粘度不正确,它们都会使油温升高过快。粘度高增加油液流动时的能量损耗,粘度低会使泄漏增多,因此在使用中能注意并检查这些问题,就可以预防油温过高。此外对液压油定期过滤,定期进行物理性能检验,既能保证液压系统的工作性能,又能减少液压元件的磨损和腐蚀,延长油液和液压元件的使用寿命。��4 液压系统的故障分析�� 传动系统分析法 �工程机械的液压传动系统如果维护得好,一般说来故障是比较少的。由于密封件老化、变质和磨损而产生外泄是很容易观察到的,根据具体情况可设法排除。但是如果液压元件的内部发生了故障是观察不到的,往往不容易一下子就找出原因,有时虽然是同样的故障现象,但产生的原因却不一定相同,要想准确而迅速地找出液压元件的故障的部位和原因,首先要根据发生故障元件的构造图、系统图,分析了解和研究元件的工作原理和特性,再使了解的构造原理与实物对号,具体情况具体分析,检查寻找故障发生的部位和产生的原因,以便采取相应的技术措施来排除故障。 � 逻辑流程分析法 �此方法是根据液压传动系统的基本原理进行逻辑分析,减少怀疑对象,逐步逼近找出故障发生的部位和原因。��5 液压系统故障的排除��(1) 液压系统中管子、管子接头和焊接处,由于振动频率较高,常常发生破坏。在换用时要根据压力和使用场合,选用强度足够,内壁光滑清洁,无砂、无伤、无锈蚀、无氧化皮的管子。当管子需要焊接时,最好采用加套管的办法,因为对接可能使管的内径局部缩小;截段时,油管的截面与管子轴线的不垂直度不得大于°,并清除铁屑和锐边倒钝。当管子支承距离过大或支承松动时要设卡固定拧紧,当弯曲半径过小时,易形成弯曲应力,弯曲半径一般应大于管外径的3倍。 �在密封表面处,密封元件的老化变质会使泄漏量增大。密封件的有效寿命通常是:固定元件之间的密封寿命时间为10000h,运动元件之间密封寿命时间为1500h~2000h。到了规定的使用寿命时间后,即使还可用的元件也应该更换。密封面的泄漏还与预压面的压力不够或不均匀有关。预压量增大时,其封油量压力增大,密封效果好,反之则差。再者摩擦表面光洁度与硬度不足也会缩短密封件的寿命。 �密封件设计不合理以及安装时扭曲刮伤也是导致密封圈早期磨损而引起泄漏的原因。 �油液中杂质过多,易加速密封件与摩擦表面的磨损,形成密封件的早期失效,油封工作温度过高或过低也会影响其寿命和工作性能。� (2) 执行元件运动的速度降低,主要是由于输入执行元件的液压油流量不足;执行元件无力的原因主要是输入液压油压力不足,以及回油管路背压过高等因素所造成的。 �工程机械液压系统所用的油泵多为齿轮泵,其工作压力为210×102kPa,柱塞泵的工作压力可达320×102kPa。泵的输出压力是由荷载决定的,并随着荷载的变化而变化。荷载无限增加,泵的压力也无限升高,直到系统某一部分被破坏。对于齿轮泵:主要是轴承、齿轮啮合面、齿顶与壳体、齿轮端面与泵盖间的磨损和密封件的磨损、老化、损坏使齿轮泵的内漏表现更为突出。在一定转速与一定压力下,对无端面间隙补偿的齿轮泵,其轴线磨损引起的泄漏约占全部内漏量的75%~85%,齿顶间隙内漏量约占15%~20%,其他内漏约占4%~5%,因此我们要抓住主要问题,采取有效的技术措施予以解决,就能使泵恢复其原有性能。 �在维修工作中,我们发现使用了一定时间的齿轮泵,由于啮合挤压,在齿顶和端面会产生毛刺,使泵体和端盖的磨损加剧,尤其是铝合金泵盖更为严重。如能定期修理检查,用油石磨掉所产生的毛刺,则可以延长油泵的寿命。叶片泵的主要故障是定子、叶片、转子、轴承和两侧配流盘的磨损,定子的内表面是由圆弧和过渡曲线组成的,过渡曲线如果采用“阿基米德”螺旋线,则叶片径向等速运动。实践证明,当我们将叶片泵解体修理时,定子内表面就在曲线与圆弧连接部分磨损最严重,换掉磨损严重的定子,可以使叶片泵恢复原有的性能,采用这种修理方法是比较经济的。叶片泵转子、叶片的使用寿命约相当于定子使用寿命的两倍,这在备料时应予以考虑。 �(3) 液压系统的蓄能器是用来调节能量、贮存能量、减少设备容积、降低功率消耗、减少系统发热、缓冲吸收冲击和脉动压力的辅助元件。常见的蓄能器有胶囊式的,它具有漏气损失小、反应灵敏、可以吸收急速的压力冲击和脉动、重量轻、体积小等特点。蓄能器发生故障会影响液压系统的正常工作,因此在检查气压量不足时,应按时充入惰性气体。 �(4) 液压系统中,要求装备精度高的还有液压马达。如果注意日常维护和保养,防止油液污染,一般不会发生故障,进入液压马达的油液须仔细过滤,以减少杂质,防止过快磨损。修理后的马达,应注满干净的液压油,排尽系统中的空气。确定不了马达是否有故障,最好不要拆卸,这样可减少污染的机会和保持配合的精度。液压缸是液压系统中的执行元件,常见的故障有漏油和运动不正常。缸头因密封件损坏而外泄,应立即更换密封件;油缸运动不正常有油缸内漏、油路中有空气、活塞密封件老化和损坏、油液有杂质、平衡阀发生故障等。 �(5) 控制元件是用来实现系统和执行元件对压力、流量方向的要求的。控制阀及时控制系统中最重要的元件,由于阀的配合一般都比较精密,所以在修理时应特别注意,不需拆阀芯的尽量不要抽出阀芯;配合副方位不要错乱,偶件不要互换;螺丝的拧紧力矩要均匀一致,锥形阀芯的接触线磨损可采用研磨修正接触线的办法解决;回位弹簧疲劳时,可予更换。
我有 你加球球 574691615
车检测与维修的毕业论文范文第一部分 摘要:随着电子技术在汽车上的普遍应用,汽车电路图已成为汽车维修人员必备的技术资料。目前,大部分汽车都装备有较多的电子控制装置,其技术含量高,电路复杂,让人难以掌握。正确识读汽车电路图,也需要一定的技巧。电路图是了解汽车上种类电气系统工作时使用的重要资料,了解汽车电路的类型及特点,各车系的电路特点及表达方式,各系统电路图的识读方法、规律与技巧,指导读者如何正确识读、使用电路图有很重要的作用。 汽车电路实行单线制的并联电路,这是从总体上看的,在局部电路仍然有串联、并联与混联电路。全车电路其实都是由各种电路叠加而成的,每种电路都可以独立分列出来,化复杂为简单。全车电路按照基本用途可以划分为灯光、信号、仪表、启动、点火、充电、辅助等电路。每条电路有自己的负载导线与控制开关或保险丝盒相连接。
维普系统计算字符数的方法为:通过字符数+空格来计算,WORD不计算图表,格式代码信息,但图表和格式设置在转化中的部分是会计算总字数的。此外,中文论文按字符数计算,外文论文2个字母算一个字符。可以选择将论文粘贴复制到txt文本里在提交,减少图表转换产生的字符及隐藏字符等。所有的论文检测系统计算字符数都是按即空格那一项为准的,这往往会大于字数,不管怎么样,系统对待每一篇论文字符数计算方式都是使用同样的计算方法的。
维普系统计算字符数的方法为:通过字符数+空格来计算,WORD不计算图表,格式代码信息,但图表和格式设置在转化中的部分是会计算总字数的。此外,中文论文按字符数计算,外文论文2个字母算一个字符。可以选择将论文粘贴复制到txt文本里在提交,减少图表转换产生的字符及隐藏字符等。所有的论文检测系统计算字符数都是按即空格那一项为准的,这往往会大于字数,不管怎么样,系统对待每一篇论文字符数计算方式都是使用同样的计算方法的。
要。维普论文检测系统查重标准及格式规范,抄袭判断标准与他人作品文字内容、语序完全相同或仅作少量删减、修改。系统会从上传的文章里面找到文章中最后一个“参考文献”四个连续汉字,从这四个字开始如果下面的格式符合格式规范就会识别为参考文献。包括参考文献之后的内容都不会被检测。
每个学校的标准是不一样的。用的查重软件可能也是不同的。
比如浙江大学要求各院系根据学科专业特点制定重复率要求,大部分院系小于10%,也有的定在15%、20%。
一般本科院校在30%以下,硕博等一般在10%以下,当然不同的学校要求也是不同的,也可能有些本科院校要求在10%以下,所以可以在检测修改前,问问自己的老师,确定一下,做到心中有数。剩下的就是努力检测并修改。
每个学校要求使用的论文检测系统也是不同的,比如某大学使用的是知网的论文查重检测系统,而定一个大学使用的是维普的论文检测系统,那么按照这样的标准,首先是肯定不能以一个确定的结果值进行衡量的。
因为对于不同的论文检测系统来说,算法和收录文献库的情况都不一样,有时候检测的差距大也是必然的,所以同学们在检测论文的时候,最好是先确定一下学校所使用的系统,后期一直使用即可。
比如学校要求使用维普的论文检测系统,同学们就没有必要再使用Paperpass。不然造成了浪费而且也不会有准确的检测结果。
扩展资料:
人民网:毕业论文查重要求更严格
如果要问今年毕业生的毕业季关键词,“论文查重”一定是其中之一。
社交媒体上,关于论文重复率要求降低的吐槽天天都有。据媒体报道,部分学校的毕业论文重复率要求从以前的30%以内下降到20%,有的学校甚至降到了8%。如果重复率过不了关,论文就进入不了答辩环节。
前不久,中共中央办公厅、国务院办公厅印发了《关于进一步弘扬科学家精神加强作风和学风建设的意见》。
在浙江大学人文学院党委副书记楼艳看来,学术规范是学风建设的重要内容。近日,她在接受科技日报记者采访时表示,学术规范是诚信底线,学生是未来的建设者和接班人,在学生时代就应该牢牢树立底线思维,具有“红线”意识。
“查重的目的,也是在学生中建立纪律观念和规则意识,教育学生要敬畏规则,遵守制度。”楼艳说。
不过,查重只是一种技术手段。中国教育科学研究院研究员储朝晖说,查重本身,解决不了学术不规范问题。有技术,就有规避技术的方法,这就是所谓的“道高一尺,魔高一丈”。而且,并不能简单认为重复率越低,论文就一定越好。
“有些论文需要对他人文章观点进行引用,只要标明出处,引用恰当,我们就认为它符合学术规范;如果引文内容不恰当,即便只有10%的重复率,也是不应该有的。”储朝晖强调,人不能被技术框死,要用更加专业的方式来判断论文质量。
浙江大学本科生院教务处副处长刘有恃认为,查重报告可以作为一种辅助判断工具,不过,低重复率不能作为学生毕业论文的唯一检验标准。
“我校要求各院系根据学科专业特点制定重复率要求,大部分院系小于10%,也有的定在15%、20%,还有学院由导师根据论文查重数据审核判断。”
他表示,在论文质量方面,相比结果管理,更应重视科学的过程管理,建立从课程教学—学位论文开题报告—中期检查—论文评审和论文答辩—论文评优等环节的全过程质量管理观念和质量管理体系,通过全过程的质量管理有效促进和保障学生学位论文质量的不断提高。
确实,提高育人质量,重点不仅在于加强对学生毕业论文的审核,还要加强对学生日常的学业管理。学风建设,也不在于毕业突击,而在于平时的潜移默化。
“大学应该要长期常规性开展学风建设工作,建立严格的学术规范和学术评价体系。”储朝晖说。楼艳也表示,学术规范训练是常态化的,要贯穿学生培养的整个过程。
比如,在新生入学教育时,人文学院就会专门安排“坚守学术规范”的报告,对学生的学术研究提出要求;前不久,人文学院还组织了第一届“学风特优班”暨“志学奖”评选活动。
刘有恃告诉科技日报记者,相信“严出”将是高校长期存在的“新常态”。“要切实增强在校学生责任感、紧迫感和使命感,不要在大学期间虚度光阴,错失成长良机。”
参考资料来源:人民网-毕业论文查重要求更严格