土木在线论坛 \ 电气工程 \ 成套电气设备 \ 基于现场可编程门阵列的智能配电站安防巡检系统设计与实现

基于现场可编程门阵列的智能配电站安防巡检系统设计与实现

发布于:2022-07-11 09:10:11 来自:电气工程/成套电气设备 [复制转发]


在我国电力系统中,配电站属于电力网络边缘节点,是电力系统中的重要环节。然而,人工巡检或一些传统硬件设备的数据采集手段,由于成本及效率等问题,已经无法匹配当下的安防巡检需求。针对此问题,福州大学物理与信息工程学院、闽江学院计算机与控制工程学院的研究人员陈标发、陈传东、魏榕山、罗海波,在2022年第5期《电气技术》上撰文,提出一种基于现场可编程门阵列(FPGA)的智能配电站安防巡检解决方案。


他们首先利用YOLOv4-tiny网络实现安全帽佩戴检测、工作服着装检测、越界预警识别等功能,其准确率可达93.5%;其次针对配电站的应用场景,利用FPGA在边缘设备上实现实时检测的效果,并从并行展开及流水线等方面进行加速优化。实验结果表明,该系统可在ZCU102平台上实现每秒传输帧数为68的检测速度,整体平均性能达到228十亿次运算/秒。


在我国电力系统中,配电站作为电网末端与用电设备相连的关键节点,与输电、变电同样是电力系统中的重要环节。随着社会经济的高速发展,以及配电站在整个电力网络中的特殊地位,其数量也日益增加。

       
人工巡检或一些传统硬件设备的数据采集手段,由于成本或效率等问题,已经无法完美匹配当下数以万计的配电站安防巡检需求。并且,配电站属于高电压、高危场所,如何高效、安全地监管进入站房的工作人员及其施工区域是否合规等,更是一个重要问题。

       
当前的主流做法是采用安装相关传感器的方式进行监管,该方案存在成本高、无法存证等问题。因此,有必要研究与设计新的监管方法,在低成本的条件下实现证据链的保存和违规识别的高准确率。

       
在传统硬件设备环境感知的基础上,本文提出一种基于机器视觉的智能配电站安防巡检解决方案。此方案可通过视频监控设备,实现对配电站房内视频流的视觉分析,通过YOLO(you only look once)卷积神经网络进行目标检测,从而实现安全帽佩戴检测、工作服着装检测、越界预警识别等功能。

       
在实际应用中,绝大部分卷积神经网络都是部署在中央处理器(central processing unit, CPU)和图形处理器(graphics processing unit, GPU)上,然而CPU的高延时、低效率,GPU的高成本、高功耗的缺点决定了其难以在边缘设备上实现。张量处理器(tense processing unit, TPU)、网络处理器(neural- network processing unit, NPU)作为特殊的专用集成电路(application specific integrated circuit, ASIC)方案,研发成本高,研发周期长,且完成后难以更改,难以适应更新迭代较快的神经网络算法。因此,本文利用现场可编程门阵列(field programmable gate array, FPGA)的可定制性、可重构性及高并行度的独特优势,设计一套基于FPGA的快速推理模型。

       

       
1  YOLO卷积神经网络        

       
1.1  YOLO模型        

       
近些年来,有关目标检测算法的研究取得了一定的进展。目前比较流行的算法可以分为基于候选区域的两阶段(two stage)目标检测算法和单阶段(one stage)目标检测算法,包括YOLO、SSD(single shot multibox detector)等。相较于两阶段目标检测算法,单阶段目标检测算法虽然在精度上略有不及,但其在模型参数量及检测速度上均有一定优势。

       
YOLO是一种基于深度神经网络的对象识别和定位算法,是较为优秀的目标检测架构之一,其在检测实时性方面具有较大优势。YOLO将生成候选区和对象识别这两个阶段合二为一,利用整张图片作为网络的输入,直接在输出层回归边界框的位置和所属类别。

       
YOLOv4-tiny是在YOLOv4算法的基础上进行压缩设计的,其结构更为简单,参数量只有原来的十分之一,这使YOLOv4-tiny的检测速度获得较大提升,使之部署在移动和嵌入式设备上成为可能。因此本文采取YOLOv4-tiny网络进行目标检测。而对于部分对速度、功耗、资源不敏感,对精度有较高要求的场景,可使用YOLOv4或其他卷积神经网络。

       
1.2  数据集采集        

       
由于配电站环境复杂多变,通过监控摄像头和公开数据集获取更为丰富的数据集。利用监控摄像头进行视频采集,并经过筛选及处理共获得12928张图片。此外,还从公开数据集中获得9 873张图像文件。完成图像采集后,使用开源项目LabelImg进行标定工作。

       
数据集各类标签比例如图1所示,通过对数据集标签文件的分析可知,本次采集的数据集中共四种检测目标,即穿着工作服的行人、未穿着工作服的行人、已佩戴安全帽的头部、未佩戴安全帽的头部。

       

图1  数据集各类标签比例

       
1.3  训练结果        

       
利用本次采集的数据集对YOLOv4-tiny模型进行训练,训练结果各项指标见表1。其中,Precision为准确率;Recall为召回率;MAP.5为将IOU(intersection over union)设置为0.5时,每个类别的AP(average precision)的平均值。

       

表1  模型训练结果指标

       
利用训练好的模型对验证集图片进行检测,如图2所示,能够准确识别画面中所出现的工作人员是否佩戴了安全帽,以及是否穿着工作服。若正确佩戴安全帽且穿着工作服,则不出现提示信息,使用绿框框出工作人员;若错误佩戴或未佩戴安全帽,则使用黄框框出对应工作人员头部,并使用“Helmet”在头部进行标注;若未穿着工作服,则使用黄框框出对应工作人员,并使用“Dress”在头部进行标注。

       

图2  效果展示

       

       
2  FPGA加速器设计        

       
2.1  量化方案        

       
神经网络的训练一般采用浮点数进行计算,然而浮点运算在硬件平台上的实现比定点计算更加复杂,运算效率更低。为减少硬件资源消耗,提高系统推理速度,对YOLOv4-tiny模型进行8bits对称线性量化。对称线性量化具有高效、易于硬件实现的优势,其具体量化公式为

       


       
2.2  系统架构设计        

       
系统架构如图3所示。CPU负责统筹协调任务并发送指令。PL端主要负责YOLOv4-tiny网络的加速实现。由于片上存储资源有限,采用片外数据方向寄存器(data direction register, DDR)协同存储数据。

       

图3  系统架构

       
PL端可通过配置直接存储器访问(direct memory access, DMA)实现输入输出数据的传输。指令存储于随机块存储器(block random access memory, BRAM),其中包括操作模式、配置参数、存储位置等指令。

       
Command Analyzer作为核心控制模块,负责解析指令,并输出相应的控制信号。池化模块、上采样模块、卷积模块等计算单元,从输入缓冲区读取输入特征图,利用数字信号处理(digital signal processing, DSP)资源进行相应计算,中间数据缓存于输出缓冲区,计算完成后进行量化、激活,最终存入输入缓冲区。

       
2.3  加速器优化设计        

       
YOLO网络经历多次的卷积和池化层,其中包含大量的重复循环操作,因此需对数据排布与存储、计算过程等方面进行优化与改进。本文考虑采用并行展开与流水线技术来提高并行度,增加系统吞吐量。并行展开是一种用面积换速度的设计方法,通过在硬件上重复设计多个计算单元,可以实现一定数量计算单元的并行运算。

       
卷积优化架构如图4所示,卷积过程中,考虑到随着网络层数的增加,特征图尺寸越来越小,而通道数越来越大,故若直接按照特征图宽度和高度进行并行展开,当宽度和高度小于并行度时则无法充分利用重复设计的硬件单元,造成资源的浪费且无法达到加速的目的。因此选择对输入通道及输出通道进行并行展开。充分利用DSP资源,提高系统并行度,从而增大系统吞吐量。

       

图4  卷积优化架构

       
流水线技术广泛运用于硬件架构设计中,它可以缩短运行周期并有效提升系统效率。本文对循环中的任务采取流水线技术优化,将原有卷积操作进行细分,以周期为单位细分读数据、乘法、累加、写数据等操作,使每个环节在每个周期都可以有连续的输入与输出。以卷积中的累加操作为例,如图4中PE所示,通过加法器树的设计,使每个周期并行展开的乘法结果都可以开始累加操作而不互相依赖,从而实现流水线设计。

       

       
3  结果与分析        

       
为了评估本文的优化策略,使用Xilinx公司的ZCU102开发板进行验证。性能评估见表2,DSP资源主要用于进行乘法运算,BRAM资源主要用于存储输入图片、权重、量化参数等数据。为了提升并行度、加快检测速度,各逻辑模块消耗了较多的触发器和查找表(look up table, LUT)资源。

       
系统时钟频率150MHz的情况下,整体平均性能达到228十亿次运算/秒(giga operations per second, GOPS),峰值性能达到307GOPS,系统实现每秒传输帧数(frames per second, FPS)为68的检测速度。 

       

表2  性能评估

       
 
4  结论        

       
本文针对当下配电站存在的缺陷及其需求,设计了一套基于FPGA的智能配电站安防巡检系统。

       
通过YOLOv4-tiny网络实现安全帽佩戴检测、工作服着装检测、越界预警识别等功能,达到了危险预警和异常告警的目的。在ZCU102 FPGA开发板上进行了加速器的实现与优化,通过并行展开及流水线操作两方面进行加速优化,最终实现68FPS的检测速度,整体平均性能达到228GOPS,峰值性能可达307GOPS。

       
考虑到配电网络结构庞大多变,配电站环境较为复杂,可通过增加、修改数据集,利用神经网络的自学习、自适应能力,重新训练获得网络模型,并更新硬件系统相关参数本,以适应新场景的需求。

       
因此,本文提出的解决方案具备较强的通用性,能够大幅降低整个电力网络在配电站环节针对安防巡检的投入成本,并有效提高整个电力网络的运行效率,最大限度保障人员、设施安全,为配电站安防巡检的智能化发展提供参考。

全部回复(0 )

只看楼主 我来说两句抢沙发
这个家伙什么也没有留下。。。

成套电气设备

返回版块

15.96 万条内容 · 592 人订阅

猜你喜欢

阅读下一篇

高压电容器柜的结构

求套高压电容器柜的结构图

回帖成功

经验值 +10