针对传统安全管理主要依赖人工监控与事后处理、效率低下且难以及时发现异常行为的问题,设计了一套多模态智能安全管理系统。该系统主体由基于华为Atlas 200I DK A2开发套件运行的视觉识别算法、基于单片机的语音报警装置及配套软件构成。通过视觉处理算法与音频关键词检测实现行为智能识别,当发生危险情况时,可经软件自动将信息及时反馈给管理人员,有效保障现场人身安全。针对视觉算法部分,通过优化YOLOv5(You Only Look Once version 5)网络结构,引入CA(Coordinate Attention)注意力机制以增强对小目标与复杂场景的检测能力,并修改损失函数,添加对EIoU(Efficient IoU)损失函数的支持,使模型更好地适应场景变化,从而实现对打架与摔倒行为的高效识别。实验结果表明,本方法在多种场景下的平均精度均值(mAP@0.5)均有明显提升,检测速度满足实时性要求,可为公共场所的安全管理提供智能化解决方案。