【计算机科学与应用】基于Mask R-CNN的近海漂浮垃圾智能识别与清理路径规划系统
导读针对近海漂浮垃圾人工清理效率低、成本高和风险大的问题本文设计了一套基于Mask R-CNN的智能检测与清理路径规划系统。系统采用Roboflow海洋垃圾数据集包含11类目标、10,000张图像和56,272个标注实例基于ResNet-50-FPN的Mask R-CNN实现目标检测与实例区域分割并将清理路径建模为非闭合旅行商问题采用最近邻贪心算法与2-opt局部搜索进行优化。实验结果表明模型在验证集上的边界框AP为53.50%掩码AP为 52.05%路径规划算法在200个目标规模下耗时约181.8 ms路径长度缩短约10.5%。同时本文开发了Web与桌面双模态可视化系统实现了图像输入、目标检测、路径规划和结果展示的原型化闭环流程为近海漂浮垃圾智能识别与自动化清理提供了实验基础。作者信息Mask R-CNN海洋垃圾检测实例分割路径规划深度学习论文详情本文开发的近海漂浮垃圾智能识别系统采用分层模块化架构自下而上分为数据采集层、模型推理 层、路径规划层和可视化展示层四个层次各层之间通过定义良好的接口进行通信系统总体架构如图 1 所示。算法处理流程如图 2 所示。本文基于该数据集经筛选合并确定 11 类检测目标(见表 1)兼顾了材质性和功能性两个维度。数据集按 7:2:1 划分(见表 2)。本文采用 Mask R-CNN作为基础检测框架具体实现基于 Detectron2 框架。模型以 ResNet50为骨干网络提取图像特征结合特征金字塔网络(FPN)构建多尺度特征表示。采用最近邻贪心算法构建初始可行解(Algorithm 1)时间复杂度 O(N2 )。为说明选择 Mask R-CNN 作为检测模型的理由本文将 Mask R-CNN 与当前主流目标检测算法进行对比分析结果如表 3 所示。为进一步定量比较不同模型的检测性能本文在相同数据集和训练设置下分别训练 Faster R-CNN 与 Mask R-CNN 模型并在验证集上使用 COCO 评估标准进行评测结果如表 4 所示。Mask R-CNN 模型共迭代 18,000 次。训练过程中损失函数和正确率的变化曲线如图 3 所示。从表 10 可以得出(1) 计算效率高——200 目标下总耗时(贪心初始化 2-opt 优化)约 181.8 ms其 中 2-opt 优化阶段耗时约 99.5 ms(2) 2-opt 效果显著——改善率随目标数量增大在 N 100 时达到饱和 约 10.5%(3) 路径长度呈亚线性增长算法在大规模场景下保持良好规划质量(4) 后续工作需在更多 随机初始条件下进行统计测试以进一步验证算法的稳定性。路径规划算法的性能对比结果如图 5 所示。本文针对近海漂浮垃圾清理的实际需求设计并实现了一套基于 Mask R-CNN 的智能检测与清理路 径规划系统。该系统通过数据采集层、模型推理层、路径规划层和可视化展示层的分层架构实现了从 图像输入、自动检测到路径规划的全流程智能化闭环。系统提供了 Web 端和桌面端双模态交互界面在 GPU 环境下端到端处理时间不超过 5 秒能够完成静态图像条件下的垃圾目标检测、实例区域分割和路 径规划结果展示为后续面向真实水域场景的动态感知与清理系统开发提供了原型基础。基金项目上海海事大学 2025 市级大学生创新创业训练计划项目(项目编号S20250605)原文链接https://doi.org/10.12677/csa.2026.166234

相关新闻

AI工具2026:专业Figma插件与网页端UI设计测评

AI工具2026:专业Figma插件与网页端UI设计测评

说实话,做设计这行十几年了,我见过太多号称能“颠覆行业”的工具,最后大多雷声大雨点小。但2026年这波AI原型工具,确实让我感觉不一样了。它们不再是那种只能改改文案、换换图片的“伪AI”,而是真的能理解你的设计意图…

2026/7/2 6:54:00阅读更多 →
推荐 3 个 Vibe Coding 中文开源教程,从入门到实战

推荐 3 个 Vibe Coding 中文开源教程,从入门到实战

Vibe Coding 最近一年都很火,最近一个月更是强势扩散到了非程序员圈子里,普及率越来越高了! 这个词最早由 Andrej Karpathy 在 2025 年 2 月提出。我们可以把它概括为一种自然语言驱动的 AI 辅助开发方式:你描述目标,…

2026/7/2 6:54:00阅读更多 →
【限时开源】我们沉淀了6年的Gradle多模块最佳实践模板(含自动模块校验脚本、IDEA导入预设配置、跨环境Profile隔离方案),仅开放前200名领取

【限时开源】我们沉淀了6年的Gradle多模块最佳实践模板(含自动模块校验脚本、IDEA导入预设配置、跨环境Profile隔离方案),仅开放前200名领取

更多请点击: https://codechina.net 第一章:Gradle多模块构建的核心价值与演进挑战 在现代Java/Kotlin企业级项目中,Gradle多模块构建已从“可选实践”演变为支撑可维护性、可扩展性与协作效率的基础设施。其核心价值在于通过逻辑解耦实现关…

2026/7/2 6:54:00阅读更多 →
计算机毕业设计之基于机器学习的葡萄酒品质影响因素分析

计算机毕业设计之基于机器学习的葡萄酒品质影响因素分析

本系统旨在通过机器学习技术深入分析葡萄酒品质的影响因素,综合运用Python、MySQL和Django等先进技术,构建了一个高效、智能的分析平台。系统首先利用Python进行数据预处理和特征工程,提取影响葡萄酒品质的关键特征;随后&#xff…

2026/7/2 8:14:05阅读更多 →
Jasmine测试报告器终极配置:JUnit、TeamCity与桌面通知集成指南

Jasmine测试报告器终极配置:JUnit、TeamCity与桌面通知集成指南

1. 项目概述:为什么你需要这份终极配置指南?如果你正在用 Node.js 写后端服务或者前端逻辑,并且已经引入了 Jasmine 作为你的 BDD(行为驱动开发)测试框架,那么jasmine-node这个命令行工具大概率是你的老朋友…

2026/7/2 8:14:05阅读更多 →
IDEA接口抽取效率提升400%的秘密:基于AST语法树的智能提取算法解析(附可复用的Live Template模板)

IDEA接口抽取效率提升400%的秘密:基于AST语法树的智能提取算法解析(附可复用的Live Template模板)

更多请点击: https://kaifayun.com 第一章:IDEA接口抽取效率提升400%的秘密:基于AST语法树的智能提取算法解析(附可复用的Live Template模板) IntelliJ IDEA 默认的 Extract Interface 功能依赖符号表与简单类型推导&…

2026/7/2 8:14:05阅读更多 →
2026国内工业数字孪生与工业仿真企业TOP5:工业深度、预测性运维与智能闭环分析

2026国内工业数字孪生与工业仿真企业TOP5:工业深度、预测性运维与智能闭环分析

2026年,工业数字孪生正在从“可视化展示”进入“工业深度应用”阶段。企业选型时,不能只看三维场景是否精细,也不能只看大屏效果是否震撼,更应关注平台是否具备工业建模、仿真推演、预测性运维、数据融合和业务闭环能力。从行业趋…

2026/7/2 8:14:05阅读更多 →
Win11Debloat终极指南:一键清理Windows系统垃圾,性能提升51%的完整教程

Win11Debloat终极指南:一键清理Windows系统垃圾,性能提升51%的完整教程

Win11Debloat终极指南:一键清理Windows系统垃圾,性能提升51%的完整教程 【免费下载链接】Win11Debloat A simple, lightweight PowerShell script that allows you to remove pre-installed apps, disable telemetry, as well as perform various other …

2026/7/2 8:14:05阅读更多 →
3步配置专业级AI视频处理:OBS背景移除插件完整指南

3步配置专业级AI视频处理:OBS背景移除插件完整指南

3步配置专业级AI视频处理:OBS背景移除插件完整指南 【免费下载链接】obs-backgroundremoval An OBS plugin for removing background in portrait images (video), making it easy to replace the background when recording or streaming. 项目地址: https://git…

2026/7/2 8:09:05阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/1 4:42:14阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/1 5:19:01阅读更多 →
塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧

塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧

塞尔达传说旷野之息存档修改器:3分钟掌握海拉鲁世界自由定制技巧 【免费下载链接】BOTW-Save-Editor-GUI A Work in Progress Save Editor for BOTW 项目地址: https://gitcode.com/gh_mirrors/bo/BOTW-Save-Editor-GUI 想在《塞尔达传说:旷野之息…

2026/7/2 0:03:01阅读更多 →
告别 AccessKey:多云平台 CLI OAuth 免密认证完全指南

告别 AccessKey:多云平台 CLI OAuth 免密认证完全指南

在本地开发环境使用云厂商 CLI 时,传统的 AccessKey(AK)方式需要手动创建、下载和保管密钥,不仅繁琐,还存在泄漏风险。其实,主流云平台都已提供基于 OAuth 2.0 的免密认证方案,让开发者可以通过浏览器登录一次性完成授权,CLI 自动管理临时凭证的刷新,兼顾了便利与安全…

2026/7/2 0:03:01阅读更多 →
基于13DOF传感器与PIC32MZ的高精度嵌入式导航系统设计

基于13DOF传感器与PIC32MZ的高精度嵌入式导航系统设计

1. 项目背景与核心价值在嵌入式系统开发领域,高精度定位与导航一直是极具挑战性的技术方向。传统方案往往面临成本、精度和实时性难以兼顾的困境。这个项目通过13DOF(13自由度)传感器组合与PIC32MZ2048EFH100高性能MCU的协同工作,…

2026/7/2 0:03:01阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/2 0:33:58阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/2 1:32:11阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/2 1:50:13阅读更多 →