基于YOLO与大语言模型的物流系统仿真快速建模方法及其应用

发布时间:2026-02-26 22:11  浏览量:1

摘要

:物流系统仿真作为优化生产流程与辅助管理决策的重要工具,对提升产能具有关键作用。然而,现有仿真建模方法普遍依赖人工操作,不仅耗时费力,还易受建模人员经验限制,难以满足复杂场景下的快速迭代需求。针对该问题,本文提出一种基于You Only Look Once(YOLO)目标检测与大语言模型的仿真快速建模方法。该方法首先利用YOLOv10目标检测模型对计算机辅助设计(Computer Aided Design,CAD)图纸进行智能识别,提取工位、传送带等关键组成要素的类别与位置信息;随后,通过坐标转换与设备类型映射等数据处理,并结合自动化建模代码在仿真软件中生成包含精确物理布局和物料流连接的静态模型;最后,基于大语言模型将工艺逻辑转化为仿真代码,并通过人工参数配置形成完整仿真模型。某电商装箱线仿真项目案例验证表明,该方法在保证仿真准确性的同时,能够显著提升建模效率。

关键词:

物流系统仿真;离散事件仿真;快速建模;图纸识别;大语言模型

物流系统作为承载生产活动的核心单元,其建模与仿真能力已成为推动企业柔性生产和精益管理的重要工具。通过仿真建模,企业能够在虚拟环境中完成布局优化、物流流向分析、产能预测及瓶颈诊断,从而降低试错成本、缩短投产周期。然而,在实际应用中,物流系统仿真建模过程往往面临可及性高和时效性不足的问题。可及性高主要体现在两个方面:其一,传统建模方法依赖于人工解读计算机辅助设计(Computer Aided Design, CAD)图纸与工艺文档,并在仿真软件中手动构建模型,对人员的专业知识和经验要求较高;其二,仿真建模通常为迭代过程,随着方案验证与优化推进,模型需频繁修改更新,这一过程延长了建模周期,推高了人力与时间成本。而时效性不足则源于当前产品更新速度不断加快,物流系统需频繁调整以适配生产需求的变化。依赖人工构建的定制化仿真模型往往难以快速响应此类变动。最终导致前期投入大量资源所建的仿真模型迅速失效,使用周期缩短,制约了仿真技术在实际生产中的持续应用价值。

针对上述问题,本文提出一种集成You Only Look Once(YOLO)目标检测与大语言模型的仿真快速建模方法,以实现从CAD图纸到完整仿真模型的智能化快速构建。该方法首先利用YOLOv10目标检测模型对CAD图纸中关键组成要素进行高精度识别;并通过数据转换和预置的自动建模代码模块,生成包含基础物理布局和物料流链接的仿真模型框架;最后,基于检索增强生成流(Retrieval-Augmented Generation Flow, RAGflow)框架驱动大语言模型,将自然语言工艺描述转化为可执行的仿真逻辑代码。操作人员仅需对仿真逻辑代码进行配置及设备参数赋值,即可完成仿真模型的构建。

本文的研究工作主要包括以下三方面:第一,对物流系统关键要素及建模需求进行描述,阐述目标检测模型与大语言模型在建模中的应用基础;第二,设计基于YOLOv10与大语言模型的快速建模方法,包括CAD图纸识别模块、静态模型生成模块及工艺逻辑生成模块;第三,通过某电商装箱线仿真项目案例,验证了所提出方法在建模效率与准确性方面的优势。研究结果表明,该方法能够有效解决传统建模方式耗时长、技术门槛高的问题,为物流系统仿真提供了一种具备普适性的快速建模解决方案。

一、

仿真快速建模关键技术

物流系统仿真是一种基于模型的系统分析方法,它通过构建物流系统的虚拟模型,模拟系统在实际生产中的动态行为与运行逻辑。其核心作用在于为物流系统的设计、优化与决策提供量化依据。具体而言,仿真能够在不干扰实际运营的前提下,精确评估系统性能(如产能、吞吐时间、资源利用率),并比较不同调度策略或布局方案的优劣。在实际应用中,复杂系统往往需要快速迭代与验证,传统人工建模难以满足需求,迫切需要更高效的仿真快速建模技术。

近年来,目标检测技术和大语言模型的高速发展为仿真快速建模提供了新的解决思路。其中,目标检测为图纸信息的自动化提取提供支持,而大语言模型则展现出将自然语言转化为工艺逻辑的潜力。

1.YOLOv10目标检测模型

YOLO系列模型是目标检测领域的主流算法,YOLOv10在检测精度与速度上达到了较好的平衡,适合工程应用场景。本研究利用改进的YOLOv10对CAD图纸进行识别,提取图纸中的工位、传送带、转盘、货架、机械臂等关键要素的位置与类别信息,为后续仿真模型的自动化构建提供输入。YOLOv10 CAD图纸识别如图1所示。

图1 YOLOv10 CAD图纸识别示意图

2.RAGflow框架驱动的大语言模型

大语言模型具备强大的语义理解与生成能力,但在专业任务中容易出现知识缺失问题。RAGflow框架通过集成大语言模型与代码知识库,能够将自然语言的工艺描述自动转化为符合仿真软件语法的逻辑脚本。在本研究中,RAGflow框架驱动下的大语言模型主要用于解析物流系统运作流程,实现从“自然语言工艺逻辑”到“仿真可执行代码”的映射,如图2所示。

图2 工艺逻辑转仿真代码流程图

二、

基于YOLO与大语言模型的快速建模方法

为了克服传统物流系统仿真建模方法中依赖人工、效率低下的问题,本文提出了一种基于YOLOv10与RAGflow框架驱动的大语言模型的仿真快速建模方法。该方法由CAD图纸智能识别模块、静态模型生成模块、工艺逻辑生成模块三部分构成,分别完成组成要素识别、物理布局建模和工艺逻辑转化,从而实现图纸与工艺文件到仿真模型的自动化构建。

1.CAD图纸智能识别模块设计

本阶段针对物流系统的二维CAD布局图纸,采用预训练过的YOLOv10目标检测模型进行分析,精准识别图纸中工位,传送带,机械臂等各类关键元素。YOLOv10目标检测模型输出CAD图纸组成要素的识别边界框左上,右下角位置坐标及类型信息,为下一阶段的静态模型生成模块提供建模依据。

具体流程如下:首先,对CAD图纸进行数据预处理,包括图元提取、图层筛选与分辨率归一化;其次,基于人工标注的数据集训练YOLOv10模型,使其能够识别出工位(车床、机床等)、传送带、转盘、货架、机械臂、源点与出货口等关键要素;最后,目标检测模型输出各要素的类别、位置坐标及方向属性。这些识别结果构成了后续静态建模的输入数据,保证了自动化建模的准确性。

2.静态模型生成模块设计

在完成CAD图纸要素识别后,需要将识别结果转化为仿真软件中可直接运行的基础静态模型。静态模型的生成主要包括设备类型映射、坐标转换与布局还原、物料流连接生成三个环节,其核心目标是实现图纸元素向仿真软件建模对象的自动化映射,从而快速形成包含物理布局与物料流链接的虚拟模型。

(1)设备类型映射。

不同CAD图纸中设备元素的表现形式各不相同,但在仿真软件中通常需要抽象为有限的基本实例化对象。因此,需要建立设备类型映射表明确CAD图纸组成要素与Plant Simulation中实例化对象之间的对应关系,具体参见表1。通过这一映射机制,可以保证不同图纸风格下识别到的元素能够被规范化处理,确保模型构建的一致性。

表1 设备类型映射表

(2)坐标转换与布局还原。

CAD图纸采用工程坐标系,而仿真软件通常使用其初始二维或三维场景坐标系。两者在原点位置、比例单位及方向角度上存在差异。因此,需通过坐标转换规则将目标检测模型识别输出的位置信息统一映射到仿真软件坐标系中。该过程包括坐标转换、设备定位、方向计算等调整,将归一化坐标转换为仿真软件坐标。通过该过程,能够准确还原物流系统设备的空间分布与布局关系。坐标转换与设备定位规则参见表2。

表2 坐标转换与设备定位规则

(3)物料流连接生成。

在静态模型构建中,设备之间需要根据实际系统物料输送路径形成逻辑上的物料流连接。即需要基于设备间的空间邻近性与方向属性,自动建立物料流的物理路径。具体核心流程如下:

① 起点选择:

以具有明确方向性的传送带作为遍历起点,依据其方向(水平/垂直)确定输入端与输出端的坐标范围。

② 邻近设备搜索:

在所有其他设备中,查找其边界中心点与传送带输入/输出端中心点的X/Y坐标差值小于阈值(如30像素)的对象。

③ 空间重叠校验:

对初步筛选出的设备,进一步验证其边界范围是否与传送带端口坐标范围存在交集,以确保空间上可连通。

④ 连接关系判定与递归:

若校验通过,则记录该对连接关系,并将下游设备视为新的“源对象”,继续重复上述过程,直至当前链路无法扩展。

⑤ 连接器建立:

遍历所有记录的有效连接关系对,调用Plant Simulation API(例如.Materialflow.Connector.connect)完成设备间物理链接。

3.工艺逻辑生成模块

设计

在完成静态模型的构建后,本阶段基于RAGflow框架,利用大语言模型实现工艺逻辑代码的自动生成。其中,大语言模型采用DeepSeek-R1:14B,Embedding模型采用BGE-Large-ZH-v1.5。如图3所示,该模块主要包括工艺逻辑输入、知识检索增强、逻辑解析与代码生成、人工参数配置四个环节。

图3 工艺逻辑生成模块

(1)工艺逻辑输入。

用户通过自然语言输入工艺规程或流程描述,例如:“零件A先经车床加工,再进入清洗工位,随后经传送带x进入装配工位y”。

(2)知识检索增强。

系统将输入与工艺知识库包含信息进行向量化匹配。筛选多条相关信息片段,并与原始描述一同输入大模型,以提升逻辑生成准确性。

(3)逻辑解析与仿

真代码生成。

大语言模型解析工艺逻辑描述和相关信息片段,生成对应仿真软件逻辑代码。

(4)人工集成与参数配置。

工艺逻辑代码生成后,由操作人员将其集成到基础仿真模型中。此外,考虑到部分工艺参数(节拍、利用率、缓冲容量等)需人工设定,系统提供参数表单供用户快速补充与修改。完成以上四步后,最终形成完整的仿真模型。

三、

应用案例

通过某电商装箱线的实际仿真项目案例,验证基于YOLO与大语言模型的仿真快速建模方法的有效性。

1.某电商装箱线物流动线及流程概述

该装箱线主要由两台机械臂、八个工位、一条主干线传送带以及八条与主干线相连的支路传送带组成。其中,机械臂负责不同订单对应箱体的上下线;主干线传送带负责将箱子输送至各个分流点,系统根据当前箱子所需装入的物料判断是否将其分流转入对应支路传送带。完成物料装箱后,箱子会返回主干线传送带,继续运往下一分流点,直至所有物料装箱作业完毕。具体流程描述如图4所示:

图4 装箱线运作流程图

当订单生产开始时,料箱首先被送至上线机械臂的上线口。系统会检测当前装箱线中正在流转的料箱数量是否已达到最大并发装箱上限。如未达到上限,系统将调度上线机械臂抓取料箱并执行上线操作。料箱上线后,系统为其生成唯一标识条码,关联对应订单信息并规划流转路径。随后,料箱由主干线传送带运送至分流点。分流装置扫描条码,判断该料箱是否需进入当前区域进行装箱作业。若需要,料箱将被引导至支路传送带,并输送至相应装箱工位。在装箱工位,操作人员从流利货架中拣选所需物料进行装箱。若某物料在流利货架中的库存低于安全存储量,系统将触发补货流程。完成装箱后,料箱经支路传送带送回主干线传送带,继续流转至下一分流点。上述流程循环执行,直至订单所有物料装箱完毕。全部装箱作业完成后,料箱经由主干线传送带运抵下线口,系统调度下线机械臂进行抓取并执行下线操作。

2.物理系统仿真

模型

自动化建模

为实现该装箱线仿真建模,首先需要通过YOLOv10目标检测模型进行CAD图纸识别。具体识别效果如图5所示。

图5 识别效果图

在完成CAD图纸的识别后,系统依据前述方法通过静态模型生成模块进行相关处理。首先,在设备类型映射方面。系统根据训练模型时的预定义标签,将YOLOv10识别出的工位、传送带、转盘等对象,统一映射为Plant Simulation中对应的可实例化对象,具体参见表3。

表3 预定义标签

在坐标转换与布局还原方面,系统对YOLOv10输出的边界框信息进行数据转换。具体包括设备建模坐标的确定、长度计算等。转换完成的数据存储在仿真软件数据表中,具体如图6所示。

图6 设备建模数据记录

在物料流连接生成方面,系统根据提取到的传送带方向信息和设备相对位置关系,自动判断设备之间的物料流向,并记录到仿真软件数据表中,如图7所示。全部传送带遍历完成后,系统依据数据表中的记录自动生成设备之间的链接。

图7 链接关系记录

工艺逻辑生成阶段。采用RAGflow框架集成大语言模型,将自然语言工艺描述转化为仿真代码。首先,操作人员以自然语言的形式输入工艺流程说明,例如:“根据当前目标的next属性判断目的地,若next为1,则目的地为Lconveyor,若为2,则前往Rconveyor,若都不是,则目的地为Uconveyor”。RAGflow框架会从知识库中检索出相关代码片段,这些检索结果与自然语言描述一并输入大语言模型。大语言模型经过逻辑推理,自动输出对应的仿真软件代码。问答交互界面如图8所示,大语言模型不仅输出了仿真代码,同时也给出了相关解释以帮助操作人员更好地应用。

图8 工艺逻辑代码输出问答交互界面

最后,操作人员需要将自动生成的代码集成到静态模型中,并填写设备参数,即可形成完整的仿真模型,如图9所示。

图9 仿真模型效果图

3.仿真建模用时与准确率对比分析

(1)建模用时

在仿真建模用时对比方面,人工建模需耗时约2~3天,而本文方法仅需22.15小时,建模周期得到显著缩短。这种高效的建模方法使工程师能够快速构建和调整模型,实现在一天内完成多次“设计—仿真—优化”的完整迭代循环。这为设计前期开展大量虚拟试验提供了可能,帮助企业提前识别与解决潜在问题,从而有效节省材料、加工及测试等方面的高昂成本。

(2)仿真准确率

为验证所建模型的准确性,实验随机生成100个装箱订单,分别在人工构建模型和本文方法构建模型下进行仿真运行,并对比其单位订单生产用时结果,两种方法的运行结果高度一致,差异均控制在合理误差范围内,如图10所示。

图10 案例单位订单生产用时对比

在单位产品生产用时方面,人工搭建模型与本文方法搭建模型的仿真结果对比显示:最大相对误差为0.69%,平均单位产品生产用时相对误差为0.11%,生产100个订单总用时相对误差为0.21%。平均单位订单生产用时与总用时相对误差均小于1%,处于工程实践的可接受范围内,具体可参见表4。

表4 单位产品生产用时具体数据表

综上所述,在整体建模过程中,本文方法较人工建模将建模周期从“天”级缩短至“小时”级,且所建模型的仿真准确率与人工搭建模型相比差异较低。这意味着在实际工程应用中,建模人员能够在更短的时间内完成高质量模型的搭建。更为重要的是,随着建模迭代次数的增加,本方法所带来的时间节约将进一步累积,这使得仿真技术能够真正跟上物流系统快速迭代的步伐,为敏捷、高效的物流系统设计与优化提供了强有力的支撑。

四、

总结

本文针对物流系统仿真建模存在的问题,提出了一种基于YOLOv10与大语言模型的仿真快速建模方法,以实现从CAD图纸到可运行仿真模型的快速、半自动化建模。首先,该方法通过改进的YOLOv10目标检测模型识别CAD图纸中的关键组成要素。其次,通过设备类型映射、坐标转换等数据处理步骤,并结合自动建模代码构建包含物理布局与物料流链接的静态模型。最后,通过RAGflow框架集成大语言模型,将自然语言工艺流程转化为仿真逻辑代码,并经人工集成后形成完整仿真模型。通过实际项目案例验证表明,所提方法在建模效率方面具有显著优势:人工建模需耗时约2~3天,而本方法仅需2.15小时,建模周期大幅缩短;在准确性方面,仿真运行结果与人工构建模型高度一致,验证了本方法的有效性。

本方法为物流系统提供了一种具有普适性的仿真快速建模方案。这使得仿真技术能够快速响应物流系统结构变化,在方案论证、瓶颈分析等场景中实现“快速建模、即时验证”,显著缩短了物流系统的规划、优化与决策周期。此外,当物流系统需要调整时(如布局变更或工艺路线更新),用户只需修改原始CAD图纸或自然语言工艺说明,即可通过本方法快速生成新的模型,而非从头开始重建,极大提升了仿真模型在整个项目生命周期中的可维护性与价值。

【基金项目:国家自然科学基金项目(No. 52075036)】