TrafficLLM：用大语言模型做开放集加密流量分析-拓冰网站优化

核心思路加密流量仍会因包大小、时序、方向等统计特征被攻击者识别如判断访问的网站或观看的视频而现实场景要求模型能做“开放集”判断——只识别目标流量其余一律拒识不能像传统闭合集模型那样把所有输入硬塞进已知类别。TrafficLLM 的核心创新是把预训练大语言模型GPT-2、LLaMA-2-7B当作流量特征提取器仅需少量微调就能生成比 CNN、ET-BERT 更具泛化性的特征表示。主要发现LLM 分词器需针对数值序列做适配GPT-2 需在数字间插入空格才能稳定编码LLaMA 默认逐位编码反而不需要插入空格。GPT-2/LLaMA 是解码器架构天然只关注“历史数据点”因果注意力这与真实流量“当前包依赖历史包”的规律吻合而编码器模型 ET-BERT 注意力分散、易过拟合泛化到开放集时表现变差。k-LND 系列开放集分类器整体最稳健明显优于 OpenMax 和背景类方法。LLaMA-2-7B 精度更高但训练/推理开销也显著更大约 6.7 倍训练时间、5.5 倍推理时间GPT-2 是更均衡的性价比选择。结果一览k-LND 最佳 F1数据集ET-BERTGPT-2LLaMA-2-7BCSTNet0.840.930.77AWF0.560.870.86DF0.700.890.90IoT0.690.890.94ISCX0.920.920.94USTC0.870.900.87DC0.810.890.93总体GPT-2 相较 ET-BERT / CNN 平均提升 12.7% / 13.7%LLaMA-2-7B 相较二者提升 17.6% / 21.5%仅 CSTNet 上 ET-BERT 因专属预训练略占优。Paper: https://www.sciencedirect.com/science/article/pii/S1389128625008138

TrafficLLM：用大语言模型做开放集加密流量分析

相关新闻

被问了 20 次-该用哪个模型-后，我做了这个决策框架

空洞骑士模组管理器终极指南：Scarab如何让MOD安装变得简单快速

如何用Scarab模组管理器轻松玩转空洞骑士MOD世界？

3步终极指南：用开源工具拯救者工具箱彻底解决C盘空间不足问题

改进数值解析法在PCB热建模中的应用与优化

PCB泪滴设计：提升可靠性的关键技术

ICM-42688-P与MK24FN1M0VDC12在工业运动感知中的协同应用

电子产品散热设计：从理论计算到工程实践

Graviton5处理器性能提升25%的技术解析与实践

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

从GitHub安全案例解析常见漏洞与防护实践

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

YOLOv8推理性能优化：从1.2FPS到35FPS的全链路加速实践

Coze与Dify对比指南：低代码AI应用开发从入门到实战

AI生图工具怎么选？2026年6月版实测对比