TrafficLLM:用大语言模型做开放集加密流量分析
核心思路加密流量仍会因包大小、时序、方向等统计特征被攻击者识别如判断访问的网站或观看的视频而现实场景要求模型能做“开放集”判断——只识别目标流量其余一律拒识不能像传统闭合集模型那样把所有输入硬塞进已知类别。TrafficLLM 的核心创新是把预训练大语言模型GPT-2、LLaMA-2-7B当作流量特征提取器仅需少量微调就能生成比 CNN、ET-BERT 更具泛化性的特征表示。主要发现LLM 分词器需针对数值序列做适配GPT-2 需在数字间插入空格才能稳定编码LLaMA 默认逐位编码反而不需要插入空格。GPT-2/LLaMA 是解码器架构天然只关注“历史数据点”因果注意力这与真实流量“当前包依赖历史包”的规律吻合而编码器模型 ET-BERT 注意力分散、易过拟合泛化到开放集时表现变差。k-LND 系列开放集分类器整体最稳健明显优于 OpenMax 和背景类方法。LLaMA-2-7B 精度更高但训练/推理开销也显著更大约 6.7 倍训练时间、5.5 倍推理时间GPT-2 是更均衡的性价比选择。结果一览k-LND 最佳 F1数据集ET-BERTGPT-2LLaMA-2-7BCSTNet0.840.930.77AWF0.560.870.86DF0.700.890.90IoT0.690.890.94ISCX0.920.920.94USTC0.870.900.87DC0.810.890.93总体GPT-2 相较 ET-BERT / CNN 平均提升 12.7% / 13.7%LLaMA-2-7B 相较二者提升 17.6% / 21.5%仅 CSTNet 上 ET-BERT 因专属预训练略占优。Paper: https://www.sciencedirect.com/science/article/pii/S1389128625008138

相关新闻

被问了 20 次-该用哪个模型-后,我做了这个决策框架

被问了 20 次-该用哪个模型-后,我做了这个决策框架

前面 7 篇文章测了十几个模型,每篇末尾都给了一张"你的场景 → 选这个"的表格。但不断有读者问我:“我还是不知道选哪个。能不能把所有数据放在一起比?” 可以。这篇文章就是模块一的元分析——汇总 DeepSeek 全家桶、Qwen、GPT-4o…

2026/7/5 9:11:56阅读更多 →
空洞骑士模组管理器终极指南:Scarab如何让MOD安装变得简单快速

空洞骑士模组管理器终极指南:Scarab如何让MOD安装变得简单快速

空洞骑士模组管理器终极指南:Scarab如何让MOD安装变得简单快速 【免费下载链接】Scarab An installer for Hollow Knight mods written with Avalonia. 项目地址: https://gitcode.com/gh_mirrors/sc/Scarab 还在为《空洞骑士》模组安装的复杂流程而头疼吗&a…

2026/7/5 9:06:56阅读更多 →
如何用Scarab模组管理器轻松玩转空洞骑士MOD世界?

如何用Scarab模组管理器轻松玩转空洞骑士MOD世界?

如何用Scarab模组管理器轻松玩转空洞骑士MOD世界? 【免费下载链接】Scarab An installer for Hollow Knight mods written with Avalonia. 项目地址: https://gitcode.com/gh_mirrors/sc/Scarab 还在为空洞骑士模组安装而头疼吗?你是否曾经花费数…

2026/7/5 9:06:56阅读更多 →
3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题

3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题

3步终极指南:用开源工具拯救者工具箱彻底解决C盘空间不足问题 【免费下载链接】LenovoLegionToolkit Lightweight Lenovo Vantage and Hotkeys replacement for Lenovo Legion laptops. 项目地址: https://gitcode.com/gh_mirrors/le/LenovoLegionToolkit 你…

2026/7/5 10:17:01阅读更多 →
改进数值解析法在PCB热建模中的应用与优化

改进数值解析法在PCB热建模中的应用与优化

1. 为什么PCB热建模需要改进的数值解析法?在电子设备小型化与高功率密度化的今天,一块指甲盖大小的PCB上可能集成了数十个发热元件。传统热仿真方法面临两大困境:一是计算资源消耗随元件数量呈指数级增长,二是辐射传热这一非线性因…

2026/7/5 10:17:01阅读更多 →
PCB泪滴设计:提升可靠性的关键技术

PCB泪滴设计:提升可靠性的关键技术

1. PCB泪滴设计:从入门到精通的全面指南在PCB设计领域,泪滴(Teardrop)是一个看似微小却至关重要的设计元素。作为一名有十年经验的PCB设计工程师,我见过太多因为忽视泪滴设计而导致的产品可靠性问题。泪滴是在焊盘与走…

2026/7/5 10:17:01阅读更多 →
ICM-42688-P与MK24FN1M0VDC12在工业运动感知中的协同应用

ICM-42688-P与MK24FN1M0VDC12在工业运动感知中的协同应用

1. ICM-42688-P与MK24FN1M0VDC12的硬件协同价值解析在工业级运动感知系统中,ICM-42688-P作为TDK InvenSense旗下的6轴MEMS惯性测量单元(IMU),其核心优势在于集成了三轴陀螺仪和三轴加速度计,并采用超声波辅助检测技术。实测表明,在…

2026/7/5 10:17:01阅读更多 →
电子产品散热设计:从理论计算到工程实践

电子产品散热设计:从理论计算到工程实践

1. 电子产品散热设计的关键挑战在电子设备小型化与高性能化的双重趋势下,散热设计已成为制约产品可靠性的关键瓶颈。以最新发布的某旗舰手机为例,其SoC芯片峰值功耗已达15W,而内部散热空间不足3cm,热流密度达到传统笔记本电脑的5倍…

2026/7/5 10:17:01阅读更多 →
Graviton5处理器性能提升25%的技术解析与实践

Graviton5处理器性能提升25%的技术解析与实践

1. 为什么Graviton5能带来25%的性能跃升Amazon Graviton5处理器最近在业界引发广泛关注,实测数据显示其能为各类应用带来平均25%的性能提升。这个数字背后是AWS在芯片架构层面的多重创新:1.1 核心架构全面升级Graviton5采用了ARM Neoverse V2核心架构&am…

2026/7/5 10:12:00阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/5 1:30:27阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/5 3:48:10阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/5 3:48:09阅读更多 →