本文分类:news发布日期:2026/4/28 2:36:30
相关文章
计算机使用代理技术:从视觉理解到自动化实践
1. 计算机使用代理的演进历程 计算机使用代理(Computer-Use Agents)的发展并非一蹴而就,而是经历了从概念验证到主流应用的完整技术演进。2016年OpenAI发布的Universe平台首次尝试让AI通过虚拟键盘和鼠标控制应用程序,但受限于当时…
建站知识
2026/4/28 2:35:43
记录博客第一天以及将会更新的内容
南京大学大三电子专业大fw一枚。苦于学习缺少自我驱动力和长期规划,打算在博客更新我的学习和探索动态>_
这个学期在学习计院的操作系统和计算机体系结构,同时承担了一项项目制课程学习并且尝试投递嵌入式Linux的…
建站知识
2026/4/28 2:35:43
等了 15 个月,DeepSeek V4 终于来了——我只想说:黄仁勋的噩梦成真了
1.6 万亿参数 百万上下文标配 打到2毛钱 跑在华为芯片上
全球 AI 圈,
先说结论:这次 V4 的发布,有三件事让我睡不着
第一件:百万 token 上下文,从"高端奢侈品"变成"全系标配"。
一年前&…
建站知识
2026/4/28 2:35:43
DSMC架构:为OpenClaw智能体构建外部大脑,解决长会话失忆问题
1. 项目概述:为OpenClaw智能体构建一个“外部大脑”如果你正在使用OpenClaw构建或运行智能体,并且遇到过这样的情况:一个运行了几个小时的对话,智能体突然忘记了你在对话开始时明确设定的核心规则;或者你明明在中间纠正…
建站知识
2026/4/28 2:35:43
多模态大语言模型与扩散变换器的融合架构设计与优化
1. 多模态大语言模型与扩散变换器的技术背景在人工智能领域,多模态大语言模型(MLLM)和扩散变换器(DiT)代表了当前最前沿的技术发展方向。MLLM能够同时处理和理解文本、图像、视频等多种模态的数据,突破了传…
建站知识
2026/4/28 2:34:48
视觉推理与文本到图像生成的技术演进
1. 视觉推理与文本到图像生成的技术演进视觉推理作为计算机视觉领域的核心技术,近年来经历了从静态图像分析到动态时序建模的范式转变。传统方法主要依赖单帧图像的语义分割和对象检测,而现代视频模型通过Chain-of-Frame(CoF)机制…
建站知识
2026/4/28 2:34:48
迈威生物明日上市:发行价27.64港元 面临破发风险 年亏9.7亿
雷递网 雷建平 4月27日迈威(上海)生物科技股份有限公司(简称:“迈威生物”,股票代码:“02493”)将于明日在港交所上市,发行价为27.64港元。迈威生物发行区间为27.64港元到30.71港元,此次发行价位…
建站知识
2026/4/28 2:33:50
wllama实战:基于WebAssembly在浏览器本地运行大模型
1. 项目概述:在浏览器里跑大模型,wllama 到底是怎么做到的? 最近在折腾前端 AI 应用,一个绕不开的痛点就是推理服务。要么得自己搭个后端,配 GPU 服务器,成本高、延迟大;要么就得调用第三方 AP…
建站知识
2026/4/28 2:33:44

