AlphaEvolve 和 AdaEvolve 介绍与对比
一、AlphaEvolve1.1 基本信息AlphaEvolve是 Google DeepMind 于 2025 年 5 月发布的进化式编码智能体evolutionary coding agent2026 年 5 月发布了影响力更新报告。其核心是将大语言模型LLM的代码生成能力与进化算法结合通过生成→测试→评分→进化的循环自动发现数学、算法和工程领域的新解。1.2 技术架构AlphaEvolve 的工作流程如下生成Generate使用 Gemini 2.0 Flash快速生成或 Gemini 2.0 Pro深度探索生成候选代码测试Test自动评估器执行代码验证正确性和性能评分Score根据预定义指标速度、精度、资源占用等打分进化Evolve保留高分解由 LLM 进行语义有意义的变异重构循环、替换算法、调整数据结构进入下一轮迭代系统维护一个候选程序数据库将历史优秀解作为上下文输入 LLM实现持续改进。1.3 关键成就领域具体成果数学发现 4×4 复数矩阵乘法仅需48 次标量乘法打破了 1969 年 Strassen 算法以来的 56 年纪录此前为 49 次或 128 次数据中心为 Google Borg 调度系统开发新启发式算法回收0.7%全球计算资源AI 训练优化矩阵乘法 kernelGemini 训练加速23%FlashAttention 加速32.5%芯片设计提出 TPU 算术电路 Verilog 重写方案减少不必要比特已纳入下一代 TPU 设计基因组学改进 DeepConsensus DNA 测序纠错模型变异检测错误减少30%电力网格将 GNN 可行性从14% 提升至 88%量子计算量子电路建议误差降低10 倍与 Google Willow 处理器相关1.4 独特价值递归自改进AlphaEvolve 优化了训练 Gemini 的 pipeline形成AI 改进 AI的闭环生产级部署已在 Google 全球基础设施运行超过 1 年人类可解释生成的代码简洁可读工程师可直接审查、调试和部署闭源仅发布白皮书无开源代码但社区已有 OpenEvolve、CODEEVOLVE 等复现二、AdaEvolve2.1 基本信息AdaEvolve是 UC BerkeleyMert Cemri、Ion Stoica、Matei Zaharia、Alexandros Dimakis 等于2026 年 2 月发表的学术研究框架论文标题为“AdaEvolve: Adaptive LLM Driven Zeroth-Order Optimization”arXiv:2602.20133。它并非 Google DeepMind 的项目而是学术界对 AlphaEvolve 范式的改进和扩展。2.2 核心创新三层自适应架构AdaEvolve 将 LLM 驱动的进化搜索形式化为层次化动态优化问题引入三个耦合的自适应层级Level 1 — 局部适应Local Adaptation在每个子种群island内部根据累积改进信号G t ( k ) G_t^{(k)}Gt(k)​动态调节探索强度改进大时增加开发exploitation改进停滞时增加探索exploration信号计算为归一化改进的指数移动平均G t ( k ) ρ ⋅ G t − 1 ( k ) ( 1 − ρ ) ⋅ ( δ t ( k ) ) 2 G_t^{(k)} \rho \cdot G_{t-1}^{(k)} (1-\rho) \cdot (\delta_t^{(k)})^2Gt(k)​ρ⋅Gt−1(k)​(1−ρ)⋅(δt(k)​)2Level 2 — 全局适应Global Adaptation使用**多臂老虎机Multi-Armed Bandit**动态分配计算资源到不同子种群引入全局归一化机制评估改进时相对于全局最优解而非局部历史防止资源浪费在局部最优的虚假进步上Level 3 — 元指导Meta-Guidance当数值适应不足以突破停滞时触发System 2干预LLM 不再变异具体代码而是生成高级解题策略如引入连续优化或尝试样条平滑从根本上改变搜索方向2.3 关键成就测试集规模结果数学优化6 个问题全部达到或匹配最优已知解包括 AlphaEvolve 的结果ADRS 系统基准7 个系统优化任务全部达到人类竞争力或更优Frontier-CS172 个开放算法设计问题相比单模型 GPT-5平均性能提升3 倍总计185 个问题使用相同超参数完成所有测试2.4 独特价值零手动调参用户仅需提供 LLM 名称和迭代次数无需 per-task 调参开源学术论文已发表代码开源自适应哲学借鉴连续优化中的 Adam/AdaGrad 思想将梯度矩估计迁移到离散程序搜索空间通用性验证在 185 个完全不同的问题上使用同一套超参数证明鲁棒性三、两者关系与对比维度AlphaEvolveAdaEvolve机构Google DeepMindUC Berkeley定位工业级生产系统学术研究框架开源❌ 闭源✅ 开源自适应单层进化循环三层自适应局部全局元LLM 使用Gemini 组合Flash/ProGPT-5, Gemini-3-Pro实验性用户配置需定义评估函数仅需 LLM 名和迭代数生产验证Google 全球基础设施学术基准测试数学突破4×4 矩阵乘法 56 年突破匹配 SOTA但未发现全新纪录系统优化Borg 调度、FlashAttentionADRS 基准 7/7 达标芯片设计TPU Verilog 优化未测试AI 自改进优化自身训练 pipeline未测试四、总结AlphaEvolve是从 0 到 1的标杆证明了 LLM 进化算法可以产生真正的科学发现和工业级优化已在 Google 生产环境创造数亿美元级价值。其闭源特性使其成为行业护城河。AdaEvolve是从 1 到 N的学术推进将 AlphaEvolve 的启发式进化循环升级为理论化的自适应优化框架解决了如何自动调参和如何避免局部最优的关键问题并以开源形式回馈社区。两者共同标志着LLM 驱动的自动化算法发现从概念验证走向实用化正在重塑数学研究、系统优化和芯片设计的范式。

相关新闻

题解:洛谷 B4557 [GESP202606 四级] 扫雷

题解:洛谷 B4557 [GESP202606 四级] 扫雷

【题目来源】 洛谷:B4557 [GESP202606 四级] 扫雷 - 洛谷 【题目描述】 小杨同学正在游玩经典游戏「扫雷」,他想自己生成一个「扫雷」的地图。 小杨同学希望生成的地图大小为 nnn 行 mmm 列,一共 nmn \times mnm 个区块。区块行号为 1,2,…

2026/7/5 3:36:35阅读更多 →
借助 Clay 编写 不可思议 的 c# 代码

借助 Clay 编写 不可思议 的 c# 代码

不过借助 CodePlex 上的一个开源项目 Clay,我们可以写出以下不可思议的代码: var directory New.Array(New.Person(FirstName: "Louis",LastName: "Dejardin",Aliases: new[] { "Lou" }),New.Person(FirstName: "B…

2026/7/5 3:36:35阅读更多 →
在Ubuntu系统上为Android交叉编译OpenSSL

在Ubuntu系统上为Android交叉编译OpenSSL

在Ubuntu系统上为Android交叉编译OpenSSL(以OpenSSL 3.5.7为例)需要配置好Android NDK环境,并使用OpenSSL自带的配置脚本进行编译。 选取OpenSSL版本,可以在官网查看:https://openssl-library.org/source/&#xff0c…

2026/7/5 3:36:35阅读更多 →
SOA与DDD的定义

SOA与DDD的定义

SOA与DDD都是常用的系统架构,但两者之间所针对的核心是不同的。 SOA(面向服务架构)由Gartner 在1996年提出来,它是一种分布式的软件架构,它可以根据需求通过网络对松散耦合的粗粒度应用组件进行部署、组合和使用。简单…

2026/7/5 4:56:39阅读更多 →
【Bug已解决】OpenClaw 报错 Error: Cannot find module ‘@larksuiteoapi/node-sdk‘ 解决方案

【Bug已解决】OpenClaw 报错 Error: Cannot find module ‘@larksuiteoapi/node-sdk‘ 解决方案

【Bug已解决】OpenClaw 报错 Error: Cannot find module larksuiteoapi/node-sdk 解决方案 1. 问题描述 给 OpenClaw 配置接入飞书(Lark)渠道后,启动服务时遇到模块加载失败: Error: Cannot find module larksuiteoapi/node-sdk R…

2026/7/5 4:56:39阅读更多 →
基于JEPA框架的轻量世界模型LeWorldModel:1GB显存实现AI环境预测

基于JEPA框架的轻量世界模型LeWorldModel:1GB显存实现AI环境预测

🚀 30款热门AI模型一站整合,DeepSeek/GLM/Qwen 随心用,限时 5 折。 👉 点击领海量免费额度 在探索人工智能的前沿领域时,我们常常被那些需要海量算力和显存的复杂模型所困扰。近期,一个名为 LeWorldMod…

2026/7/5 4:56:39阅读更多 →
数据转换过程

数据转换过程

前面已经解释了DTO的作用,但实现领域对象与DTO之间的转换是一件复杂的事件,因此可以建立一个数据转换器实现此功能。 在平常的工作里,不太多会把“订单管理系统”做成SOA的模式,因为在分布式系统中,数据的格式与定义大…

2026/7/5 4:56:39阅读更多 →
领域层的服务

领域层的服务

在第二节已基本介绍过服务的作用了,领域层服务的作用主要是为了解决业务上的逻辑问题,更多的时候,服务是一个与业务相关的动作。比如在上述例子中: 在Order表里记录的是每次交易的过程,每次商品的送货费(F…

2026/7/5 4:56:39阅读更多 →
LitCAD:15分钟从零基础到二维CAD绘图高手

LitCAD:15分钟从零基础到二维CAD绘图高手

LitCAD:15分钟从零基础到二维CAD绘图高手 【免费下载链接】LitCAD A very simple CAD developed by C#. 项目地址: https://gitcode.com/gh_mirrors/li/LitCAD 想要掌握专业级的CAD绘图技能,却担心软件复杂、学习曲线陡峭?LitCAD正是为…

2026/7/5 4:51:39阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
从GitHub安全案例解析常见漏洞与防护实践

从GitHub安全案例解析常见漏洞与防护实践

1. 项目概述:从GitHub Trending看安全实战 最近在GitHub Trending上看到一个项目,叫 skills4/skills ,它因为一些安全漏洞案例被大家讨论。这其实是一个挺典型的场景:一个旨在展示或教授某种技能的仓库,本身却成了安…

2026/7/5 0:01:08阅读更多 →
MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

MLT 2026启示:因果推理与概率建模驱动下一代LLM应用

# MLT 2026启示:因果推理与概率建模驱动下一代LLM应用## 一、背景与挑战:从“黑箱预测”到“可信推理”2026年6月,第7届机器学习与趋势国际会议(MLT 2026)将在悉尼召开。会议议程中,“因果与可解释机器学习…

2026/7/5 0:01:08阅读更多 →
通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

通达OA SQL注入漏洞深度剖析:从手工注入到自动化利用与防御

1. 项目概述与漏洞背景最近在梳理一些历史OA系统的安全风险时,通达OA v11.6版本中的一个老漏洞又进入了我的视线。这个漏洞位于/general/bi_design/appcenter/report_bi.func.php文件中,是一个典型的SQL注入点。虽然这个漏洞的利用方式看起来并不复杂&am…

2026/7/5 0:01:08阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/5 1:30:27阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/5 3:48:10阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/5 3:48:09阅读更多 →