值得研究的两个AI问题
感觉现在AI还有一系列的问题没有解决我自己关注两大方面。1. 机器创造概念已有的AI算法核心实际上一直都是机器学习。尽管通过这些方法已经产生了很多创新如DeepMind的AlphaTensor发现了新的矩阵乘法算法AlphaFold在蛋白质空间中创造出的表征等。但依然能感受到这些AI依然和人有较大差异。我认为其中最大的差异在于AI的创新都是在已有概念体系内部进行搜索。上面列举的新矩阵乘法新蛋白质的发现都只不过是新的合法排列组合而已充其量算是发现式创新但不是概念创新。新概念必须得是原来从未有过的抽象对概念体系本身进行扩展。1.1 为什么这个问题如此重要因为如果机器不能抽象出新的通用概念那么就无法化简某些问题系统就会因为效率而卡在某个特定的瓶颈。只有当机器能自主完成的概念抽象才能确保系统的规模能脱离人类持续发展这样的AI才能称为AGI。想象一下还在进行以物易物的时代一开始买一头牛可能需要用两头羊来换然后我想要布但你不想要我的牛我们的交易就无法进行。通过反复的交易之后人们发现了可以通过一些物品进行一般等价然后逐渐就出现了价格进而再抽象出了其中的不变量并把他命名为钱。之后整个金融概念便有了飞速发展。如果没有这样的抽象光是资产的转移就会让整个系统卡在分子移动这一瓶颈上可能支撑的交易量也就几万头牛。如今有了金钱概念我们只需要移动电子即可完成上万亿资产的转移。现有的LLM模型通过学习可能会把牛羊马的交易聚集到流形的某个局部但没有任何证据表明它能提炼出钱的这个概念。可能有读者要反驳说通过把高频次的东西进行包装就像是从一个复杂函数里面提取子函数一样总能提炼出一些新概念。钱的概念可能提取不出来但没准能提取出“牛羊马的交易不变量”作为替代概念。我的评价是这确实可以解决一部分抽象的问题但新概念的创造不只是不变量的提炼。这就引出了我想说的第二种概念创造。在权限管理的场景中假设M种权限N个用户。管理员需要分配不同的权限给不同的用户。如果没有抽象没有一键分配的优化管理员需要MN次操作才能完成所有权限的分配。类似印度电线但如果我们抽象出了角色层预先给每种角色分配权限再去分配不同人员有哪些角色即可大幅简化管理员的操作。图谷侵删还有第三个关于概念创造的例子极坐标。拿原点上的圆举例在直角坐标系下的方程至少得学过平方的人才能理解。如果用极坐标只要写 即可非常符合圆本身的定义。换句话来说有一些抽象概念通过换个视角或者说切换坐标系就能把复杂的问题变得非常简单。那么在如今LLM强烈依赖欧氏高维语义流形的前提下它是否能自己发展出通过变换坐标系主动把问题简单化我认为是要加一个大大的问号的。人类有很多对不同行为进行建模的经验但是对于概念的生成依然会认为这像是天启一样的突然浮现也有人认为这就是人类的专属特权。如果能把概念创造的过程进行建模那么就能进行工程化那么自进化的AI必将指日可待。AI的训练就可以变成按需增长先从小模型开始发展然后随着算力的限制机器创造出新的概念支撑出更大规模的活动进而申请更多的资源。对于现有的AI如果一直坚持现有开发路径任由机器不受限制地用大规模参数拟合万物那么AI永远也不能感受到现有概念在使用上的掣肘也就很难创造出新的概念。反观人类在任何新概念创造之前必然是因为感受到了痛点才会有动力进行抽象和创造从而简化自己的理解。1.2 与这个概念有关的两大问题这个问题其实还对应到AI的自我进化上。机器的持续自我学习是个大家都在讨论的问题。然而目前关注的主要是流形如何在推理/使用过程中自动更新。正如上面所说只依赖于单纯的语义流形而没有新维度的产生似乎并不能带来任何新的概念。因此我估计只有当模型的使用能影响模型本身模型对于某个问题的理解累积到一定程度才会有对应的新概念被抽象出来。还有一个强相关的是世界模型。我认为他的核心实际上就是在语义流形以外再训练出不同的流形或者说这就是一个多模态多维度流形。它本质上依然没能和现在的LLM所用的语义流形拉开本质的区别。如果没能自主创造新的抽象概念那么世界模型中流形的数量必将是人为指定依然没法像人那样思考去创造新的抽象。至于说它训练出来的的流形能否经由PDAC循环进行验证那又是另一个问题了。1.3 新概念命名问题在构建完概念以外新概念的命名又成为了另一个重要问题。为什么要把交易过程中的不变量命名为钱中文倾向于表意英文表音两种语言从根子上就是走了两条不一样的路线。新概念在中文和英文中分别要如何命名这些都是需要考虑的问题。对于新概念的命名看似简单但你要考虑到机器创造出来的概念名称不一定会被人类社会所认可。即使是token这样的词汇人类社会都是经历了巨大争议之后依然死守着token不放。那么机器创造出来了新概念后万一人类统一了某种命名机器是否能快速接受而无需重新学习这个新概念1.4 假如成功开发如何验证显而易见的思路是像姚顺雨那样完全构造一个新的世界需要确保里面的概念无法和地球的概念相借鉴。问题在于已有的概念太多了很难从零构造一个船新的概念树。另一个就是类似训练1930年AI的思路直接剔除所有高阶概念只把最基础的元素拿去训练。就像是只让一个新生儿接触到实实在在的物品而没有抽象概念。换而言之可以搞一个简化的原始地球模拟器然后把里面的数据文本化作为数据集。之后把人类各个重要节点的数据构建出来看AI能不能自主把关键抽象制造出来。2. 机器视野问题2.1 问题的本源硬件的限制曾经我回答过一个问题“为什么人类能一眼看到函数的最值而机器不能”。人由于眼睛的原因你只要看到函数图像几乎总能马上确定最值点的大概位置。同样是看到函数图像机器只能通过复杂的定位算法和大量计算才能定位相比而言相对于人类是要复杂不少。问题在于人类是经过生化硬件长年累月的进化下才达成了这一目标。而对于机器来说任何功能的实现都需要人类亲自设计因此即使是小窗口的视野已经很耗费成本了扩大窗口所带来的附加成本几乎是呈几何级数上升。目前在硬件勉强够用的前提下选择通过优化算法时间换空间达成和人类一样的功能。这个问题看着简单但我认为它和LLM的上下文窗口大小在本质上是一样的。LLM让人觉得犯傻的一个最大原因来自于它的遗忘性。相对而言人虽然也会有善忘的问题但对于当前工作的任务基本上能保持长久的工作记忆。现有大模型动为了解决这个问题动辄宣称自己有多少多少的上下文窗口仿佛只要喂足够多的提示词就能让机器能一直保持记忆力。然而由于模型的本质缺陷它同一时间能处理的信息长度总是有限的。即使通过分批投喂的方式也无法确保模型内部中已经消化过的内容不会损失有效的内容。因此这就又回到了那个问题我们到底是要通过增加机器的复杂度还是提升算法的复杂度在螺蛳壳里做道场前者面对的除了成本的指数上升可能还有硬件通用性的下降。而后者就引出了另一个重要问题。2.2 如何管理给AI投喂的数据换而言之如果无法增加大模型上下文的窗口想要让它能正常干活就需要精准投喂它所需要的信息。相比于像Openclaw之类的智能体无脑提取一大堆环境信息作为上下文我更习惯于精准控制手工描述问题但手工毕竟不能通往真正的AGI。再者不论是投喂的上下文还是用于训练的数据只要你拿着现实世界中采样的数据本质上都不可能避免出现噪声甚至是有害的数据。我们人可以通过特定的训练内化一套即使不科学也是存在固定标准的价值观模型从而把过往和未来中已经和可能出现的不符合我们口味数据全部剔除确保不影响后续推理。然而目前的LLM在训练阶段就不加筛选地吸收一切内容。而上下文中一旦有相矛盾的指令比如第一轮往左一点第二轮太左了往右一点机器本身也不会进行有目的性的选择性无视。2.3 数据要如何组织除了控制数据的内容数据如何组织就是要考虑的另一个问题。数据结构已经反复证明同样的数据不同的组织是会有完全不同的效果。比如即使我二叉树上的数据不全都是我想要的但我可以按需取用速度和准确度仍能大幅提升。目前的LLM流形空间本质上就是存在于欧式空间中。这个流形的特点是数据会在局部进行积聚从而形成局部流形。看着很自然但问题在于计算机中可用的值域和精度是有限的。当数据量上来之后是否会有多个数据进行混叠是否会有大量的空间因未被使用而浪费这些重叠的数据是否会引发准确度的丧失如果可以通过重建坐标系把这些混叠的数据点展开充分利用这些数据是否就能有更好的效果给我启发的是最近有两篇关于双曲空间的论文。[1]Atri Y K, Alaa A, Hartvigsen T. Lifelong Model Editing with Graph-Based External Memory[C]//Findings of the Association for Computational Linguistics: ACL 2025. 2025: 13336-13352.[2]Liu Y, Xu H, He Y, et al. HyperGuide: Hyperbolic Guidance for Efficient Multi-Step Reasoning in Large Language Models[J]. arXiv preprint arXiv:2605.24140, 2026.第一篇是把具有层级结构的知识图谱映射到双曲空间庞加莱圆盘模型中。第二篇其实也类似也是把思维树ToT放到庞加莱圆盘模型中。图谷侵删。原图是会动的gif静态图反而更好说明问题了。我理解的庞加莱圆盘模型具有的特性是距离中心越远空间越是稠密。也就是说越是远离中心就有越多的空间允许新数值的插入因此对于像树一样的结构在你固定好各种父节点之后子节点是可以有大量空间可以使用的。反之在欧氏空间下的流形如果一个新的数据点要插入到既有空间而它破坏了已有数据点的距离关系可能就需要全部重新排布带来了巨大的计算量。而在庞加莱圆盘中由于子数据本身必定是远离父节点的插入都是在越来越远的地方因此带来了巨大的操作简便性。类比数据结构数据的插入是最麻烦的对应的就是欧氏空间那么庞加莱圆盘似乎就可以对应于树这种数据结构。所以或者可以根据不同目标数据的结构研究它们所最合适的几何空间。致谢本文中提到的两篇文章来自于网友余老师的分享。没有和余老师的交流我或者就没有坚持下去的动力了。也欢迎其他网友与我深入讨论

相关新闻

【Linux】守护进程(Daemon)的创建、管理与实践避坑指南

【Linux】守护进程(Daemon)的创建、管理与实践避坑指南

1. 守护进程基础概念**守护进程(Daemon)**是Linux系统中一类特殊的后台服务进程,它独立于控制终端且周期性地执行任务或等待事件。想象一下你家24小时运转的空调——不需要你手动操作就能自动调节室温,守护进程就是Linux系统的&qu…

2026/7/4 2:48:06阅读更多 →
BGA设计中盘中孔工艺的应用与优势

BGA设计中盘中孔工艺的应用与优势

1. 盘中孔工艺的实战解析:BGA设计的新思路在PCB设计领域,BGA封装的高密度布线一直是工程师面临的挑战。最近我们团队遇到一个典型案例:0.5mm pitch的BGA主控,搭配DDR、USB和WiFi模块,需要在86cm的紧凑空间内完成布线。…

2026/7/4 2:48:06阅读更多 →
三菱PLC两轴伺服画圆实战:从硬件配置到程序调试

三菱PLC两轴伺服画圆实战:从硬件配置到程序调试

1. 三菱PLC两轴伺服画圆:工控小白的第一个实战项目第一次接触PLC控制伺服电机画圆时,我盯着设备整整发呆了半小时——这堆铁疙瘩真能画出完美的圆形?作为工控领域最基础的轨迹控制需求,圆弧插补确实是每个自动化工程师的必修课。三…

2026/7/4 2:43:04阅读更多 →
PX4多旋翼无人机集群协同控制:分布式架构与智能算法实践指南

PX4多旋翼无人机集群协同控制:分布式架构与智能算法实践指南

PX4多旋翼无人机集群协同控制:分布式架构与智能算法实践指南 【免费下载链接】PX4-Autopilot PX4 Autopilot Software 项目地址: https://gitcode.com/gh_mirrors/px/PX4-Autopilot 随着无人机应用场景的不断拓展,单一无人机已难以满足复杂任务需…

2026/7/4 4:48:22阅读更多 →
Nacos 2.x 源码深度解析 (三):配置中心客户端 —— 启动加载与自动装配

Nacos 2.x 源码深度解析 (三):配置中心客户端 —— 启动加载与自动装配

《Nacos 2.x源码深度解析》专栏目录 一、架构通信篇: 《Nacos 2.x 源码深度解析 (一):架构整体全貌 —— 核心模块划分与版本演进》 《Nacos 2.x 源码深度解析 (二):通信协议迭代 —— HTTP长轮询到gRPC演进》 二、配置中心篇 《Nacos 2.x 源…

2026/7/4 4:48:22阅读更多 →
如何用HunterPie让你的《怪物猎人:世界》狩猎效率提升300%

如何用HunterPie让你的《怪物猎人:世界》狩猎效率提升300%

如何用HunterPie让你的《怪物猎人:世界》狩猎效率提升300% 【免费下载链接】HunterPie-legacy A complete, modern and clean overlay with Discord Rich Presence integration for Monster Hunter: World. 项目地址: https://gitcode.com/gh_mirrors/hu/HunterPi…

2026/7/4 4:48:22阅读更多 →
山西网警破获外挂抢售茅台非法牟利案

山西网警破获外挂抢售茅台非法牟利案

近日,山西太原迎泽公安网安部门深入排查网络灰产违法线索,成功侦破一起利用非法外挂软件批量抢购飞天茅台、线下高价倒卖非法牟利的刑事案件,抓获涉案犯罪嫌疑人一名,彻底斩断一条依托自动化脚本外挂、电商代抢、加价倒卖的黑色产…

2026/7/4 4:48:22阅读更多 →
Steam成就管理器终极指南:一键解锁所有游戏成就的免费神器

Steam成就管理器终极指南:一键解锁所有游戏成就的免费神器

Steam成就管理器终极指南:一键解锁所有游戏成就的免费神器 【免费下载链接】SteamAchievementManager A manager for game achievements in Steam. 项目地址: https://gitcode.com/gh_mirrors/st/SteamAchievementManager 还在为那些难以达成的Steam成就而苦…

2026/7/4 4:48:22阅读更多 →
v4l2驱动框架——ctrl_handler

v4l2驱动框架——ctrl_handler

文章目录ctrl_handlerov13850的handler代码应用层使用对焦例子ctrl_handler V4L2控制框架(Control Framework)是Linux内核中为视频设备提供统一参数管理机制的子系统。它通过v4l2_ctrl_handler管理所有设备控制项(如曝光、增益、白平衡等&am…

2026/7/4 4:43:22阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/3 14:18:39阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/7/3 14:38:35阅读更多 →
端到端自动驾驶:从GTC‘26看工程可信落地的核心逻辑

端到端自动驾驶:从GTC‘26看工程可信落地的核心逻辑

1. 项目概述:当算法工程师走进GTC26展厅,看到的不是芯片,而是“端到端”的呼吸节奏“端到端”这三个字,在GTC’26现场出现的频率,高得像NVLink带宽测试时的峰值曲线——它不再是一个论文里的技术路径选项,而…

2026/7/4 0:02:48阅读更多 →
缺牙修复科普:常见义齿类型与选择参考

缺牙修复科普:常见义齿类型与选择参考

缺牙修复科普:常见义齿类型与选择参考牙齿缺失是中老年人群中较为常见的口腔问题,不仅会造成咀嚼不便、进食受影响,长期还可能对营养摄入与日常社交带来困扰。义齿是改善缺牙问题的常用方式,目前市面上的义齿种类较多,…

2026/7/4 0:02:48阅读更多 →
STM32F091RC与LTC6904实现高精度方波信号生成

STM32F091RC与LTC6904实现高精度方波信号生成

1. 项目概述:LTC6904与STM32F091RC的精准方波生成方案在嵌入式系统开发中,精确的时钟信号和定时控制往往是项目成败的关键。LTC6904作为一款低功耗、高精度的可编程振荡器芯片,与STM32F091RC这款ARM Cortex-M0内核微控制器的组合,…

2026/7/4 0:02:48阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时,发现推理速度只有可怜的 1-2 FPS,而别人的演示视频却能跑到 30 FPS 以上,那么问题很可能不在模型本身,而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后,会直接使用官方示例…

2026/7/4 1:16:56阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一:为什么你需要了解 Coze 和 Dify?如果你对 AI 应用开发感兴趣,但一看到“大模型”、“智能体”、“工作流”这些词就头疼,觉得门槛太高,那这篇文章就是为你准备的。很多开发者,包括我自己&#…

2026/7/4 2:33:55阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会:配图一直是个让人头疼的问题。2026年,AI生图工具已经非常成熟了,但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1:速度之王2026年6月11日&#xff0c…

2026/7/4 2:33:55阅读更多 →