云耀计算AI-Claura,在树莓派运行的AI
模型下载地址https://gitee.com/jiasiqi2025/Open-Claura官方网站https://bksy.top正文Claura这个项目有意思的地方在于它把一个能对话的AI塞进了400MB跑在树莓派和15年前的老爷电脑上。不是靠魔法是靠几项扎实的压缩技术。核心指标2亿参数0.2BFP16半精度量化模型文件约400MB纯CPU推理无需GPU、无需NPU、无需任何加速卡基于T5架构重构。模型蒸馏Claura不是从零训练的而是从一个更大的模型那里学来的。蒸馏的核心逻辑是大模型教师在大量数据上做推理生成软标签概率分布小模型学生直接拟合这些软标签而不是拟合原始数据。这样做的好处是软标签包含了教师对类间相似性的理解信息密度比硬标签高得多。学生不用从头摸索直接继承教师的判断边界。参数从几百亿压到2亿智能水平掉得不算太狠靠的就是这手。架构砍层T5原生结构对树莓派来说太重了。Claura做了几件事削减Transformer层的数量缩小隐藏层维度精简注意力头的个数。本质上是在模型深度和宽度上同时动刀。但也不是瞎砍。层数少了模型的表达能力下降但推理速度线性提升头数少了注意力矩阵的计算量呈平方级下降。这个权衡的结果就是模型能跑但复杂任务明显吃力——写诗只能憋出一句就是因为深层语义关联能力被削了。FP16量化Claura用的是FP16不是INT8。FP16把每个参数从32位浮点压缩到16位体积直接减半。2亿参数 × 2字节 400MB刚好对上。为什么选FP16而不是INT8INT8体积更小2亿参数 × 1字节 200MB但精度损失大推理时输出质量明显下滑。FP16在体积和性能之间取了个折中精度损失控制在可接受范围内推理时也不需要额外的反量化步骤CPU跑起来更省事。CPU推理Claura最反潮流的地方是它完全放弃GPU加速。在模型设计阶段就把纯CPU运行当成硬约束所有算子都避开CUDA依赖只调用CPU原生的数学运算库。这就意味着推理速度慢——树莓派上每秒也就几个token。但也意味着兼容性拉满不需要显卡驱动不挑CUDA版本ARM架构的树莓派能跑x86的15年老电脑也能跑甚至某些嵌入式Linux设备也能跑。在这个靠显卡吃饭的AI时代Claura反手一套纯CPU方案等于告诉所有人我不跟你们卷算力我卷的是有CPU就能跑。屏蔽脏话这不是模型的一部分是外面套的一层过滤网。实现方式很简单一个敏感词表 正则匹配。输入和输出都会过一遍命中就替换或拒绝。和模型本身无关纯工程手段但实用。Claura不走流式输出而是提前生成一个候选回复池再从中选一条最合适的整句输出。这样做的好处是在树莓派的弱CPU上逐字流式输出反而容易卡顿预生成整句输出让体验更连贯。坏处是响应延迟固定不管问题难易都得等那么久。我正在研究如何让ai模型在不损失智商或轻微轻损失智商的情况下运行在弱性能设备上如果你感兴趣那么请联系我2134286739qq.com

相关新闻

Shell脚本为何成为AI智能体视觉(TVA)的“反射弧”(6)

Shell脚本为何成为AI智能体视觉(TVA)的“反射弧”(6)

前沿技术介绍:AI智能体视觉(TVA,Transformer-based Vision Agent)是依托Transformer架构与“因式智能体”理论所构建的颠覆性工业视觉技术,属于“物理AI” 领域的一种全新技术形态,实现了从“虚拟世界”到“…

2026/6/23 22:42:06阅读更多 →
还在手写INSERT?这个免费的Chrome插件可以直接把网页表格变SQL

还在手写INSERT?这个免费的Chrome插件可以直接把网页表格变SQL

一、为什么SQL开发这么“浪费时间”? https://chromewebstore.google.com/detail/table-to-sql-generator/cnnbcnlgapdikanhgclfmfhmeeolnmgj 在数据库开发中,我们经常会遇到这些重复操作: 手写 INSERT 语句拼接 UPDATE 条件写 DELETE WHE…

2026/6/23 22:42:06阅读更多 →
第二章 数字类型及其操作3

第二章 数字类型及其操作3

本章围绕 Python 字符串(字符)类型操作展开学习,分为教学案例与配套实验两大模块。案例以身份证信息解析、字符图形打印、字符统计、凯撒加密为主,练习字符串切片、遍历、判断、拼接基础操作;实验拓展回文判断、多种加…

2026/6/23 22:42:06阅读更多 →
haproxy(七层代理)、python代码的读写分离

haproxy(七层代理)、python代码的读写分离

一、haproxy----高可用、负载均衡1.安装安装ntpdate[roothaproxy ~]# yum -y install ntpdate.x86_64安装ntp[roothaproxy ~]# yum -y install ntp同步时间[roothaproxy ~]# ntpdate cn.ntp.org.cn启动ntp服务[roothaproxy ~]# systemctl start ntpd设置开机自启[roothaproxy ~…

2026/6/24 0:02:41阅读更多 →
使用自动化脚本一般可以实现哪些任务?

使用自动化脚本一般可以实现哪些任务?

我们一般通过编写或使用自动化脚本来完成各种任务,从而节省时间和提高效率。以下是一些常见的自动化脚本任务:游戏搬砖脚本技术:这种技术涉及使用自动化脚本来执行游戏中的重复任务。例如,在一个交易游戏中,脚本可以自…

2026/6/24 0:02:41阅读更多 →
Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作

Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作

Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作 【免费下载链接】Wan2.1-Fun-V1.1-1.3B-InP 项目地址: https://ai.gitcode.com/hf_mirrors/PAI/Wan2.1-Fun-V1.1-1.3B-InP Wan2.1-Fun-V1.1-1.3B-InP是一款强大的AI视频创作工具,…

2026/6/24 0:02:41阅读更多 →
终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果

终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果

终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果 【免费下载链接】angular-mobile-nav An angular navigation service for mobile applications 项目地址: https://gitcode.com/gh_mirrors/an/angular-mobile-nav angular-mobile-nav是一款专为…

2026/6/24 0:02:41阅读更多 →
TaskJuggler脚本编程入门:用代码实现自动化项目管理

TaskJuggler脚本编程入门:用代码实现自动化项目管理

TaskJuggler脚本编程入门:用代码实现自动化项目管理 【免费下载链接】TaskJuggler TaskJuggler - Project Management beyond Gantt chart drawing 项目地址: https://gitcode.com/gh_mirrors/ta/TaskJuggler TaskJuggler是一款强大的开源项目管理工具&#…

2026/6/24 0:02:41阅读更多 →
Angular移动导航插件开发:如何创建自定义导航组件

Angular移动导航插件开发:如何创建自定义导航组件

Angular移动导航插件开发:如何创建自定义导航组件 【免费下载链接】angular-mobile-nav An angular navigation service for mobile applications 项目地址: https://gitcode.com/gh_mirrors/an/angular-mobile-nav angular-mobile-nav 是一个专为移动应用设…

2026/6/23 23:57:41阅读更多 →
【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体

【人工智能】一文搞定到底什么是智能体 一文搞定到底什么是智能体【人工智能】一文搞定到底什么是智能体一. LM,WorkFlow,Agent分别有什么么不同二. Agent的思考过程是怎样的三. Agent的五个核心部分1)LLM2)Prompt3)Me…

2026/6/23 7:04:52阅读更多 →
嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

嵌入式GUI控件实战:ROTARY、SCROLLBAR、SLIDER原理与应用

1. 嵌入式GUI控件:从原理到实战的深度解析在嵌入式系统开发中,图形用户界面(GUI)的设计与实现往往是项目从“能用”到“好用”的关键一跃。不同于资源充沛的PC或移动平台,嵌入式设备的GUI需要在有限的CPU性能、内存空间…

2026/6/23 1:55:32阅读更多 →
Google AI Studio 300美元额度的真相与实战指南

Google AI Studio 300美元额度的真相与实战指南

1. 这300美金不是“送钱”,而是Google埋下的第一道技术门槛 你看到标题里那个醒目的“$300美金”时,第一反应可能是:又一个免费额度?领完就完事?我亲手试过——这300美金根本不是红包,而是一张入场券&…

2026/6/23 5:55:37阅读更多 →
TaskJuggler脚本编程入门:用代码实现自动化项目管理

TaskJuggler脚本编程入门:用代码实现自动化项目管理

TaskJuggler脚本编程入门:用代码实现自动化项目管理 【免费下载链接】TaskJuggler TaskJuggler - Project Management beyond Gantt chart drawing 项目地址: https://gitcode.com/gh_mirrors/ta/TaskJuggler TaskJuggler是一款强大的开源项目管理工具&#…

2026/6/24 0:02:41阅读更多 →
终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果

终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果

终极教程:使用angular-mobile-nav实现流畅的移动页面过渡效果 【免费下载链接】angular-mobile-nav An angular navigation service for mobile applications 项目地址: https://gitcode.com/gh_mirrors/an/angular-mobile-nav angular-mobile-nav是一款专为…

2026/6/24 0:02:41阅读更多 →
Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作

Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作

Wan2.1-Fun-V1.1-1.3B-InP Web UI使用教程:无需代码的AI视频创作 【免费下载链接】Wan2.1-Fun-V1.1-1.3B-InP 项目地址: https://ai.gitcode.com/hf_mirrors/PAI/Wan2.1-Fun-V1.1-1.3B-InP Wan2.1-Fun-V1.1-1.3B-InP是一款强大的AI视频创作工具,…

2026/6/24 0:02:41阅读更多 →