本地部署AI
【前言】一直以来我都深耕于断网开发环境与外界“绝缘”成了常态。也因此始终没能真正拥抱AI浪潮成为一名高频“吃Token”的开发者。趁着今天得闲决定把本地部署AI的过程记录下来算是给自己补上一课。【为什么还要本地部署AI】先别急着说“没必要”——如今在线AI和各类桌面端应用已经足够成熟ChatGPT、Copilot、Claude等随手可用为什么还要“折腾”本地部署我个人的理解主要有三点数据安全是第一刚需工作中涉及内部代码、敏感文档、未公开的算法逻辑这些数据一旦上传云端即使厂商承诺“不用于训练”心理上的“数据出境感”仍然挥之不去。本地部署数据不出机房物理隔离才是真正的“我的数据我做主”。自主训练定制专属模型在线大模型虽强但它是“通用大脑”不懂你的业务术语、代码规范、项目上下文。本地部署后你可以用自有数据做微调Fine-tuning或RAG让AI真正懂你的项目成为专属“副驾驶”。离线可用永不掉线对于我这种长期断网环境的“原住民”网络波动或断连是家常便饭。本地AI随叫随到不受网络和API配额限制开发体验更流畅也无需为Token计费焦虑。【记录本地部署AI过程】一个好看的聊天界面我选择的是Ollama特别提醒 选择安装的是时候千万不要直接点击进入安装程序通过cmd命令行进入安装程序这样可以选择安装盘要不然就会安装在C盘.例如你的安装包 在D盘file下面 OllamaSetup.exe1打开cmd WINR 输入cmd 回车直接输入 D: cd file 进入安装包目录2 输入 OllamaSetup.exe /DIRD:\Ollama等待一段时间安装好安装好之后界面就是这样的下载链接https://v4.gh-proxy.org/https://github.com/ollama/ollama/releases/latest/download/OllamaSetup.exe选择模型可根据个人电脑配置选择我这里选择的是deepseek-r1:7b。本人电脑比较垃圾勿喷在安装前进入Ollama界面 选择模型存放目录要不然就会默认C盘1打开cmd WINR 输入cmd 回车输入ollama pull deepseek-r1:7b 等待安装 大概4个多G安装好之后输入ollama run deepseek-r1:7b运行模型 就可以了当然也可以在聊天界面 select a model 选择安装的模型【结语】当然本地部署也有门槛——硬件成本、模型选型、推理优化都是挑战。但正如当年从物理机迁移到虚拟化一样早踩坑早受益。这篇文章就当作我的“本地AI折腾日志”希望能给同样身处内网或对数据敏感的朋友一些参考。

相关新闻

04 | 中英文双语的工程实现

04 | 中英文双语的工程实现

本文目录🌏 第 4 篇:中英文双语的工程实现📌 1. 整体设计🔄 2. CJK 字体自动检测2.1 问题2.2 检测方法2.3 字体切换 统一绘制入口📐 3. 分段缩放 —— 中文为什么需要更大字号?3.1 原理3.2 CJKScale 实现&…

2026/7/1 9:53:32阅读更多 →
spring对junit的支持

spring对junit的支持

引入spring和junit4的依赖<dependency><groupId>org.springframework</groupId><artifactId>spring-context</artifactId><version>6.0.4</version> </dependency> <!-- spring对junit支持的依赖&#xff0c;spring…

2026/7/1 9:48:32阅读更多 →
【AI】魔珐星云 SDK 实战测评:Cursor、Copilot、通义灵码如何走向具身交互成品

【AI】魔珐星云 SDK 实战测评:Cursor、Copilot、通义灵码如何走向具身交互成品

博主介绍&#xff1a;✌全网粉丝24W&#xff0c;CSDN博客专家、Java领域优质创作者&#xff0c;掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域✌ 技术范围&#xff1a;SpringBoot、SpringCloud、Vue、SSM、HTML、Nodejs、Python、MySQL、PostgreSQL、大数据、物…

2026/7/1 9:48:32阅读更多 →
ICM-42688-P与PIC18F96J94在工业运动控制中的高精度应用

ICM-42688-P与PIC18F96J94在工业运动控制中的高精度应用

1. ICM-42688-P与PIC18F96J94的黄金组合解析在工业级运动传感与控制领域&#xff0c;ICM-42688-P六轴MEMS惯性测量单元(IMU)与PIC18F96J94微控制器的组合正在重塑设备感知能力的边界。这套方案的核心竞争力在于&#xff1a;ICM-42688-P提供4000dps陀螺仪量程和32g加速度计量程的…

2026/7/1 11:09:09阅读更多 →
还在为字幕制作烦恼?Subtitle Edit 免费开源字幕编辑神器帮你轻松搞定

还在为字幕制作烦恼?Subtitle Edit 免费开源字幕编辑神器帮你轻松搞定

还在为字幕制作烦恼&#xff1f;Subtitle Edit 免费开源字幕编辑神器帮你轻松搞定 【免费下载链接】subtitleedit the subtitle editor :) 项目地址: https://gitcode.com/gh_mirrors/su/subtitleedit 你是否遇到过这样的困扰&#xff1f;辛辛苦苦录制的视频&#xff0c…

2026/7/1 11:09:09阅读更多 →
终极指南:Wand-Enhancer开源工具深度解锁WeMod完整功能

终极指南:Wand-Enhancer开源工具深度解锁WeMod完整功能

终极指南&#xff1a;Wand-Enhancer开源工具深度解锁WeMod完整功能 【免费下载链接】Wand-Enhancer Advanced UX and interoperability extension for Wand (WeMod) app 项目地址: https://gitcode.com/gh_mirrors/we/Wand-Enhancer Wand-Enhancer是一个专业的开源增强工…

2026/7/1 11:09:09阅读更多 →
jvm~jvm配置与系统配置的关系

jvm~jvm配置与系统配置的关系

keycloak是运行在jboss上面&#xff0c;并且部署到了容器里&#xff0c;在k8s上面进行编排&#xff0c;现在遇到gc在某个时刻垃圾回收速度变慢&#xff0c;CPU接近100%&#xff0c;容器导致存活探针失败&#xff0c;容器最后重启二 问题分析与解决方案这是一个典型的 JVM GC 问…

2026/7/1 11:09:09阅读更多 →
MPC5643L/SPC56EL评估板硬件设计解析:电源、时钟与调试接口配置实战

MPC5643L/SPC56EL评估板硬件设计解析:电源、时钟与调试接口配置实战

1. 项目概述与核心价值在嵌入式系统开发&#xff0c;尤其是汽车电子和工业控制这类对可靠性要求极高的领域&#xff0c;直接在产品板上进行软件调试和硬件验证风险极高。一块设计精良的微控制器评估板&#xff0c;就如同一个功能完备的“实验田”&#xff0c;它能为开发者提供一…

2026/7/1 11:09:09阅读更多 →
【Gartner认证级评估】:ChatGPT企业版 vs Microsoft Copilot for Business vs Anthropic Enterprise——总拥有成本(TCO)深度比对

【Gartner认证级评估】:ChatGPT企业版 vs Microsoft Copilot for Business vs Anthropic Enterprise——总拥有成本(TCO)深度比对

更多请点击&#xff1a; https://intelliparadigm.com 第一章&#xff1a;ChatGPT企业版价格结构全景解析 ChatGPT企业版&#xff08;ChatGPT Enterprise&#xff09;并非按用户数或 API 调用量简单计费&#xff0c;而是采用基于组织规模、功能需求与服务等级的定制化定价模型…

2026/7/1 11:04:09阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月&#xff0c;Boris Cherny 公开宣布自己卸载了 IDE。一时间&#xff0c;Vibe Coding 成了全行业最热的话题。6个月后&#xff0c;当我们回过头来拉一份真实账本&#xff0c;发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/7/1 4:42:14阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言&#xff1a;审计结束三个月了&#xff0c;审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间&#xff0c;内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中&#xff0c;审计…

2026/7/1 5:19:01阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时&#xff0c;发现推理速度只有可怜的 1-2 FPS&#xff0c;而别人的演示视频却能跑到 30 FPS 以上&#xff0c;那么问题很可能不在模型本身&#xff0c;而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后&#xff0c;会直接使用官方示例…

2026/7/1 0:01:44阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一&#xff1a;为什么你需要了解 Coze 和 Dify&#xff1f;如果你对 AI 应用开发感兴趣&#xff0c;但一看到“大模型”、“智能体”、“工作流”这些词就头疼&#xff0c;觉得门槛太高&#xff0c;那这篇文章就是为你准备的。很多开发者&#xff0c;包括我自己&#…

2026/7/1 0:01:44阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会&#xff1a;配图一直是个让人头疼的问题。2026年&#xff0c;AI生图工具已经非常成熟了&#xff0c;但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1&#xff1a;速度之王2026年6月11日&#xff0c…

2026/7/1 0:01:44阅读更多 →
YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

YOLOv8推理性能优化:从1.2FPS到35FPS的全链路加速实践

如果你在部署 YOLOv8 时&#xff0c;发现推理速度只有可怜的 1-2 FPS&#xff0c;而别人的演示视频却能跑到 30 FPS 以上&#xff0c;那么问题很可能不在模型本身&#xff0c;而在于你的整个处理链路。很多开发者拿到一个训练好的 YOLOv8 模型后&#xff0c;会直接使用官方示例…

2026/7/1 0:01:44阅读更多 →
Coze与Dify对比指南:低代码AI应用开发从入门到实战

Coze与Dify对比指南:低代码AI应用开发从入门到实战

1. 从零到一&#xff1a;为什么你需要了解 Coze 和 Dify&#xff1f;如果你对 AI 应用开发感兴趣&#xff0c;但一看到“大模型”、“智能体”、“工作流”这些词就头疼&#xff0c;觉得门槛太高&#xff0c;那这篇文章就是为你准备的。很多开发者&#xff0c;包括我自己&#…

2026/7/1 0:01:44阅读更多 →
AI生图工具怎么选?2026年6月版实测对比

AI生图工具怎么选?2026年6月版实测对比

做自媒体的朋友应该都有体会&#xff1a;配图一直是个让人头疼的问题。2026年&#xff0c;AI生图工具已经非常成熟了&#xff0c;但工具太多反而不知道怎么选。以下是截至2026年6月我对主流AI生图工具的实测对比。Midjourney V8.1&#xff1a;速度之王2026年6月11日&#xff0c…

2026/7/1 0:01:44阅读更多 →