本地大模型别再瞎装了!这个开源神器会自动帮你选模型
最近我在折腾本地大模型时最大的痛点不是“模型不够强”而是“到底该装哪个模型”。很多人看到参数量就冲结果下载完才发现显存爆了、速度慢了、CPU 直接顶满最后只能删掉重来。whichllm这个项目正好解决了这个问题它会自动识别你的硬件然后根据真实基准和运行条件给出最适合你机器的本地模型推荐。这个项目到底解决什么问题whichllm是一个 Python CLI 工具核心能力就一句话找出“能跑”且“跑得好”的本地 LLM而不是只看模型有多大。它会读取 GPU、CPU、RAM、磁盘等信息再结合 HuggingFace 模型数据和多个 benchmark 来源做综合排序。这比传统的“显存够不够”判断方式实用太多了。因为本地部署真正麻烦的地方不是“模型能不能放下”而是“放下之后速度行不行、体验稳不稳、是不是得大规模 CPU offload”。为什么我觉得它很适合本地党这个项目最有价值的地方是它把“选模型”从玄学变成了工程问题。它不是简单按参数量排序而是把多个 benchmark 融合进来再结合量化、offload、速度门槛和可信度做评分。换句话说它考虑的不只是“能不能装下”还考虑了“装下以后是不是值得跑”。这对我们这种经常测试模型、写教程、做 benchmark 的人来说效率提升非常明显。我本机实测结果我在自己的 Windows 机器上跑了一遍硬件识别结果如下GPU 0NVIDIA GeForce RTX 5070 Ti15.9 GB 显存。CPUAMD Ryzen 7 7800X3D8 核。RAM63.1 GB。磁盘可用空间88.3 GB。whichllm hardware能直接把这些信息整理成漂亮的终端表格输出属于“一眼就知道自己机器什么水平”的那种工具。然后我执行了uv run whichllm --top 10得到的前几名推荐非常有参考价值。排名第一的是google/gemma-4-26B-A4B-it量化为Q3_K_M显示为 Full GPU估算速度达到 154.3 tok/s得分 77.6。紧随其后的是Qwen/Qwen3.6-27B、openai/gpt-oss-20b、Qwen/Qwen3-14B、microsoft/phi-4等模型。对我这张 16GB 显存卡来说最实用的结论其实很清晰Qwen/Qwen3-14B Q5_K_M这种组合非常稳显存压力合理中文体验也更友好。小白也能照着走的通用流程如果你是第一次接触本地模型我建议直接按下面这套流程来不要上来就到处搜“最强模型”。第一步先装 whichllm项目支持通过uv、PyPI、Homebrew 等方式安装定位就是一个 Python CLI 工具 。如果你本地已经装好了 Python 环境最省心的方式通常还是直接按项目说明用uv跑。如果你是从 GitHub 克隆源码到本地一般流程就是git clone https://github.com/Andyyyy64/whichllmcd whichllmuv sync这里的重点不是安装姿势而是你装完以后后面所有判断都能自动化完成不需要自己去查显卡表、量化表和排行榜。第二步先看硬件不要先看模型装好之后第一条建议执行的命令不是推荐模型而是先看机器体检结果uv run whichllm hardware这个命令会自动识别你的 GPU、显存、CPU、内存和磁盘情况本质上是在告诉你你的本地部署上限大概在哪。whichllm的核心设计就是先识别硬件再去匹配模型而不是反过来 。这一步非常适合小白。因为很多人其实连自己的“真实可用显存”和“硬件瓶颈”都没概念更别说判断 14B、27B、70B 哪个适合自己了。第三步直接看推荐列表uv run whichllm --top 10这个命令会给出一组排序后的模型推荐通常会包含模型名、量化方式、是否能完整进入显卡、预计速度、发布时间和综合分数。项目介绍里明确提到它会把真实 benchmark、量化惩罚、证据可信度、速度估算等因素一起纳入排序而不是只做“能不能装下”的判断 。app.daily1你看到推荐结果后不需要一眼看懂所有细节只要先抓住三个关键词Full GPU优先级最高代表模型可以完整放进显卡体验通常更稳定。Partial说明有一部分要 offload 到内存或 CPU理论上能跑但速度和稳定性可能会下降。Quant量化方式决定了显存占用和性能平衡小白阶段不用研究太深先按推荐用就够了。第四步优先选“稳”的不要一上来追最大模型这是最容易踩坑的一步。很多新手看到排名靠前的大模型就想直接冲但实际上更合理的做法是先选 Full GPU、速度可用、显存有余量的模型。项目文档和介绍都在强调它不仅考虑 fit还考虑 speed 和实际可用性 。所以对普通用户来说更稳妥的思路是先用这条命令uv run whichllm --gpu-only --speed usable --vram-headroom 1GB --top 10这条命令的意义很适合写给小白不是挑“理论上最强”而是挑“你电脑今天就能舒服跑起来”的模型。如果你是第一次部署本地大模型这一步比追排行榜重要得多。第五步按用途继续筛选当你已经知道自己机器能跑哪些模型之后再根据用途细分会更高效。项目支持按不同场景过滤比如 coding 场景就可以这样查 uv run whichllm --profile coding --gpu-only --speed usable --top 10也就是说whichllm不只是回答“能跑什么”还在尝试回答“你现在这台机器做这类任务更适合什么。”这对写代码、做问答、做 RAG、做本地助手的人都很有价值因为不同用途真正需要的模型并不完全一样。第六步想查单个模型直接反查有时候你不是想看推荐列表而是已经心里有个目标模型比如你想知道某个 Qwen、Gemma、Llama 模型到底适不适合自己机器。uv run whichllm plan Qwen3-14B项目介绍里也提到plan这类能力本质上是在做反向查询不是“我该跑什么”而是“我想跑这个需要什么硬件” 。这对准备升级显卡、或者计划买新机器的人尤其有用。适合谁用这个工具特别适合三类人本地大模型玩家想知道自己机器到底该跑什么。做教程、做评测的人需要快速给不同硬件找推荐模型。想买新显卡的人可以先模拟目标 GPU 能跑哪些模型。如果你平时就在做 RAG、OCR、LLM 应用开发这个工具更像是一个“模型选型前的体检仪”。它不能替你决定业务方案但能帮你在本地部署前少踩很多坑。我给你的结论如果你是本地模型党这个项目值得收藏。它的价值不在于“列出很多模型”而在于把“模型选择”变成了基于硬件和 benchmark 的决策。如果你想把本地大模型部署从“凭感觉”升级到“有数据可依”whichllm就是一个很好的起点。

相关新闻

TV Bro:智能电视浏览器的终极免费开源解决方案

TV Bro:智能电视浏览器的终极免费开源解决方案

TV Bro:智能电视浏览器的终极免费开源解决方案 【免费下载链接】tv-bro Simple web browser for android optimized to use with TV remote 项目地址: https://gitcode.com/gh_mirrors/tv/tv-bro 你是否曾经在智能电视上尝试浏览网页,却被繁琐的遥…

2026/6/29 18:35:49阅读更多 →
湘潭VI设计选哪家 行业选择标准及优质渠道详细科普

湘潭VI设计选哪家 行业选择标准及优质渠道详细科普

导语在湘潭,企业发展离不开良好的品牌形象,而VI设计便是塑造品牌形象的关键一环。选择一家合适的VI设计公司至关重要,但面对众多选择,企业往往不知如何下手。相传国际作为一家专业的品牌设计机构,在VI设计领域有着丰富…

2026/6/29 18:35:49阅读更多 →
渗透测试实战入门:从零到精通DC-1靶场攻防全流程解析

渗透测试实战入门:从零到精通DC-1靶场攻防全流程解析

1. 项目概述:为什么“从零到实战”是每个安全从业者的必经之路几年前,我刚从开发转行做安全,面对“渗透测试”这四个字,感觉就像面对一座没有地图的迷宫。网上资料要么是零散的“炫技”片段,要么是晦涩难懂的理论堆砌&…

2026/6/29 18:30:49阅读更多 →
终极NDS游戏文件编辑器Tinke:从零开始掌握ROM修改的完整指南

终极NDS游戏文件编辑器Tinke:从零开始掌握ROM修改的完整指南

终极NDS游戏文件编辑器Tinke:从零开始掌握ROM修改的完整指南 【免费下载链接】tinke Viewer and editor for files of NDS games 项目地址: https://gitcode.com/gh_mirrors/ti/tinke 想要深入了解和修改你心爱的NDS游戏吗?Tinke正是你需要的NDS游…

2026/6/29 20:01:15阅读更多 →
深入解析模型调用与 Prompt 构建的四种“姿势”

深入解析模型调用与 Prompt 构建的四种“姿势”

随着大语言模型(LLM)的爆发式发展,LangChain 作为一个强大的编排框架,极大地降低了我们与各类大模型交互的门槛。无论你是在构建简单的问答机器人,还是复杂的多智能体系统,“模型调用”和“提示词构建”都是…

2026/6/29 20:01:15阅读更多 →
ChatGPT Plus值不值得买,现在下单可能亏掉3个月使用费——限时政策倒计时48小时预警

ChatGPT Plus值不值得买,现在下单可能亏掉3个月使用费——限时政策倒计时48小时预警

更多请点击: https://kaifayun.com 第一章:ChatGPT Plus 值得买吗 ChatGPT Plus 是 OpenAI 提供的订阅服务,每月收费 20 美元(或等值本地货币),承诺提供更快响应、优先访问新功能(如高级模型 G…

2026/6/29 20:01:15阅读更多 →
Ubuntu安装中文输入法教程

Ubuntu安装中文输入法教程

您可以在 Ubuntu 24.04 LTS 中安装中文输入法。以下是两种主流且易用的方案,您可以根据偏好选择。方案一:安装 Fcitx 5 中文输入法引擎(推荐)Fcitx 5 是一个现代、灵活的输入法框架,在 Linux 社区中非常流行。安装 Fc…

2026/6/29 20:01:15阅读更多 →
AI 辅助存储排障实战:从日志挖掘到根因定位的自动化流水线

AI 辅助存储排障实战:从日志挖掘到根因定位的自动化流水线

AI 辅助存储排障实战:从日志挖掘到根因定位的自动化流水线 一、排障效率的瓶颈:人工分析的天花板与认知偏差 存储系统的故障排查,本质上是一个信息检索与因果推理的过程。工程师需要从海量日志、指标和事件中提取关键信息,建立因果…

2026/6/29 20:01:15阅读更多 →
dxwrapper如何让你的经典游戏在Windows 10/11上重获新生?[特殊字符]

dxwrapper如何让你的经典游戏在Windows 10/11上重获新生?[特殊字符]

dxwrapper如何让你的经典游戏在Windows 10/11上重获新生?🎮 【免费下载链接】dxwrapper Fixes compatibility issues with older games running on Windows 10/11 by wrapping DirectX dlls. Also allows loading custom libraries with the file extens…

2026/6/29 19:56:14阅读更多 →
AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

AI Coding 六个月真实ROI账本:产品经理的血泪教训,研发的冷静忠告

6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

2026/6/29 3:27:55阅读更多 →
审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

审计来了,数据权限全开——审计走了,怎么确保权限全部关掉?

引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…

2026/6/29 2:19:08阅读更多 →
如何在3秒内从普通图片生成专业级法线贴图:DeepBump的终极指南

如何在3秒内从普通图片生成专业级法线贴图:DeepBump的终极指南

如何在3秒内从普通图片生成专业级法线贴图:DeepBump的终极指南 【免费下载链接】DeepBump Normal & height maps generation from single pictures 项目地址: https://gitcode.com/gh_mirrors/de/DeepBump 还在为3D建模中的纹理制作而烦恼吗?…

2026/6/29 0:01:47阅读更多 →
OCAuxiliaryTools:终极OpenCore配置工具,让黑苹果安装从未如此简单!

OCAuxiliaryTools:终极OpenCore配置工具,让黑苹果安装从未如此简单!

OCAuxiliaryTools:终极OpenCore配置工具,让黑苹果安装从未如此简单! 【免费下载链接】OCAuxiliaryTools Cross-platform GUI management tools for OpenCore(OCAT) 项目地址: https://gitcode.com/gh_mirrors/oc/OCA…

2026/6/29 0:01:47阅读更多 →
终极Windows 11精简指南:使用tiny11builder快速创建纯净系统镜像

终极Windows 11精简指南:使用tiny11builder快速创建纯净系统镜像

终极Windows 11精简指南:使用tiny11builder快速创建纯净系统镜像 【免费下载链接】tiny11builder Scripts to build a trimmed-down Windows 11 image. 项目地址: https://gitcode.com/GitHub_Trending/ti/tiny11builder 你是否厌倦了Windows 11系统自带的20…

2026/6/29 0:01:47阅读更多 →