自动匹配硬件的最佳本地LLM

#REPO GitHub Trending 2026.06.09

值得看指数 66.0 NO. 004 · 2026.06.09

Stars3,364

为什么值得看

whichllm 自动检测用户的 GPU/CPU/RAM 配置，从 HuggingFace 筛选并排名能在本地运行的模型。区别于只看参数量的工具，它结合真实 benchmark 分数和模型代际做推荐，避免用户盲目下载跑不动的模型。

Find the local LLM that actually runs and performs best on your hardware. Ranked by real, recency-aware benchmarks, not parameter count. One command, run it instantly.

媒体预览

编辑判断

本地部署 LLM 的团队通常靠手动查表格或社区经验判断模型能不能跑，比如 llama.cpp 的量化对照表或 Reddit 上的硬件讨论帖，费时且容易过时。whichllm 的关键差异是引入了 benchmark 分数和活跃参数量（对 MoE 模型尤其重要），而不仅是看总参数量能不能塞进显存。

同类工具如 ollama 侧重一键运行，但不解决选哪个模型的问题；lm-studio 有模型浏览器，但不做硬件适配推荐。whichllm 填补了选型决策的空白。

如果你正在搭建内部 LLM 推理服务或帮客户做私有化部署，这个工具能省掉大量试跑时间，特别适合需要向非技术客户解释为什么选 27B 而不是 32B 的场景。

Star History

生态分析

Beta

面向终端用户的本地LLM硬件适配与智能选型工具，填补模型发现与硬件匹配之间的空白

独特价值：基于真实benchmark和硬件检测做运行可行性排名，而非仅按参数量推荐

查看原文 →