自动匹配硬件的最佳本地LLM
值得看指数 66.0 NO. 004 · 2026.06.09
Stars3,364
为什么值得看
whichllm 自动检测用户的 GPU/CPU/RAM 配置,从 HuggingFace 筛选并排名能在本地运行的模型。区别于只看参数量的工具,它结合真实 benchmark 分数和模型代际做推荐,避免用户盲目下载跑不动的模型。
Find the local LLM that actually runs and performs best on your hardware. Ranked by real, recency-aware benchmarks, not parameter count. One command, run it instantly.
媒体预览
编辑判断
本地部署 LLM 的团队通常靠手动查表格或社区经验判断模型能不能跑,比如 llama.cpp 的量化对照表或 Reddit 上的硬件讨论帖,费时且容易过时。whichllm 的关键差异是引入了 benchmark 分数和活跃参数量(对 MoE 模型尤其重要),而不仅是看总参数量能不能塞进显存。
同类工具如 ollama 侧重一键运行,但不解决选哪个模型的问题;lm-studio 有模型浏览器,但不做硬件适配推荐。whichllm 填补了选型决策的空白。
如果你正在搭建内部 LLM 推理服务或帮客户做私有化部署,这个工具能省掉大量试跑时间,特别适合需要向非技术客户解释为什么选 27B 而不是 32B 的场景。
Star History
生态分析
Beta
面向终端用户的本地LLM硬件适配与智能选型工具,填补模型发现与硬件匹配之间的空白
独特价值:基于真实benchmark和硬件检测做运行可行性排名,而非仅按参数量推荐