本地ML索引669GB视频实战
推荐指数 72.0 NO. 015 · 2026.06.15
发布2026/06/14Score129Comments31
为什么值得看
开发者用M1 Max笔记本+纯本地模型(Whisper、CLIP、Ollama)对669GB GoPro素材做语义检索,全程不上云。证明了个人设备+开源模型已能替代商业视频管理方案,隐私和成本优势显著。
媒体预览
编辑判断
这个项目最值得关注的是它的"反云"架构选择——没有调用任何API,连embedding都是本地跑的。目前主流的视频语义检索方案要么依赖Google Photos/Apple的云端AI,要么需要搭建昂贵的GPU服务器,个人开发者很难复刻。
他用Ollama跑本地LLM做自然语言查询、Whisper做语音转录、CLIP做画面语义匹配,这套组合的成本几乎为零,但效果足够覆盖90%的个人视频管理场景。对于处理敏感素材(医疗、法律、个人隐私)或网络受限环境的团队,这个方案可以直接抄作业。
一个可以改进的方向:他没有提到检索延迟和索引构建时间的具体数字,这是本地方案能否规模化的关键瓶颈。如果你要复现,建议先用100GB以内的数据集做POC,验证QPS是否可接受再扩容。
社区反馈
意见分歧 31 条评论
核心争论:本地AI处理视频的可行性及硬件选择,M1 Max统一内存架构成关键优势
the link https://iliashaddad.com/blog/i-indexed-669-gb-of-my-gopro-vi...
Thank you
This would fit most best as a “Show HN:” post :)