一位非程序员分享了在配备 128GB 统一内存的 MacBook M5 Max 上设置本地大型语言模型基础设施的经验。用户详细介绍了他们的软件栈、模型选择以及在学习 AI 的同时建立稳定、可远程访问系统的目标。

  • 硬件:MacBook M5 Max(18核 CPU,40核 GPU,128GB 统一内存,4TB 存储)运行 OS Tahoe。
  • 推理栈:Docker Desktop 配合 Docker Model Runner 以完全访问 Metal GPU,并通过 Docker Compose 使用 Open WebUI。
  • 模型:Gemma 4(约 12B)用于日常使用,Qwen3 30B-A3B-Q4_k_m 用于深度研究。
  • RAG 实现:SentenceTransformers 嵌入,包含多个基于主题的集合,内含 AI 编写的 markdown 文件和制造商 PDF。
  • 其他工具:DrawThings 用于图像/视频生成,MacWhisper Pro 用于转录,Kokoro TTS 用于本地语音输出。

作者的目标是从频繁使用 Claude Pro 等云服务转向更频繁地使用其本地设置,同时继续学习 AI 安全和智能体系统。