本文介绍了 Program-as-Weights (PAW),这是一种将自然语言规范编译为紧凑、本地可执行的神经工件的范式,用于替代大型语言模型 API。该方法旨在通过将基础模型视为工具构建者而非逐输入的问题解决者,来改善局部性、可重现性和成本。

  • PAW 使用在 FuzzyBench(一个包含 10M 个示例的新发布数据集)上训练的 4B 编译器。
  • 该系统为冻结的轻量级解释器生成参数高效的适配器,具体使用 0.6B 的 Qwen3 模型。
  • 性能与直接提示 Qwen3-32B 相当,同时仅使用约五十分之一的推理内存。
  • 在 MacBook M3 上,该解决方案以 30 tokens/s 的速度运行,支持廉价且离线的后续调用。

PAW 将基础模型从逐输入的问题解决者重构为工具构建者,生成小型可重用的工件,从而减少对昂贵 API 调用的需求。