IceFog72 为 llama.cpp 添加了实验性 "scatter" 采样器

IceFog72 为 llama.cpp 实现了一种实验性的 "scatter" 采样器，它在顶级候选者中局部平滑下一个 token 的概率分布。这种方法旨在减少生成的僵化性，同时不引入来自分布深层尾部的噪声。

该工具提供了比提高温度更局部的替代方案，在避免由弱尾部 token 引起的不连贯跳跃的同时，提供更精细的文生多样性控制。