一位用户寻求在使用 Unsloth 训练 Phi-3.5-mini-instruct 模型时,关于最佳提示格式化策略的建议。该咨询对比了保持自定义文本格式与使用标准聊天模板进行数据集准备之间的差异。当前实现采用了一个函数,将数据构建为 '### Input:' 和 '### Output:' 部分,并附加一个文本结束标记。此方法处理源自 Hugging Face Dataset 对象的 JSON 编码输入和输出字段。提供的示例展示了一个涉及财务洞察、商户名称、日期和交易总额的复杂结构。用户计划通过自定义 API 部署训练好的模型,并请求指导是保留此格式还是切换到聊天模板。