作者提出了一种通过人类交互轨迹蒸馏为紧凑的自然语言技能,来实现浏览器代理的可扩展行为克隆的方法。这些蒸馏后的技能可以直接由代理读取、检索、重用和组合。
- 该方法将用户交互轨迹转换为可重用的技能,解决了在信息不完整下决策的瓶颈问题。
- 蒸馏后的技能被组织成技能图,以确保通过整合而非无限积累来实现增长。
- 该项目旨在利用集体的人类浏览技能,而不是手动设计的任务。
这项工作表明,浏览器代理的可扩展性源于重用现有的人类交互模式。该项目是。
作者提出了一种通过人类交互轨迹蒸馏为紧凑的自然语言技能,来实现浏览器代理的可扩展行为克隆的方法。这些蒸馏后的技能可以直接由代理读取、检索、重用和组合。
这项工作表明,浏览器代理的可扩展性源于重用现有的人类交互模式。该项目是。