한 사용자가 Unsloth를 사용하여 Phi-3.5-mini-instruct 모델을 학습하기 위한 최적의 프롬프트 포맷팅 전략에 대한 조언을 구하고 있습니다. 이 문의는 사용자 정의 텍스트 형식을 유지하는 것과 데이터셋 준비를 위해 표준 채팅 템플릿을 사용하는 것을 대조합니다. 현재 구현은 데이터를 '### Input:' 및 '### Output:' 섹션으로 구조화하고 텍스트 종료 토큰을 추가하는 함수를 사용합니다. 이 접근 방식은 Hugging Face Dataset 객체에서 파생된 JSON 인코딩된 입력 및 출력 필드를 처리합니다. 제공된 예시는 재무 통찰력, 상인 이름, 날짜 및 거래 총액을 포함하는 복잡한 구조를 보여줍니다. 사용자는 사용자 정의 API를 통해 학습된 모델을 배포할 의도가 있으며, 이 형식을 유지할지 채팅 템플릿으로 전환할지에 대한 지침을 요청합니다.
Unsloth/Phi-3.5-mini-instruct 학습을 위한 프롬프트 형식 문의
번역 English → 한국어