파인튜닝

#10
by kakarooky - opened

안녕하세요.
우선 좋은 모델 만들어 주셔서 감사합니다.

파인튜닝을 좀 해보려고 하는데, 기존 파인튜닝 방법으로는 잘 되지 않더라구요.
(다른 Llama3 기반 한국어 모델들은 튜닝이 되는데...)
혹시 입력 컨텍스트가 조금 다른가 해서 질문 드립니다.

# 입력 dataset
{'text': '<s>[INST] 라이브 스트리밍이란? [/INST] Live Streaming은 방송 현장에서 중계되는 영상이나 이미 편성된 동영상 미디어 파일을 사용자에게 실시간으로 전송하는 서비스입니다.\\n주로 스포츠 중계, 온라인 교육, 개인 방송, 메타버스, 라이브 커머스 등의 서비스에 사용합니다. </s>'}

# 파인튜닝 후, 추론
[{'generated_text': '<s>[INST] 라이브 스트리밍이란 [/INST]<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s<s'}]

관련하여 간단하게 파인튜닝 가능한 dataset 이나 아니면, 소스코드 공개가 가능할까요?

MLP-LAB org
edited Jul 19

안녕하세요 서울과학기술대학교 MLP Lab
신동재 연구원 입니다.

기재해주신 프롬프트는 llama2 프롬프트로 보입니다 본 모델은 llama3 기반 모델이기 때문에 README 예시에 적혀있는 프롬프트를 참조해주시길 바랍니다.

추가적으로 현재 데이터셋 및 소스코드 공개는 어려운점 양해부탁드립니다.

BLLOSSOM 모델을 사용해주셔서 감사합니다

ShinDJ changed discussion status to closed

Sign up or log in to comment