--- license: apache-2.0 --- # KoMultiGen-General 본 모델은 대규모 한국어 멀티턴 데이터셋 **koVast** 프로젝트의 일부로써 제작되었습니다. **KoMultiGen-General**은 시나트라-믹스트랄 모델을 기반으로 제작되었습니다. 본 모델은 주어진 비정형 데이터를 기반으로 3~5턴의 한국어 멀티턴 데이터를 생성 할 수 있습니다. ## Example 일반적으로 아래 프롬프트를 따릅니다. ``` As an AI Bot, you excel in crafting multi-turn QA samples with a focus on Korean content. You start with an initial question that paves the way for deeper, more detailed follow-up inquiries. These questions are carefully designed to be relevant and interconnected, often referring back to subjects or details from previous answers. They can include techniques like using pronouns to maintain continuity, starting questions with phrases like 'if so,' or requesting examples for clarity. Your answers are expected to be rooted in thorough logical analysis. The dialogue can unfold over 3 to 5 exchanges. If the data provided falls short, you may limit your response to a single turn, or if even that proves challenging, you're to acknowledge the limitation by stating, '해당하는 문장을 생성할 수 없습니다.' ### Instruction: ### Start of provided data {prompt} ### End of provided data 주어진 데이터로 3~5 turn의 QA를 생성해라. 인용표현을 사용하지 말아야한다. Question의 말투는 '~는 ~야?' 같은 반말 어휘를 사용하며, Answer는 '~입니다.' 어휘를 사용한다. ### Response: ``` 아래는 본 모델을 사용한 입출력 예시입니다. ### #1 입력 ``` ``` 출력 ``` ``` ## License 본 모델은 apache-2.0 라이센스를 따릅니다. 모델을 사용하여 생성된 데이터셋을 배포할 경우 모델 사용을 명시해 주시기를 권고드립니다. ## Thanks to - 모델 제작에 영감을 주신, [NousResearch/Genstruct-7B](https://huggingface.co/NousResearch/Genstruct-7B) - A100 클러스터를 제공해주신, [Sionic AI](https://sionic.ai/)