Spaces:

lmz
/

candle-llama2

Running

radames commited on Sep 27, 2023

Commit

c0a0d79

•

1 Parent(s): dc843c4

fix first token

Files changed (1) hide show

llama2cWorker.js CHANGED Viewed

@@ -50,6 +50,7 @@ async function generate(data) {
     tokenizerURL,
     prompt,
     temp,
     repeatPenalty,
     seed,
     maxSeqLen,
@@ -59,11 +60,17 @@ async function generate(data) {
     const model = await Llama2C.getInstance(weightsURL, modelID, tokenizerURL);
     self.postMessage({ status: "loading", message: "Initializing model" });
-    model.init_with_prompt(prompt, temp, repeatPenalty, seed);
     const seq_len = model.get_seq_len();
-    let sentence = "";
     let maxTokens = maxSeqLen ? maxSeqLen : seq_len - prompt.length - 1;
     let startTime = performance.now();
     let tokensCount = 0;

     tokenizerURL,
     prompt,
     temp,
+    top_p,
     repeatPenalty,
     seed,
     maxSeqLen,
     const model = await Llama2C.getInstance(weightsURL, modelID, tokenizerURL);
     self.postMessage({ status: "loading", message: "Initializing model" });
+    const firstToken = model.init_with_prompt(
+      prompt,
+      temp,
+      top_p,
+      repeatPenalty,
+      seed
+    );
     const seq_len = model.get_seq_len();
+    let sentence = firstToken;
     let maxTokens = maxSeqLen ? maxSeqLen : seq_len - prompt.length - 1;
     let startTime = performance.now();
     let tokensCount = 0;