bitnet-Llama3-8B-1.58-100B-tokens-GGUF

Runtime error

5fp commited on Sep 23, 2024

Commit

382bd2f

verified ·

1 Parent(s): 13355db

Update Dockerfile

Files changed (1) hide show

Dockerfile CHANGED Viewed

@@ -4,7 +4,7 @@ ARG BASE_CPU_CONTAINER=ubuntu:${UBUNTU_VERSION}
 FROM ${BASE_CPU_CONTAINER} as build
 RUN apt-get update && \
-    apt-get install -y build-essential git cmake wget
 WORKDIR /build
@@ -15,10 +15,11 @@ WORKDIR /build/llama.cpp
 # Ensure that LLAMA_CUBLAS is not set to 1
 ENV LLAMA_CUBLAS=0
-RUN mkdir build && \
-    cd build && \
-    cmake .. && \
-    cmake --build . --config Release --target llama-server
 WORKDIR /data
 RUN wget https://huggingface.co/brunopio/Llama3-8B-1.58-100B-tokens-GGUF/resolve/main/Llama3-8B-1.58-100B-tokens-TQ2_0.gguf -nv -O model.gguf
@@ -28,7 +29,7 @@ FROM ${BASE_CPU_CONTAINER} as runtime
 WORKDIR /app
 # Copy the executable from the build stage
-COPY --from=build /build/llama.cpp/build/bin/llama-server /app
 COPY --from=build /data/model.gguf /data/model.gguf
 COPY ./run.sh /app/run.sh
 WORKDIR /app

 FROM ${BASE_CPU_CONTAINER} as build
 RUN apt-get update && \
+    apt-get install -y build-essential git make cmake wget
 WORKDIR /build
 # Ensure that LLAMA_CUBLAS is not set to 1
 ENV LLAMA_CUBLAS=0
+RUN make llama-server
+#RUN mkdir build && \
+#    cd build && \
+#    cmake .. && \
+#    cmake --build . --config Release --target llama-server
 WORKDIR /data
 RUN wget https://huggingface.co/brunopio/Llama3-8B-1.58-100B-tokens-GGUF/resolve/main/Llama3-8B-1.58-100B-tokens-TQ2_0.gguf -nv -O model.gguf
 WORKDIR /app
 # Copy the executable from the build stage
+COPY --from=build /build/llama.cpp/llama-server /app
 COPY --from=build /data/model.gguf /data/model.gguf
 COPY ./run.sh /app/run.sh
 WORKDIR /app