执行性能问题

#19
by fffff123 - opened
  1. model(**inputs, return_dict=True).logits.view(-1, ).float() 这行代码执行会耗时很大,求教是啥原因呢,要2s左右了,怎么优化呢?
  2. FlagEmbedding 、 Huggingface transformers、reranker with the ONNX files、reranker with infinity 这几种调用方式,性能有区别么

Sign up or log in to comment