Inference-APP-Document-Understanding-at-linelevel-v2

Runtime error

pierreguillou commited on Mar 6, 2023

Commit

d3e0af2

•

1 Parent(s): b05819d

Update files/functions.py

Files changed (1) hide show

files/functions.py CHANGED Viewed

@@ -137,13 +137,14 @@ langdetect2Tesseract = {v:k for k,v in Tesseract2langdetect.items()}
 ## model / feature extractor / tokenizer
-from transformers import LayoutLMv2ForTokenClassification # LayoutXLMTokenizerFast,
 import torch
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 # model
-# tokenizer = LayoutXLMTokenizerFast.from_pretrained(model_id)
 model = LayoutLMv2ForTokenClassification.from_pretrained(model_id);
 model.to(device);
@@ -153,6 +154,7 @@ feature_extractor = LayoutLMv2FeatureExtractor(apply_ocr=False)
 # tokenizer
 from transformers import AutoTokenizer
 tokenizer = AutoTokenizer.from_pretrained(tokenizer_id)
 ## General

 ## model / feature extractor / tokenizer
 import torch
 device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 # model
+from transformers import LayoutLMv2ForTokenClassification
+model_id = "pierreguillou/layout-xlm-base-finetuned-with-DocLayNet-base-at-linelevel-ml384"
 model = LayoutLMv2ForTokenClassification.from_pretrained(model_id);
 model.to(device);
 # tokenizer
 from transformers import AutoTokenizer
+tokenizer_id = "xlm-roberta-base"
 tokenizer = AutoTokenizer.from_pretrained(tokenizer_id)
 ## General