nguyendangsonlam
commited on
Commit
•
3a77a96
1
Parent(s):
03a218f
Create README.md
Browse files
README.md
ADDED
@@ -0,0 +1,29 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
---
|
2 |
+
widget:
|
3 |
+
- text: " Chiều 3/1, Đoàn công tác của Báo Nhân Dân do đồng chí Lê Quốc Minh, Ủy viên Trung ương Đảng, Tổng Biên tập Báo Nhân Dân, Phó Trưởng Ban Tuyên giáo Trung ương, Chủ tịch Hội Nhà báo Việt Nam làm Trưởng đoàn đã có buổi làm việc với lãnh đạo tỉnh Tuyên Quang."
|
4 |
+
tags:
|
5 |
+
- named-entity-recognition
|
6 |
+
language:
|
7 |
+
- vi
|
8 |
+
model-index:
|
9 |
+
- name: lsg-ner-vietnamese-electra-base-1024
|
10 |
+
results: []
|
11 |
+
---
|
12 |
+
|
13 |
+
# LSG ner vietnamese electra base model with max input length of 1024
|
14 |
+
A LSG version with extended input length based on [NlpHUST/ner-vietnamese-electra-base](https://huggingface.co/NlpHUST/ner-vietnamese-electra-base) and [LSG Attention](https://arxiv.org/abs/2210.15497).\
|
15 |
+
|
16 |
+
## Usage
|
17 |
+
Fill mask example:
|
18 |
+
```python:
|
19 |
+
from transformers import AutoModelForTokenClassification, AutoTokenizer, pipeline
|
20 |
+
|
21 |
+
model = AutoModelForTokenClassification.from_pretrained("nguyendangsonlam/lsg-ner-vietnamese-electra-base-1024", trust_remote_code=True)
|
22 |
+
tokenizer = AutoTokenizer.from_pretrained("nguyendangsonlam/lsg-ner-vietnamese-electra-base-1024")
|
23 |
+
|
24 |
+
nlp = pipeline("ner", model=model, tokenizer=tokenizer)
|
25 |
+
example = " Chiều 3/1, Đoàn công tác của Báo Nhân Dân do đồng chí Lê Quốc Minh, Ủy viên Trung ương Đảng, Tổng Biên tập Báo Nhân Dân, Phó Trưởng Ban Tuyên giáo Trung ương, Chủ tịch Hội Nhà báo Việt Nam làm Trưởng đoàn đã có buổi làm việc với lãnh đạo tỉnh Tuyên Quang."
|
26 |
+
|
27 |
+
ner_results = nlp(example)
|
28 |
+
print(ner_results)
|
29 |
+
```
|