Update README.md
Browse files
README.md
CHANGED
@@ -14,6 +14,9 @@ pipeline_tag: question-answering
|
|
14 |
Pretraining Model: [wangchanberta-base-att-spm-uncased](https://huggingface.co/airesearch/wangchanberta-base-att-spm-uncased).
|
15 |
|
16 |
This is the wangchanberta-base-att-spm-uncased model, fine-tuned using the thaiqa_squad dataset.
|
|
|
|
|
|
|
17 |
## Data cleaning
|
18 |
Remove HTML tags using BeautifulSoup and remove punctuation using string.punctuation.
|
19 |
```python
|
@@ -32,6 +35,4 @@ no_punct = [char for char in example if char not in punct]
|
|
32 |
example = ''.join(no_punct)
|
33 |
print(example)
|
34 |
#"ลูนา 1 ลูนา 1 อี1 ซีรีส์ ซึ่งในขณะนั้นรู้จักกันในชื่อ เมชตา ความฝัน เป็นยานอวกาศลำแรกที่เดินทางไปถึงบริเวณใกล้เคียงของดวงจันทร์ และเป็นยานอวกาศลำแรกในโครงการลูนาของโซเวียตที่สามารถปล่อยขึ้นไปในทิศทางเดียวกับดวงจันทร์ได้สำเร็จ"
|
35 |
-
```
|
36 |
-
|
37 |
-
https://github.com/tommyA8/wangchanBERTa-fined-tune-thaiqa_squad
|
|
|
14 |
Pretraining Model: [wangchanberta-base-att-spm-uncased](https://huggingface.co/airesearch/wangchanberta-base-att-spm-uncased).
|
15 |
|
16 |
This is the wangchanberta-base-att-spm-uncased model, fine-tuned using the thaiqa_squad dataset.
|
17 |
+
|
18 |
+
# Souce code
|
19 |
+
https://github.com/tommyA8/wangchanBERTa-fined-tune-thaiqa_squad
|
20 |
## Data cleaning
|
21 |
Remove HTML tags using BeautifulSoup and remove punctuation using string.punctuation.
|
22 |
```python
|
|
|
35 |
example = ''.join(no_punct)
|
36 |
print(example)
|
37 |
#"ลูนา 1 ลูนา 1 อี1 ซีรีส์ ซึ่งในขณะนั้นรู้จักกันในชื่อ เมชตา ความฝัน เป็นยานอวกาศลำแรกที่เดินทางไปถึงบริเวณใกล้เคียงของดวงจันทร์ และเป็นยานอวกาศลำแรกในโครงการลูนาของโซเวียตที่สามารถปล่อยขึ้นไปในทิศทางเดียวกับดวงจันทร์ได้สำเร็จ"
|
38 |
+
```
|
|
|
|