|
--- |
|
language: |
|
- vi |
|
library_name: transformers |
|
pipeline_tag: text-classification |
|
tags: |
|
- Vietnamese |
|
- sentiment |
|
- analysis |
|
--- |
|
|
|
# Sentiment Analysis in Vietnamese - Phân tích cảm xúc trong tiếng Việt |
|
## Phở Bert phân tích cảm xúc |
|
|
|
|
|
## Model description |
|
|
|
Mô hình có tác dụng xác định cảm xúc của đoạn văn. |
|
Sử dụng nhãn: "Tích cực", "Tiêu cực", "Trung tính" |
|
|
|
Ví dụ: |
|
Thời tiết hôm nay không được đẹp, trời mưa và lạnh. |
|
```text |
|
Tiêu cực: 0.9596341252326965 |
|
Tích cực: 0.010115462355315685 |
|
Trung tính: 0.030250443145632744 |
|
``` |
|
|
|
Hôm nay đi làm thật vui, ăn uống thật ngon. |
|
```text |
|
Tiêu cực: 0.002220266032963991 |
|
Tích cực: 0.9917450547218323 |
|
Trung tính: 0.006034655496478081 |
|
``` |
|
|
|
Bình thường. Không có gì đặc biệt. |
|
```text |
|
Tiêu cực: 0.03198615834116936 |
|
Tích cực: 0.05307402461767197 |
|
Trung tính: 0.9149397611618042 |
|
``` |
|
|
|
## Base model |
|
|
|
Mô hình được đạo tạo dựa trên cơ sở của model PhoBert-Base của VinAI (https://huggingface.co/vinai/phobert-large) |
|
|
|
## Training data |
|
|
|
Mô hình được đào tạo dựa trên dữ liệu được thu thập bởi linhlpv (https://www.kaggle.com/datasets/linhlpv/vietnamese-sentiment-analyst) - có chỉnh sửa. |
|
Với 31436 nội dung đánh giá sảm phẩm. |
|
|
|
## Model variations |
|
|
|
Chưa xác định |
|
|
|
## Intended uses & limitations |
|
|
|
Chưa xác định |
|
|
|
## License |
|
|
|
Đây là một open-source library, bạn có thể sử dụng nó với bất kì mục đích nào. |
|
Rất cảm ơn nếu bạn ghi nguồn khi sử dụng mô hình này (nếu không ghi cũng không sao). |
|
|
|
### How to use |
|
|
|
```python |
|
from transformers import AutoTokenizer, AutoModelForSequenceClassification |
|
import torch |
|
import os |
|
|
|
|
|
def clear(): |
|
os.system('clear') |
|
|
|
|
|
checkpoint = "mr4/phobert-base-vi-sentiment-analysis" |
|
tokenizer = AutoTokenizer.from_pretrained(checkpoint) |
|
model = AutoModelForSequenceClassification.from_pretrained(checkpoint) |
|
clear() |
|
print("Ngày hôm nay của bạn thế nào?") |
|
val = input("") |
|
raw_inputs = [val] |
|
inputs = tokenizer(raw_inputs, padding=True, |
|
truncation=True, return_tensors="pt") |
|
outputs = model(**inputs) |
|
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1) |
|
clear() |
|
print(">>>>>>>>>>>>>>>>>>>>>>>>>>") |
|
for i, prediction in enumerate(predictions): |
|
print(raw_inputs[i]) |
|
for j, value in enumerate(prediction): |
|
print( |
|
" " + model.config.id2label[j] + ": " + str(value.item())) |
|
print("<<<<<<<<<<<<<<<<<<<<<<<<<<") |
|
|
|
``` |
|
|
|
## Liên hệ |
|
|
|
Mọi thông tin liên quan có thể liên hệ qua email: zZz4everzZz@live.co.uk. |