mr4 commited on
Commit
2ae4669
1 Parent(s): af5fa91

Create README.md

Browse files
Files changed (1) hide show
  1. README.md +101 -0
README.md ADDED
@@ -0,0 +1,101 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language:
3
+ - vi
4
+ library_name: transformers
5
+ pipeline_tag: text-classification
6
+ tags:
7
+ - Vietnamese
8
+ - sentiment
9
+ - analysis
10
+ ---
11
+
12
+ # Sentiment Analysis in Vietnamese - Phân tích cảm xúc trong tiếng Việt
13
+ ## Phở Bert phân tích cảm xúc
14
+
15
+
16
+ ## Model description
17
+
18
+ Mô hình có tác dụng xác định cảm xúc của đoạn văn.
19
+ Sử dụng nhãn: "Tích cực", "Tiêu cực", "Trung tính"
20
+
21
+ Ví dụ:
22
+ Thời tiết hôm nay không được đẹp, trời mưa và lạnh.
23
+ ```text
24
+ Tiêu cực: 0.9596341252326965
25
+ Tích cực: 0.010115462355315685
26
+ Trung tính: 0.030250443145632744
27
+ ```
28
+
29
+ Hôm nay đi làm thật vui, ăn uống thật ngon.
30
+ ```text
31
+ Tiêu cực: 0.002220266032963991
32
+ Tích cực: 0.9917450547218323
33
+ Trung tính: 0.006034655496478081
34
+ ```
35
+
36
+ Bình thường. Không có gì đặc biệt.
37
+ ```text
38
+ Tiêu cực: 0.03198615834116936
39
+ Tích cực: 0.05307402461767197
40
+ Trung tính: 0.9149397611618042
41
+ ```
42
+
43
+ ## Base model
44
+
45
+ Mô hình được đạo tạo dựa trên cơ sở của model PhoBert-Base của VinAI (https://huggingface.co/vinai/phobert-large)
46
+
47
+ ## Training data
48
+
49
+ Mô hình được đào tạo dựa trên dữ liệu được thu thập bởi linhlpv (https://www.kaggle.com/datasets/linhlpv/vietnamese-sentiment-analyst) - có chỉnh sửa.
50
+ Với 31436 nội dung đánh giá sảm phẩm.
51
+
52
+ ## Model variations
53
+
54
+ Chưa xác định
55
+
56
+ ## Intended uses & limitations
57
+
58
+ Chưa xác định
59
+
60
+ ## License
61
+
62
+ Đây là một open-source library, bạn có thể sử dụng nó với bất kì mục đích nào.
63
+ Rất cảm ơn nếu bạn ghi nguồn khi sử dụng mô hình này (nếu không ghi cũng không sao).
64
+
65
+ ### How to use
66
+
67
+ ```python
68
+ from transformers import AutoTokenizer, AutoModelForSequenceClassification
69
+ import torch
70
+ import os
71
+
72
+
73
+ def clear():
74
+ os.system('clear')
75
+
76
+
77
+ checkpoint = "mr4/phobert-base-vi-sentiment-analysis"
78
+ tokenizer = AutoTokenizer.from_pretrained(checkpoint)
79
+ model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
80
+ clear()
81
+ print("Ngày hôm nay của bạn thế nào?")
82
+ val = input("")
83
+ raw_inputs = [val]
84
+ inputs = tokenizer(raw_inputs, padding=True,
85
+ truncation=True, return_tensors="pt")
86
+ outputs = model(**inputs)
87
+ predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
88
+ clear()
89
+ print(">>>>>>>>>>>>>>>>>>>>>>>>>>")
90
+ for i, prediction in enumerate(predictions):
91
+ print(raw_inputs[i])
92
+ for j, value in enumerate(prediction):
93
+ print(
94
+ " " + model.config.id2label[j] + ": " + str(value.item()))
95
+ print("<<<<<<<<<<<<<<<<<<<<<<<<<<")
96
+
97
+ ```
98
+
99
+ ## Liên hệ
100
+
101
+ Mọi thông tin liên quan có thể liên hệ qua email: zZz4everzZz@live.co.uk.