Add BERTopic model
Browse files- README.md +150 -0
- config.json +16 -0
- topic_embeddings.safetensors +3 -0
- topics.json +0 -0
README.md
ADDED
@@ -0,0 +1,150 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
|
2 |
+
---
|
3 |
+
tags:
|
4 |
+
- bertopic
|
5 |
+
library_name: bertopic
|
6 |
+
pipeline_tag: text-classification
|
7 |
+
---
|
8 |
+
|
9 |
+
# off-eval-ar-topics
|
10 |
+
|
11 |
+
This is a [BERTopic](https://github.com/MaartenGr/BERTopic) model.
|
12 |
+
BERTopic is a flexible and modular topic modeling framework that allows for the generation of easily interpretable topics from large datasets.
|
13 |
+
|
14 |
+
## Usage
|
15 |
+
|
16 |
+
To use this model, please install BERTopic:
|
17 |
+
|
18 |
+
```
|
19 |
+
pip install -U bertopic
|
20 |
+
```
|
21 |
+
|
22 |
+
You can use the model as follows:
|
23 |
+
|
24 |
+
```python
|
25 |
+
from bertopic import BERTopic
|
26 |
+
topic_model = BERTopic.load("Zaid/off-eval-ar-topics")
|
27 |
+
|
28 |
+
topic_model.get_topic_info()
|
29 |
+
```
|
30 |
+
|
31 |
+
## Topic overview
|
32 |
+
|
33 |
+
* Number of topics: 81
|
34 |
+
* Number of training documents: 8022
|
35 |
+
|
36 |
+
<details>
|
37 |
+
<summary>Click here for an overview of all topics.</summary>
|
38 |
+
|
39 |
+
| Topic ID | Topic Keywords | Topic Frequency | Label |
|
40 |
+
|----------|----------------|-----------------|-------|
|
41 |
+
| -1 | ูุง - ุงููู - ู
ู - ู
ุง - ูู | 10 | -1_ูุง_ุงููู_ู
ู_ู
ุง |
|
42 |
+
| 0 | ุงูููู
- ุฑุญูู
- ูุง - ูุฑูู
- ูููู
| 2956 | 0_ุงูููู
_ุฑุญูู
_ูุง_ูุฑูู
|
|
43 |
+
| 1 | ู
ู - ุงููู
ู - ุนูู - ูู - ุงูุณุนูุฏูุฉ | 552 | 1_ู
ู_ุงููู
ู_ุนูู_ูู |
|
44 |
+
| 2 | ู
ุง - ู
ู - ุงููู - ูู - ูู | 288 | 2_ู
ุง_ู
ู_ุงููู_ูู |
|
45 |
+
| 3 | ุงููู - ูู - ุฏู - ุนูู - ู
ุตุฑ | 261 | 3_ุงููู_ูู_ุฏู_ุนูู |
|
46 |
+
| 4 | ู
ุด - ุงููู - ุฏู - ุฏู - ุงูุง | 213 | 4_ู
ุด_ุงููู_ุฏู_ุฏู |
|
47 |
+
| 5 | ูู - ู
ุงุฎุฐ - ูุง - ุฃุฌู
ู - ุงุบูู | 210 | 5_ูู_ู
ุงุฎุฐ_ูุง_ุฃุฌู
ู |
|
48 |
+
| 6 | ุณูุทุช - ุณูุท - ุจุฑูุงู - ุงูููุงุฏุฉ - ุงุนุชุตุงู
_ุงูููุงุฏุฉ_ุงูุนุงู
ุฉ | 195 | 6_ุณูุทุช_ุณูุท_ุจุฑูุงู_ุงูููุงุฏุฉ |
|
49 |
+
| 7 | ููู - ุฌู
ุงูู - ูุงุฑู - ูู - ุงุฏู | 192 | 7_ููู_ุฌู
ุงูู_ูุงุฑู_ูู |
|
50 |
+
| 8 | ููุง - ุงููู - ูุงููู - ููู - ูุจุงุฑู | 158 | 8_ููุง_ุงููู_ูุงููู_ููู |
|
51 |
+
| 9 | ุงูุง - ู
ุงุนูุฏู - ุญู - ุงู
ุชุญุงู - ุงูู | 153 | 9_ุงูุง_ู
ุงุนูุฏู_ุญู_ุงู
ุชุญุงู |
|
52 |
+
| 10 | ุงูุฒู
ุงูู - ุงูุฏูุฑู - ุฏู - ุงูุงููู - ู
ุงุชุด | 151 | 10_ุงูุฒู
ุงูู_ุงูุฏูุฑู_ุฏู_ุงูุงููู |
|
53 |
+
| 11 | ูุณูุงู - ุทุฑุงุจูุณ - ุญูุชุฑ - ููุจูุง - ุจุบู | 113 | 11_ูุณูุงู_ุทุฑุงุจูุณ_ุญูุชุฑ_ููุจูุง |
|
54 |
+
| 12 | ู
ุตุฑ - ุงููู - ุงูุณูุณู - ุณูุณู - ูู | 112 | 12_ู
ุตุฑ_ุงููู_ุงูุณูุณู_ุณูุณู |
|
55 |
+
| 13 | ุงู
ู - ุฃุญุจู - ูู - ููุฏู - ุงููุณุงุก | 108 | 13_ุงู
ู_ุฃุญุจู_ูู_ููุฏู |
|
56 |
+
| 14 | ุณูู
ุงู - ุนุฒ - ูุทููู - ุงูู
ุฌุฏ - ุงูุฎูุฑ | 108 | 14_ุณูู
ุงู_ุนุฒ_ูุทููู_ุงูู
ุฌุฏ |
|
57 |
+
| 15 | ุทูุจ - ูุงูุช - ูุนูุจุงู - ุณูุฉ - ุญุจูุจู | 103 | 15_ุทูุจ_ูุงูุช_ูุนูุจุงู_ุณูุฉ |
|
58 |
+
| 16 | ุงุจู - ู
ุนุฑุต - ุงููุณุฎู - ููุงุฏ - ุฎูู | 102 | 16_ุงุจู_ู
ุนุฑุต_ุงููุณุฎู_ููุงุฏ |
|
59 |
+
| 17 | ุงููุตุฑ - ุงูุงุชุญุงุฏ - ุงูููุงู - ุนูู - ุฌู
ููุฑ | 97 | 17_ุงููุตุฑ_ุงูุงุชุญุงุฏ_ุงูููุงู_ุนูู |
|
60 |
+
| 18 | ููู - ุดู - ูุจูุงู - ููู - ุจุณ | 96 | 18_ููู_ุดู_ูุจูุงู_ููู |
|
61 |
+
| 19 | ูุฎูููู - ูุงูุชู - ุทูุจู - ุชุณูู
ู - ุญุจูุจุชู | 95 | 19_ูุฎูููู_ูุงูุชู_ุทูุจู_ุชุณูู
ู |
|
62 |
+
| 20 | ุฑูุญู - ุนููู - ุจุงูุญุจ - ุฑูุญ - ุนุฐุงุจู | 73 | 20_ุฑูุญู_ุนููู_ุจุงูุญุจ_ุฑูุญ |
|
63 |
+
| 21 | ูุงุฎุฐู - ุฒูุฑุงู - ููุจ - ุงููุบุฑู - ุงูููุจ | 72 | 21_ูุงุฎุฐู_ุฒูุฑุงู_ููุจ_ุงููุบุฑู |
|
64 |
+
| 22 | ุญูู - ุฑุงุฌุนูู - ุจุนุฏู - ููู - ุญุจูุจู | 68 | 22_ุญูู_ุฑุงุฌุนูู_ุจุนุฏู_ููู |
|
65 |
+
| 23 | ุงููู - ุฃููู - ุงููู - ู
ุนุงู - ูุฏูุง__ูุง__ุงููู | 67 | 23_ุงููู_ุฃููู_ุงููู_ู
ุนุงู |
|
66 |
+
| 24 | ุฑุจ - ุจุงู - ููุนูู - ุฒููุจ - ุฑูุง | 57 | 24_ุฑุจ_ุจุงู_ููุนูู_ุฒููุจ |
|
67 |
+
| 25 | ุฑุงูู - ุจูุช - ุฏูุน - ุจุช - ููุจู | 52 | 25_ุฑุงูู_ุจูุช_ุฏูุน_ุจุช |
|
68 |
+
| 26 | ุญุธูู
- ุญูู - ุฑุจุงู - ุฏุงูู
- ุจุนุฏูู | 52 | 26_ุญุธูู
_ุญูู_ุฑุจุงู_ุฏุงูู
|
|
69 |
+
| 27 | ุงูุงุชุญุงุฏ_ุงููุตุฑ - ุนู
ูุฏ - ุงูุงุชุญุงุฏ - ุงุชุญุงุฏ - ุงุชู | 45 | 27_ุงูุงุชุญุงุฏ_ุงููุตุฑ_ุนู
ูุฏ_ุงูุงุชุญุงุฏ_ุงุชุญุงุฏ |
|
70 |
+
| 28 | ุงูู - ุงู - ูู - ุงูุจูุช - ุงูุฒูุงุฌ | 43 | 28_ุงูู_ุงู_ูู_ุงูุจูุช |
|
71 |
+
| 29 | ุงูุณูุงู
- ู
ูุฏู - ุญุณูู - ุนููู - ู
ููุงู | 43 | 29_ุงูุณูุงู
_ู
ูุฏู_ุญุณูู_ุนููู |
|
72 |
+
| 30 | ุณูุงู
ู - ุงูู - ุงูุฒู
ุงูู - ู
ุงูุณุชุฑู - ุณุงุณู | 42 | 30_ุณูุงู
ู_ุงูู_ุงูุฒู
ุงูู_ู
ุงูุณุชุฑู |
|
73 |
+
| 31 | ุงุฎู - ู
ุด - ุจูุชู - ูุถุญุงู - ูุถุญู | 42 | 31_ุงุฎู_ู
ุด_ุจูุชู_ูุถุญุงู |
|
74 |
+
| 32 | ู
ุฌูุณ - ูุฒูุฑ - ุงููููุช - ุงูุดุนุจ - ุจุงููุงุชุณ | 41 | 32_ู
ุฌูุณ_ูุฒูุฑ_ุงููููุช_ุงูุดุนุจ |
|
75 |
+
| 33 | ุดุฎุตู - ุงูุญูู - ูุฌู
ู - ู
ูุตุฏู - ุงูุฃุญุจ | 40 | 33_ุดุฎุตู_ุงูุญูู_ูุฌู
ู_ู
ูุตุฏู |
|
76 |
+
| 34 | ู
ูุณู - ู
ูุณู - ูุงุนู
ุฑู - ูุฑูุณุชูุงูู - ุจูุซูุงุซุฉ | 40 | 34_ู
ูุณู_ู
ูุณู_ูุงุนู
ุฑู_ูุฑูุณุชูุงูู |
|
77 |
+
| 35 | ุงูุดุนุจ - ุงูุฌุฒุงุฆุฑ - ุงูุฌุฒุงุฆุฑู - ุฅุญูุธ - ุตุงูุญ | 40 | 35_ุงูุดุนุจ_ุงูุฌุฒุงุฆุฑ_ุงูุฌุฒุงุฆุฑู_ุฅุญูุธ |
|
78 |
+
| 36 | ุตูุงุญ - ููู
ุจุงูู - ุณูุงู
- ุนููู - ููู | 39 | 36_ุตูุงุญ_ููู
ุจุงูู_ุณูุงู
_ุนููู |
|
79 |
+
| 37 | ู
ุนูู
- ู
ุณูู
ู - ุตูู - ุฌุงุงุงุงุงุณุฑ - ุฒู
ู | 39 | 37_ู
ุนูู
_ู
ุณูู
ู_ุตูู_ุฌุงุงุงุงุงุณุฑ |
|
80 |
+
| 38 | ุนู
- ุงุณู
ุงุนูู - ุญุฌ - ุชุนุจุงู - ู
ุนุชุฒ | 37 | 38_ุนู
_ุงุณู
ุงุนูู_ุญุฌ_ุชุนุจุงู |
|
81 |
+
| 39 | ุงูู - ุจููููุณ - trump - maga - ูุจูู | 37 | 39_ุงูู_ุจููููุณ_trump_maga |
|
82 |
+
| 40 | ุฑุจ - ุงูุตุฑูุง - ุบูุงุจุฉ - ุงุณุชุฑูุง - ูููุง | 35 | 40_ุฑุจ_ุงูุตุฑูุง_ุบูุงุจุฉ_ุงุณุชุฑูุง |
|
83 |
+
| 41 | ูุงูุชู - ุทูุจู - ุทูุจุฉ - ุณูุฉ - ุฏุงูู
ุง | 35 | 41_ูุงูุชู_ุทูุจู_ุทูุจุฉ_ุณูุฉ |
|
84 |
+
| 42 | ุงุดู - ูุงู - ุจุงูุฌุงู
ุนุฉ - ุจุณ - ู
ูู | 32 | 42_ุงุดู_ูุงู_ุจุงูุฌุงู
ุนุฉ_ุจุณ |
|
85 |
+
| 43 | ุฃููู - ูุฑูู
- ุฃุณุชุฌุจ - ุชูุนูู - ุงููู | 32 | 43_ุฃููู_ูุฑูู
_ุฃุณุชุฌุจ_ุชูุนูู |
|
86 |
+
| 44 | ู
ุนูููููููููููู - ูุงุญุจูุจู - ุณุงุงุชุฑุฑุฑุฑุฑ - ูููููู - ุฌุฏุน | 31 | 44_ู
ุนูููููููููููู_ูุงุญุจูุจู_ุณุงุงุชุฑุฑุฑุฑุฑ_ูููููู |
|
87 |
+
| 45 | ุนุงู
- ุฃุฌู
ู - ุฎุฑูุฌุฉ - ุฎุฑูุฌู - ุงุฌู
ู | 30 | 45_ุนุงู
_ุฃุฌู
ู_ุฎุฑูุฌุฉ_ุฎุฑูุฌู |
|
88 |
+
| 46 | ูุงุฑุจ - ุงุณุชุฌุจ - ุตู
ุฏ - ูููู
- ุฑุญูู
| 30 | 46_ูุงุฑุจ_ุงุณุชุฌุจ_ุตู
ุฏ_ูููู
|
|
89 |
+
| 47 | ูุงู - ููุงู - ุฑุณูู - ุณู - ุงููู | 30 | 47_ูุงู_ููุงู_ุฑุณูู_ุณู |
|
90 |
+
| 48 | ูู - ูุฑุจู - ูุซุฑ - ุงูุญููุฉ - ุดูู | 27 | 48_ูู_ูุฑุจู_ูุซุฑ_ุงูุญููุฉ |
|
91 |
+
| 49 | ุฅูุญููู
- ู
ูุฏู - ุงูุณูุงู
- ุญุณูู - mahdisonofhussain | 26 | 49_ุฅูุญููู
_ู
ูุฏู_ุงูุณูุงู
_ุญุณูู |
|
92 |
+
| 50 | ุงูุถุงู
ู - ู
ุฑูู - ุงูู
ุฏู - ุตุฏุฑ - ุงูุญุฒูู | 25 | 50_ุงูุถุงู
ู_ู
ุฑูู_ุงูู
ุฏู_ุตุฏุฑ |
|
93 |
+
| 51 | ุฎุฎุฎุฎุฎุฎุฎ - ููููููููููููููู - ูููููููููููู - ููุญุฑูู - ุชุนุตุจ | 25 | 51_ุฎุฎุฎุฎุฎุฎุฎ_ููููููููููููููู_ูููููููููููู_ููุญุฑูู |
|
94 |
+
| 52 | ูููุณ - ุงูู - ููุงุฏ - ุตุจุงุญู_ุจูุถุญู_ู
ุน_ูููุณ - ุตุจุงุญู_ุนุงูุฑุงุฏูู9090 | 22 | 52_ูููุณ_ุงูู_ููุงุฏ_ุตุจุงุญู_ุจูุถุญู_ู
ุน_ูููุณ |
|
95 |
+
| 53 | ูุจุงุฑู - ุนููู - ุฑุณูู - ูุณูู
- ุตู | 22 | 53_ูุจุงุฑู_ุนููู_ุฑุณูู_ูุณูู
|
|
96 |
+
| 54 | ุฏูุงุฑู - ุฅุชูุงุฆู - ุถูุฆู - ุฅูุดุฑุงุญู - ูุชูู | 21 | 54_ุฏูุงุฑู_ุฅุชูุงุฆู_ุถูุฆู_ุฅูุดุฑุงุญู |
|
97 |
+
| 55 | ููู - ู
ุงุฎูุฐู - ุถูุจู - ู
ุฌู
ุน_ุงูุฃุฏุจ - ุญูุจุงููุจ | 20 | 55_ููู_ู
ุงุฎูุฐู_ุถูุจู_ู
ุฌู
ุน_ุงูุฃุฏุจ |
|
98 |
+
| 56 | ุชูุชููุงู
- ุงูุงูุณ - ุฎุงูุฉ - ุงููููุฑ - ูุจูุฑ | 19 | 56_ุชูุชููุงู
_ุงูุงูุณ_ุฎุงูุฉ_ุงููููุฑ |
|
99 |
+
| 57 | ูุดุจูู - ุญุจุงู - ุฑููุจ - ุงูุดูู - ู
ุดุชุงููู | 19 | 57_ูุดุจูู_ุญุจุงู_ุฑููุจ_ุงูุดูู |
|
100 |
+
| 58 | ุงูุนุฑุงู - ุตุฏุงู
- ูุณู - ูุงู - ุดุนุจ | 18 | 58_ุงูุนุฑุงู_ุตุฏุงู
_ูุณู_ูุงู |
|
101 |
+
| 59 | ุฑุฒุงู - ุชู
ุซูู - ุงูุดุงูู - ููุจ - ู
ุณุชุญูู | 17 | 59_ุฑุฒุงู_ุชู
ุซูู_ุงูุดุงูู_ููุจ |
|
102 |
+
| 60 | ุตูุงุญ - ุงุนุทูู - ุจุฏุฑู - ููููู
- ูุฎุฑ | 17 | 60_ุตูุงุญ_ุงุนุทูู_ุจุฏุฑู_ููููู
|
|
103 |
+
| 61 | ููุงู - ุตุจุงุญุงุช_ุงูููุงู - ุฒุนูู
- ุงูุฃุฒุฑู - ูุฑูุฏ | 16 | 61_ููุงู_ุตุจุงุญุงุช_ุงูููุงู_ุฒุนูู
_ุงูุฃุฒุฑู |
|
104 |
+
| 62 | ูู - ูุฑููู - ุงูุงุนุชุฑุงู - ู
ุงุฑุงุฏููุง - ุงุฌุจุฑู | 15 | 62_ูู_ูุฑููู_ุงูุงุนุชุฑุงู_ู
ุงุฑุงุฏููุง |
|
105 |
+
| 63 | ุงุฑุญุจ - ุงุณุทูุฑู - ุงูููุงู - ูุฑุช - ุซูุฑุงู | 15 | 63_ุงุฑุญุจ_ุงุณุทูุฑู_ุงูููุงู_ูุฑุช |
|
106 |
+
| 64 | ู
ุฌููุฏ - ุตุบูุฑ - ุงูุฑูุงุถ - ู
ุงูููููุง - ูุงูุฑุงูุง | 15 | 64_ู
ุฌููุฏ_ุตุบูุฑ_ุงูุฑูุงุถ_ู
ุงูููููุง |
|
107 |
+
| 65 | ุงุจู - ุฃุจู - ููุณู - ุงูุบุงูู - ุญุจูุจู | 15 | 65_ุงุจู_ุฃุจู_ููุณู_ุงูุบุงูู |
|
108 |
+
| 66 | ูู - ุฒุนููุงู - ุชุนูุณ - ูุงุงุฌู
ู - ููู | 14 | 66_ูู_ุฒุนููุงู_ุชุนูุณ_ูุงุงุฌู
ู |
|
109 |
+
| 67 | ููู
- ููุฏุฑ - ุงูุง - ูุฐุง - ูุฌูุจ | 14 | 67_ููู
_ููุฏุฑ_ุงูุง_ูุฐุง |
|
110 |
+
| 68 | ุจุณุงุนุฉ - ูุธูู - ุงูุตูุฑ - ู
ุนูู
- ู
ุฑูุถ | 13 | 68_ุจุณุงุนุฉ_ูุธูู_ุงูุตูุฑ_ู
ุนูู
|
|
111 |
+
| 69 | ููููููููููููููููููููููู - ูููููููููููููููููููููููููููููููููููููููููููู - ูุฌู - ูููููููููููููููููููููููููููููููููููููููููููููููููููููู - ููููููููููููููููููููููููููููููููููููููููููููููููููููููููููู | 13 | 69_ููููููููููููููููููููููู_ูููููููููููููููููููููููููููููููููููููููููููู_ูุฌู_ูููููููููููููููููููููููููููููููููููููููููููููููููููููู |
|
112 |
+
| 70 | ุญู
ุงู - ุญู
ุงุฑ - ุจูุงุฏู - ุงุชุญู - ูุถุงุฉ | 13 | 70_ุญู
ุงู_ุญู
ุงุฑ_ุจูุงุฏู_ุงุชุญู |
|
113 |
+
| 71 | ูุณูุน - ุงูู
ุณูุญ - ุฅุฑุญู
ูุง - ุงูุฅูู - ุงูู
ุฑุงุญู
| 12 | 71_ูุณูุน_ุงูู
ุณูุญ_ุฅุฑุญู
ูุง_ุงูุฅูู |
|
114 |
+
| 72 | ู
ุตุฑ - ุจุญุจู - ุญุจูุจ - ุจููุช - ุจูุงุฏู | 12 | 72_ู
ุตุฑ_ุจุญุจู_ุญุจูุจ_ุจููุช |
|
115 |
+
| 73 | ุณูุฏู - maga - is - ุณุนุฏ - ุฃุญูู | 12 | 73_ุณูุฏู_maga_is_ุณุนุฏ |
|
116 |
+
| 74 | ุงูุตุจุญ - ุจุญู - ุงููุฌู - ููุฑ - ุชุจุงุณ | 12 | 74_ุงูุตุจุญ_ุจุญู_ุงููุฌู_ููุฑ |
|
117 |
+
| 75 | ุนุจุฏุงููู - ุฌู
ุงููุง - ุจุดู
ุงูู - ูุญุดุดุด - ูุนุงุฏุช | 12 | 75_ุนุจุฏุงููู_ุฌู
ุงููุง_ุจุดู
ุงูู_ูุญุดุดุด |
|
118 |
+
| 76 | ุชุงูู - ุชุฑู - ูุงูู - ุจุช - ูู
ุงู | 11 | 76_ุชุงูู_ุชุฑู_ูุงูู_ุจุช |
|
119 |
+
| 77 | ุญู
ุงุฑู - ูุงู - ุทุนู
- ูู - ุงุดููู | 11 | 77_ุญู
ุงุฑู_ูุงู_ุทุนู
_ูู |
|
120 |
+
| 78 | ุนูู - ูููู - ุนูุงู - ุจููุฉ - ุนูุฏู | 11 | 78_ุนูู_ูููู_ุนูุงู_ุจููุฉ |
|
121 |
+
| 79 | ููู - ุจุดูู - ุงูุณุงู - ุฏููุง - ูุฑุจูู | 11 | 79_ููู_ุจุดูู_ุงูุณุงู_ุฏููุง |
|
122 |
+
|
123 |
+
</details>
|
124 |
+
|
125 |
+
## Training hyperparameters
|
126 |
+
|
127 |
+
* calculate_probabilities: False
|
128 |
+
* language: None
|
129 |
+
* low_memory: False
|
130 |
+
* min_topic_size: 10
|
131 |
+
* n_gram_range: (1, 1)
|
132 |
+
* nr_topics: None
|
133 |
+
* seed_topic_list: None
|
134 |
+
* top_n_words: 10
|
135 |
+
* verbose: False
|
136 |
+
* zeroshot_min_similarity: 0.7
|
137 |
+
* zeroshot_topic_list: None
|
138 |
+
|
139 |
+
## Framework versions
|
140 |
+
|
141 |
+
* Numpy: 1.23.5
|
142 |
+
* HDBSCAN: 0.8.33
|
143 |
+
* UMAP: 0.5.5
|
144 |
+
* Pandas: 1.5.3
|
145 |
+
* Scikit-Learn: 1.2.2
|
146 |
+
* Sentence-transformers: 2.2.2
|
147 |
+
* Transformers: 4.35.2
|
148 |
+
* Numba: 0.58.1
|
149 |
+
* Plotly: 5.15.0
|
150 |
+
* Python: 3.10.12
|
config.json
ADDED
@@ -0,0 +1,16 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
{
|
2 |
+
"calculate_probabilities": false,
|
3 |
+
"language": null,
|
4 |
+
"low_memory": false,
|
5 |
+
"min_topic_size": 10,
|
6 |
+
"n_gram_range": [
|
7 |
+
1,
|
8 |
+
1
|
9 |
+
],
|
10 |
+
"nr_topics": null,
|
11 |
+
"seed_topic_list": null,
|
12 |
+
"top_n_words": 10,
|
13 |
+
"verbose": false,
|
14 |
+
"zeroshot_min_similarity": 0.7,
|
15 |
+
"zeroshot_topic_list": null
|
16 |
+
}
|
topic_embeddings.safetensors
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:e99500b5d5d0c8290d8b0bc0ee8945b910ee8c72ecfc1d03b619d96a0727fd44
|
3 |
+
size 248920
|
topics.json
ADDED
The diff for this file is too large to render.
See raw diff
|
|