CreatorPhan commited on
Commit
e011405
1 Parent(s): 66911a1

Upload 14 files

Browse files
agent_gpt.py ADDED
@@ -0,0 +1,67 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ from langchain.document_loaders.unstructured import UnstructuredFileLoader
2
+ from langchain.text_splitter import CharacterTextSplitter
3
+ from langchain.embeddings import OpenAIEmbeddings
4
+ from langchain.vectorstores import Chroma
5
+ from langchain.chains import RetrievalQA
6
+ from langchain.chat_models import ChatOpenAI
7
+ from langchain.schema import AIMessage, HumanMessage, SystemMessage, Document
8
+ import os
9
+
10
+
11
+ API_KEY = os.getenv("API_TOKEN")
12
+ print("API:", API_KEY)
13
+
14
+ class Agent:
15
+ def __init__(self, args=None) -> None:
16
+ self.embeddings = OpenAIEmbeddings(openai_api_key=API_KEY)
17
+ self.llm = ChatOpenAI(temperature=0.5, openai_api_key=API_KEY)
18
+ self.context_value = ""
19
+ self.use_context = False
20
+
21
+ def load_context(self, doc_path):
22
+ loader = UnstructuredFileLoader(doc_path.name)
23
+ print('Loading file:', doc_path.name)
24
+ self.documents = loader.load()
25
+ self.split()
26
+
27
+ return f"Using file from {doc_path.name}"
28
+
29
+ def split(self):
30
+ text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
31
+ texts = text_splitter.split_documents(self.documents)
32
+ docsearch = Chroma.from_documents(texts, self.embeddings)
33
+ self.qa = RetrievalQA.from_chain_type(llm=self.llm, chain_type="stuff", retriever=docsearch.as_retriever())
34
+
35
+ print("Context updated")
36
+ self.use_context = True
37
+
38
+ def asking(self, prompt):
39
+ if self.use_context:
40
+ print("Answering with your context")
41
+ return self.qa.run(prompt)
42
+ else:
43
+ print("Answering without your context")
44
+ return self.llm([HumanMessage(content=prompt)]).content
45
+
46
+
47
+ def get_context(self, context):
48
+ self.context_value = context
49
+
50
+ self.documents = [Document(page_content=context, metadata={'source': ''})]
51
+ self.split()
52
+
53
+ self.use_context = True
54
+
55
+ def load_context_file(self, file):
56
+ print('Loading file:', file.name)
57
+ text = ''
58
+ for line in open(file.name, 'r', encoding='utf8'):
59
+ text += line
60
+
61
+ self.context_value = text
62
+ return text
63
+
64
+ def clear_context(self):
65
+ self.context_value = ""
66
+ self.use_context = False
67
+ return ""
agent_t5.py ADDED
@@ -0,0 +1,102 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ from langchain.document_loaders.unstructured import UnstructuredFileLoader
2
+ from langchain.text_splitter import CharacterTextSplitter
3
+ from langchain.embeddings import OpenAIEmbeddings
4
+ from langchain.vectorstores import Chroma
5
+ from langchain.chains import RetrievalQA
6
+ from langchain.chat_models import ChatOpenAI
7
+ from langchain.schema import AIMessage, HumanMessage, SystemMessage, Document
8
+
9
+ from transformers import AutoTokenizer, T5ForConditionalGeneration
10
+ from retrieval.retrieval import Retrieval, BM25
11
+ import os, time
12
+
13
+
14
+
15
+ class Agent:
16
+ def __init__(self, args=None) -> None:
17
+ self.args = args
18
+ self.corpus = Retrieval()
19
+ self.choices = args.choices
20
+
21
+ self.context_value = ""
22
+ self.use_context = False
23
+
24
+ print("Model is loading...")
25
+ self.model = T5ForConditionalGeneration.from_pretrained(args.model).to(args.device)
26
+ self.tokenizer = AutoTokenizer.from_pretrained(args.tokenizer)
27
+ print("Model loaded!")
28
+
29
+
30
+ def load_context(self, doc_path):
31
+ loader = UnstructuredFileLoader(doc_path.name)
32
+ print('Loading file:', doc_path.name)
33
+ context = loader.load()[0].page_content
34
+
35
+ self.retrieval = Retrieval(docs=context)
36
+ self.choices = self.retrieval.k
37
+ self.use_context = True
38
+
39
+ return f"Using file from {doc_path.name}"
40
+
41
+
42
+ def asking(self, question):
43
+ s_query = time.time()
44
+ if self.use_context:
45
+ print("Answering with your context")
46
+ contexts = self.retrieval.get_context(question)
47
+ else:
48
+ print("Answering without your context")
49
+ contexts = self.corpus.get_context(question)
50
+
51
+ prompts = []
52
+ for context in contexts:
53
+ prompt = f"Trả lời câu hỏi: {question} Trong nội dung: {context['context']}"
54
+ prompts.append(prompt)
55
+
56
+ s_token = time.time()
57
+ tokens = self.tokenizer(prompts, max_length=self.args.seq_len, truncation=True, padding='max_length', return_tensors='pt')
58
+
59
+ s_gen = time.time()
60
+ outputs = self.model.generate(
61
+ input_ids=tokens.input_ids.to(self.args.device),
62
+ attention_mask=tokens.attention_mask.to(self.args.device),
63
+ max_new_tokens=self.args.out_len
64
+ )
65
+
66
+ s_de = time.time()
67
+ answers = []
68
+ for output in outputs:
69
+ sequence = self.tokenizer.decode(output, skip_special_tokens=True)
70
+ answers.append(sequence)
71
+
72
+ self.temp = contexts
73
+ t_mess = "t_query: {:.2f}\t t_token: {:.2f}\t t_gen: {:.2f}\t t_decode: {:.2f}\t".format(
74
+ s_token-s_query, s_gen-s_token, s_de-s_gen, time.time()-s_de
75
+ )
76
+ print(t_mess)
77
+ return answers, contexts
78
+
79
+
80
+
81
+ def get_context(self, context):
82
+ self.context_value = context
83
+
84
+ self.retrieval = Retrieval(docs=context)
85
+ self.choices = self.retrieval.k
86
+ self.use_context = True
87
+ return context
88
+
89
+ def load_context_file(self, file):
90
+ print('Loading file:', file.name)
91
+ text = ''
92
+ for line in open(file.name, 'r', encoding='utf8'):
93
+ text += line
94
+
95
+ self.context_value = text
96
+ return text
97
+
98
+ def clear_context(self):
99
+ self.context_value = ""
100
+ self.use_context = False
101
+ self.choices = self.args.choices
102
+ return ""
app.py ADDED
@@ -0,0 +1,71 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import gradio as gr
2
+ import random
3
+ import time
4
+ from agent_t5 import Agent
5
+ from config import Config
6
+ from retrieval.retrieval import BM25
7
+
8
+
9
+ args = Config()
10
+ chatbot = Agent(args)
11
+ answer_areas = list(range(args.choices))
12
+ context_areas = list(range(args.choices))
13
+
14
+ with gr.Blocks() as demo:
15
+ # gr.Markdown("Flip text or image files using this demo.")
16
+ with gr.Tab("Chatbot"):
17
+ with gr.Row():
18
+ with gr.Column():
19
+ chatbot_area = gr.Chatbot().style(height=700)
20
+ msg = gr.Textbox(label='Your prompt')
21
+
22
+ with gr.Column(scale=0.15, min_width=300):
23
+ for i in range(args.choices):
24
+ with gr.Accordion(f"Answer: {i+1}", open=False) as answer_areas[i]:
25
+ context_areas[i] = gr.Markdown(f"Context {i+1}")
26
+ clear_chat = gr.Button("Clear history")
27
+
28
+ with gr.Tab("Your context"):
29
+ context_box = gr.Textbox(
30
+ label='Your context here! You can upload a context file or typing context here and click "Using context"',
31
+ lines=20,
32
+ placeholder="Enter your context here..."
33
+ )
34
+
35
+ with gr.Row() as taskbar:
36
+ upload_btt = gr.UploadButton('Upload Context File')
37
+ clear_context_btt = gr.Button("Clear context")
38
+ context_btt = gr.Button("Using context")
39
+
40
+
41
+ def user(user_message, history):
42
+ print("Context box value:", context_box.info)
43
+ return "", history + [[user_message, None]]
44
+
45
+ def bot(history):
46
+ question = history[-1][0]
47
+ print('User mess:', question)
48
+ answers, contexts = chatbot.asking(question)
49
+
50
+ for i in range(chatbot.choices):
51
+ context_areas[i].value = contexts[i]['context']
52
+ answer_areas[i].value = answers[i]
53
+
54
+
55
+ print(answers)
56
+ history[-1][1] = ""
57
+ for character in answers[0]:
58
+ history[-1][1] += character
59
+ time.sleep(0.01)
60
+ yield history
61
+
62
+ msg.submit(user, [msg, chatbot_area], [msg, chatbot_area], queue=False).then(
63
+ bot, chatbot_area, chatbot_area
64
+ )
65
+
66
+ context_btt.click(chatbot.get_context, [context_box, ])
67
+ upload_btt.upload(chatbot.load_context, [upload_btt, ], context_box)
68
+ clear_context_btt.click(chatbot.clear_context, outputs=context_box)
69
+
70
+ demo.queue()
71
+ demo.launch()
config.py ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ class Config:
2
+ model = 'flan-small'
3
+ tokenizer = 'CreatorFPT/T5-base'
4
+ seq_len = 512
5
+ out_len = 170
6
+ device = 'cpu'
7
+ choices = 8
flan-small/config.json ADDED
@@ -0,0 +1,61 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "_name_or_path": "/media/data/sinhnta/pretrained/flan-small",
3
+ "architectures": [
4
+ "T5ForConditionalGeneration"
5
+ ],
6
+ "d_ff": 1024,
7
+ "d_kv": 64,
8
+ "d_model": 512,
9
+ "decoder_start_token_id": 0,
10
+ "dense_act_fn": "gelu_new",
11
+ "dropout_rate": 0.1,
12
+ "eos_token_id": 1,
13
+ "feed_forward_proj": "gated-gelu",
14
+ "initializer_factor": 1.0,
15
+ "is_encoder_decoder": true,
16
+ "is_gated_act": true,
17
+ "layer_norm_epsilon": 1e-06,
18
+ "model_type": "t5",
19
+ "n_positions": 512,
20
+ "num_decoder_layers": 8,
21
+ "num_heads": 6,
22
+ "num_layers": 8,
23
+ "output_past": true,
24
+ "pad_token_id": 0,
25
+ "relative_attention_max_distance": 128,
26
+ "relative_attention_num_buckets": 32,
27
+ "task_specific_params": {
28
+ "summarization": {
29
+ "early_stopping": true,
30
+ "length_penalty": 2.0,
31
+ "max_length": 200,
32
+ "min_length": 30,
33
+ "no_repeat_ngram_size": 3,
34
+ "num_beams": 4,
35
+ "prefix": "summarize: "
36
+ },
37
+ "translation_en_to_de": {
38
+ "early_stopping": true,
39
+ "max_length": 300,
40
+ "num_beams": 4,
41
+ "prefix": "translate English to German: "
42
+ },
43
+ "translation_en_to_fr": {
44
+ "early_stopping": true,
45
+ "max_length": 300,
46
+ "num_beams": 4,
47
+ "prefix": "translate English to French: "
48
+ },
49
+ "translation_en_to_ro": {
50
+ "early_stopping": true,
51
+ "max_length": 300,
52
+ "num_beams": 4,
53
+ "prefix": "translate English to Romanian: "
54
+ }
55
+ },
56
+ "tie_word_embeddings": false,
57
+ "torch_dtype": "float32",
58
+ "transformers_version": "4.29.2",
59
+ "use_cache": true,
60
+ "vocab_size": 36096
61
+ }
flan-small/generation_config.json ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ {
2
+ "_from_model_config": true,
3
+ "decoder_start_token_id": 0,
4
+ "eos_token_id": 1,
5
+ "pad_token_id": 0,
6
+ "transformers_version": "4.29.2"
7
+ }
flan-small/pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:fb9d674a69d00c1ea19d34a5e1fa334efb3a073169e46ff9f7fd6dc09ed8f98b
3
+ size 324163077
requirements.txt ADDED
@@ -0,0 +1,7 @@
 
 
 
 
 
 
 
 
1
+ langchain
2
+ openai
3
+ unstructured
4
+ tabulate
5
+ pdf2image
6
+ chromadb
7
+ tiktoken
retrieval/__pycache__/retrieval.cpython-39.pyc ADDED
Binary file (6.19 kB). View file
 
retrieval/bm25.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:eef0c1dd2ec0cc725d559100a228b610754b017dd63f3c1497a9a8be56b5a40e
3
+ size 35390697
retrieval/context.pt ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:64acd92300763406bb08f00537e7603a1e7e5d2be2a2e891be92a47263563935
3
+ size 12962223
retrieval/retrieval.py ADDED
@@ -0,0 +1,222 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ import torch, math
2
+ from pyvi.ViTokenizer import tokenize
3
+ import re, os, string
4
+ import pandas as pd
5
+ import math
6
+ import numpy as np
7
+
8
+
9
+ class BM25:
10
+
11
+ def __init__(self, k1=1.5, b=0.75):
12
+ self.b = b
13
+ self.k1 = k1
14
+
15
+ def fit(self, corpus):
16
+ """
17
+ Fit the various statistics that are required to calculate BM25 ranking
18
+ score using the corpus given.
19
+
20
+ Parameters
21
+ ----------
22
+ corpus : list[list[str]]
23
+ Each element in the list represents a document, and each document
24
+ is a list of the terms.
25
+
26
+ Returns
27
+ -------
28
+ self
29
+ """
30
+ tf = []
31
+ df = {}
32
+ idf = {}
33
+ doc_len = []
34
+ corpus_size = 0
35
+ for document in corpus:
36
+ corpus_size += 1
37
+ doc_len.append(len(document))
38
+
39
+ # compute tf (term frequency) per document
40
+ frequencies = {}
41
+ for term in document:
42
+ term_count = frequencies.get(term, 0) + 1
43
+ frequencies[term] = term_count
44
+
45
+ tf.append(frequencies)
46
+
47
+ # compute df (document frequency) per term
48
+ for term, _ in frequencies.items():
49
+ df_count = df.get(term, 0) + 1
50
+ df[term] = df_count
51
+
52
+ for term, freq in df.items():
53
+ idf[term] = math.log(1 + (corpus_size - freq + 0.5) / (freq + 0.5))
54
+
55
+ self.tf_ = tf
56
+ self.df_ = df
57
+ self.idf_ = idf
58
+ self.doc_len_ = doc_len
59
+ self.corpus_ = corpus
60
+ self.corpus_size_ = corpus_size
61
+ self.avg_doc_len_ = sum(doc_len) / corpus_size
62
+ return self
63
+
64
+ def search(self, query):
65
+ scores = [self._score(query, index) for index in range(self.corpus_size_)]
66
+ return scores
67
+
68
+ def _score(self, query, index):
69
+ score = 0.0
70
+
71
+ doc_len = self.doc_len_[index]
72
+ frequencies = self.tf_[index]
73
+ for term in query:
74
+ if term not in frequencies:
75
+ continue
76
+
77
+ freq = frequencies[term]
78
+ numerator = self.idf_[term] * freq * (self.k1 + 1)
79
+ denominator = freq + self.k1 * (1 - self.b + self.b * doc_len / self.avg_doc_len_)
80
+ score += (numerator / denominator)
81
+
82
+ return score
83
+
84
+ class Retrieval:
85
+ def __init__(
86
+ self, k=8,
87
+ model='retrieval/bm25.pt',
88
+ contexts='retrieval/context.pt',
89
+ stop_words='retrieval/stopwords.csv',
90
+ max_len = 400,
91
+ docs = None
92
+ ) -> None:
93
+ self.k = k
94
+ self.max_len = max_len
95
+
96
+ data = pd.read_csv(stop_words, sep="\t", encoding='utf-8')
97
+ self.list_stopwords = data['stopwords']
98
+
99
+ if docs:
100
+ self.tuning(docs)
101
+ else:
102
+ self.bm25 = torch.load(model)
103
+ self.contexts = torch.load(contexts)
104
+
105
+
106
+ def get_context(self, query='Chảy máu chân răng là bệnh gì?'):
107
+
108
+ def clean_text(text):
109
+ text = re.sub('<.*?>', '', text).strip()
110
+ text = re.sub('(\s)+', r'\1', text)
111
+ return text
112
+
113
+ def normalize_text(text):
114
+ listpunctuation = string.punctuation.replace('_', '')
115
+ for i in listpunctuation:
116
+ text = text.replace(i, ' ')
117
+ return text.lower()
118
+
119
+ def remove_stopword(text):
120
+ pre_text = []
121
+ words = text.split()
122
+ for word in words:
123
+ if word not in self.list_stopwords:
124
+ pre_text.append(word)
125
+ text2 = ' '.join(pre_text)
126
+
127
+ return text2
128
+
129
+ def word_segment(sent):
130
+ sent = tokenize(sent.encode('utf-8').decode('utf-8'))
131
+ return sent
132
+
133
+
134
+ query = clean_text(query)
135
+ query = word_segment(query)
136
+ query = remove_stopword(normalize_text(query))
137
+ query = query.split()
138
+
139
+ scores = self.bm25.search(query)
140
+ scores_index = np.argsort(scores)
141
+
142
+ results = []
143
+ for k in range(1, self.k+1):
144
+ index = scores_index[-k]
145
+ result = {'score':scores[index], 'index':index, 'context':self.contexts[index]}
146
+ results.append(result)
147
+ return results
148
+
149
+ def split(self, document):
150
+ document = document.replace('\n', ' ')
151
+ document = re.sub(' +', ' ', document)
152
+ sentences = document.split('. ')
153
+ context_list = []
154
+
155
+ context = ""
156
+ length = 0
157
+ pre = ""
158
+ len__ = 0
159
+ for sentence in sentences:
160
+ sentence += '. '
161
+ len_ = len(sentence.split())
162
+ if length + len_ > self.max_len:
163
+ context_list.append(context)
164
+ context = pre
165
+ length = len__
166
+
167
+ length += len_
168
+ context += sentence
169
+
170
+ pre = sentence
171
+ len__ = len_
172
+ context_list.append(context)
173
+
174
+ self.contexts = context_list
175
+ if len(context_list) < self.k:
176
+ self.k = len(context_list)
177
+
178
+
179
+ def tuning(self, document):
180
+
181
+ def clean_text(text):
182
+ text = re.sub('<.*?>', '', text).strip()
183
+ text = re.sub('(\s)+', r'\1', text)
184
+ return text
185
+
186
+ def normalize_text(text):
187
+ listpunctuation = string.punctuation.replace('_', '')
188
+ for i in listpunctuation:
189
+ text = text.replace(i, ' ')
190
+ return text.lower()
191
+
192
+ def remove_stopword(text):
193
+ pre_text = []
194
+ words = text.split()
195
+ for word in words:
196
+ if word not in self.list_stopwords:
197
+ pre_text.append(word)
198
+ text2 = ' '.join(pre_text)
199
+
200
+ return text2
201
+
202
+ def word_segment(sent):
203
+ sent = tokenize(sent.encode('utf-8').decode('utf-8'))
204
+ return sent
205
+
206
+ self.split(document)
207
+
208
+ docs = []
209
+ for content in self.contexts:
210
+ content = clean_text(content)
211
+ content = word_segment(content)
212
+ content = remove_stopword(normalize_text(content))
213
+ docs.append(content)
214
+
215
+ print('There is', len(docs), 'contexts')
216
+ texts = [
217
+ [word for word in document.lower().split() if word not in self.list_stopwords]
218
+ for document in docs
219
+ ]
220
+
221
+ self.bm25 = BM25()
222
+ self.bm25.fit(texts)
retrieval/stopwords.csv ADDED
@@ -0,0 +1,1943 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ stopwords
2
+ mà_thôi
3
+ tuy_có
4
+ đâu_như
5
+ quay_bước
6
+ hỏi_lại
7
+ khẳng_định
8
+ giờ_này
9
+ ren_rén
10
+ một_cơn
11
+ ủa
12
+ chợt
13
+ tốt_bộ
14
+ tuổi_tôi
15
+ mới_hay
16
+ hơn
17
+ để_lòng
18
+ vừa_qua
19
+ thêm_vào
20
+ ào_vào
21
+ nghe_không
22
+ cái_đã
23
+ bây_nhiêu
24
+ cha_chả
25
+ tự_ý
26
+ cái_đó
27
+ không_tính
28
+ chưa_kể
29
+ phía
30
+ tính_từ
31
+ như_ai
32
+ anh_ấy
33
+ lâu_lâu
34
+ nhất_loạt
35
+ khó_khăn
36
+ vùng
37
+ dù_rằng
38
+ sự_việc
39
+ gây_cho
40
+ phải_như
41
+ mạnh
42
+ bước
43
+ dễ_sử_dụng
44
+ nhanh_lên
45
+ bất_quá
46
+ bởi_vì
47
+ cả_ngày
48
+ ô_hay
49
+ cho_đến
50
+ ba_ba
51
+ dưới
52
+ dạ_bán
53
+ gặp
54
+ tránh_xa
55
+ thật_là
56
+ vài_điều
57
+ một_cách
58
+ ba_cùng
59
+ vượt_quá
60
+ vô_kể
61
+ nghe_được
62
+
63
+ ô_kê
64
+
65
+ nhận_nhau
66
+ tên
67
+ riu_ríu
68
+ không_kể
69
+ lời_nói
70
+ trước_đây
71
+ phải_chi
72
+ gần_bên
73
+ chỉ_chính
74
+ cả_tin
75
+ nhất_mực
76
+ cơ_chỉ
77
+ cao_thế
78
+ xuống
79
+ quan_tâm
80
+ ông_từ
81
+ mỗi_lần
82
+ xử_lý
83
+ là_ít
84
+ gì_gì
85
+ quả
86
+ chú_khách
87
+ quay_số
88
+ qua_đi
89
+ thực_vậy
90
+ hơn_là
91
+ làm_mất
92
+ bỏ_quá
93
+ nặng
94
+ dạ_con
95
+ gặp_khó_khăn
96
+ các_cậu
97
+ bằng_được
98
+ đang_thì
99
+ để_đến_nỗi
100
+ nghe_đâu
101
+ nước
102
+ trả_của
103
+ gây_thêm
104
+ tới_mức
105
+ ừ_ào
106
+ trong_đó
107
+ tôi
108
+ thanh_thanh
109
+ thường_đến
110
+ tò_te
111
+ nền
112
+ nhỡ_ra
113
+ từng
114
+ tù_tì
115
+ phải
116
+ phăn_phắt
117
+ cái_gì
118
+ phía_trước
119
+ mọi_giờ
120
+ trước_khi
121
+ tiện_thể
122
+ lên_số
123
+ đến_nơi
124
+ cách_nhau
125
+ nước_quả
126
+ thấy_tháng
127
+ ấy
128
+ chùn_chùn
129
+ ngay_khi
130
+ nhìn
131
+ là_phải
132
+ một_vài
133
+ đại_nhân
134
+ hơn_trước
135
+ chúng_ta
136
+ ăn_tay
137
+ vậy_ư
138
+ không_bán
139
+ theo
140
+ biết_mình
141
+ với_nhau
142
+ ý_hoặc
143
+ cuối_cùng
144
+ đầy_năm
145
+ bấy_chừ
146
+ cụ_thể
147
+ tỏ_ra
148
+ vèo_vèo
149
+ con_nhà
150
+
151
+ ông
152
+ vài_nơi
153
+ tránh_tình_trạng
154
+ ở_vào
155
+ làm_tin
156
+ thuộc_lại
157
+ thế_thường
158
+ ngôi_nhà
159
+ ngồi_bệt
160
+ hiểu
161
+ cho_đang
162
+ nhìn_nhận
163
+ tới_thì
164
+ chuyện
165
+ ra
166
+ bỏ_lại
167
+ vừa
168
+ hãy_còn
169
+ chứ_lại
170
+ thuần
171
+ thêm_giờ
172
+ ắt_hẳn
173
+ ra_đây
174
+ do_đó
175
+ xoẹt
176
+
177
+ giữa_lúc
178
+ giá_trị_thực_tế
179
+ coi_mòi
180
+ ái
181
+ không_có
182
+ ông_tạo
183
+ sự_thế
184
+ còn_thời_gian
185
+ nhận_họ
186
+ tự_vì
187
+ đều_đều
188
+ á
189
+ à
190
+ xin
191
+ trển
192
+ nếu_thế
193
+ ý
194
+ tạo_ra
195
+ nhưng
196
+ đưa_ra
197
+ nhằm_để
198
+ đến_lúc
199
+ ôi_chao
200
+ sáng
201
+ đây_này
202
+ quá_mức
203
+ cách
204
+ cơ_cùng
205
+ làm_ra
206
+ khỏi
207
+ ra_ngôi
208
+ rén
209
+ lại_bộ
210
+ như_thường
211
+ nói_ý
212
+ đến_thì
213
+ lần_trước
214
+ bán
215
+ để_lại
216
+ dạ_dài
217
+ bác
218
+ thiếu_gì
219
+ thì_thôi
220
+ quá_thì
221
+ trên_bộ
222
+ song_le
223
+ rồi_sao
224
+ bấy_giờ
225
+ mức
226
+ đưa_chuyện
227
+ nhà_chung
228
+ rõ_thật
229
+ răng_răng
230
+ sất
231
+ ai_ai
232
+ tính_phỏng
233
+ thì_phải
234
+ chung_cục
235
+ không_cứ
236
+ kể_cả
237
+ qua_tay
238
+ nhận_làm
239
+ thếch
240
+ hơn_nữa
241
+ như_không
242
+ vẫn
243
+ chốc_chốc
244
+ chẳng_phải
245
+ muốn
246
+ thực_tế
247
+ thế_nào
248
+ trước_hết
249
+ người_người
250
+ bắt_đầu_từ
251
+ ra_vào
252
+ tức_thì
253
+ kể_như
254
+ thường_thôi
255
+ thậm
256
+ thực_sự
257
+ do
258
+ cũng_nên
259
+ vung_thiên_địa
260
+ vào_đến
261
+ chưa
262
+ ngày_tháng
263
+ làm_tăng
264
+ trệu_trạo
265
+ tốt
266
+ ngay_tức_khắc
267
+ bất_tử
268
+ bỏ_bà
269
+ nhà_ngươi
270
+ mang_nặng
271
+ nhằm_lúc
272
+ đành_đạch
273
+ tất_cả
274
+ nhất_luật
275
+ điểm
276
+ vùng_lên
277
+ khó_mở
278
+ từ_thế
279
+ không_điều_kiện
280
+ sáng_thế
281
+ thỏm
282
+ bắt_đầu
283
+ phải_chăng
284
+ gần
285
+ người_nghe
286
+ hơn_cả
287
+ có_ăn
288
+ trước_kia
289
+ họ_xa
290
+ trong
291
+ ở_đây
292
+ dễ_như_chơi
293
+ hãy
294
+ ăn_hết
295
+ được
296
+ dùng_cho
297
+ tấn
298
+ mọi
299
+ nếu_mà
300
+ ba_ngôi
301
+ đâu
302
+ con
303
+ nước_bài
304
+ người
305
+ hết_của
306
+ gần_như
307
+ những_như
308
+ bây_bẩy
309
+ ở_lại
310
+ nói_lên
311
+ cần_số
312
+ vẫn_thế
313
+ hết_ý
314
+ quận
315
+ chọn_ra
316
+ sang_tay
317
+ tênh
318
+ lấy_thêm
319
+ nghĩ_tới
320
+ tuy_vậy
321
+ tạo_điều_kiện
322
+ chuyển_đạt
323
+ tanh
324
+ đại_để
325
+ thì
326
+ giảm_thế
327
+ thà
328
+ ra_điều
329
+ thanh_điểm
330
+ mất
331
+ vung_tán_tàn
332
+ nói_qua
333
+ cuối
334
+ chợt_nhìn
335
+ cuốn
336
+ chúng
337
+ đến_lời
338
+ thường_bị
339
+ bạn
340
+ vài_nhà
341
+ nên_người
342
+ với
343
+ khách
344
+ chứ_lị
345
+ từng_thời_gian
346
+ ào
347
+ từ_đó
348
+ tính_người
349
+ nhằm
350
+ nếu_cần
351
+ sáng_ý
352
+ chọn
353
+ từ_tại
354
+ bằng_nào
355
+ toà
356
+ ạ_ơi
357
+ do_vậy
358
+ cả_nghe
359
+ có_ý
360
+ đánh_đùng
361
+ ăn_quá
362
+ cho_đến_khi
363
+ đưa_tới
364
+ tăm_tắp
365
+ nhận
366
+ trời_đất_ơi
367
+ có_họ
368
+ nhìn_chung
369
+ bỗng_dưng
370
+ sang_năm
371
+
372
+ vào_vùng
373
+ chịu_ăn
374
+ hay
375
+ vì_rằng
376
+ bài
377
+ trỏng
378
+ tăng_thế
379
+ thỉnh_thoảng
380
+ thích_cứ
381
+ làm_đúng
382
+ bấy_chầy
383
+ không_cần
384
+ từ_ái
385
+ trong_ngoài
386
+ phải_cách
387
+ mới_rồi
388
+ tính
389
+ vâng_ý
390
+ a_lô
391
+ quả_vậy
392
+ ngọn
393
+ nghĩ_lại
394
+ ngọt
395
+ ngày_ngày
396
+ cụ_thể_là
397
+ người_khách
398
+ lượng
399
+ nói_chung
400
+ nhà_việc
401
+ tin_thêm
402
+ khoảng_cách
403
+
404
+ nào_hay
405
+ bộ_điều
406
+ giảm_chính
407
+ thật_ra
408
+ có_nhiều
409
+ thật_quả
410
+ chao_ôi
411
+ ít_có
412
+ sớm_ngày
413
+ lâu
414
+ bập_bõm
415
+ cao_thấp
416
+ ngay_lúc_này
417
+ ra_chơi
418
+ thế_thôi
419
+ chỉ_tên
420
+ dẫu_mà
421
+ rất_lâu
422
+ bấy_lâu
423
+ chắc_ăn
424
+ như_sau
425
+ bán_thế
426
+ thích_ý
427
+ tuy_rằng
428
+ đây_đó
429
+ không_dùng
430
+ vị_trí
431
+ tăng_giảm
432
+ tạo_nên
433
+ cá_nhân
434
+ ngoài
435
+ vả_chăng
436
+ em_em
437
+ đúng_ra
438
+ làm
439
+ ngồi
440
+ tất_tật
441
+ tốt_mối
442
+ ngõ_hầu
443
+ ra_lời
444
+ không_phải_không
445
+ lại_làm
446
+ lần_sau
447
+ khi
448
+ dễ_thấy
449
+ làm_lấy
450
+ áng_như
451
+ trong_vùng
452
+ tin
453
+ nhất_tâm
454
+ giảm_thấp
455
+ không_ngoài
456
+ biết_đâu
457
+ đều_bước
458
+ theo_tin
459
+ đâu_có
460
+ thiếu
461
+ cậu
462
+ nói
463
+ ngày_này
464
+ nóc
465
+ ô_kìa
466
+ chăn_chắn
467
+ nào_phải
468
+ mọi_nơi
469
+ đáng_số
470
+ ờ_ờ
471
+ ừ_thì
472
+ xuất_hiện
473
+ chứ_sao
474
+ dễ_nghe
475
+ đang
476
+ trả_ngay
477
+ nước_xuống
478
+ đến_xem
479
+ ối_giời
480
+ phía_bạn
481
+ cùng_cực
482
+ những_khi
483
+ đánh_giá
484
+ ba_họ
485
+
486
+ hay_sao
487
+ không_ai
488
+ nên_làm
489
+
490
+ tự_tính
491
+ veo
492
+ nhớ_bập_bõm
493
+ từng_ấy
494
+ nếu_có
495
+ cơ_mà
496
+ để_giống
497
+ suýt
498
+ quá_tin
499
+ của
500
+ bất_cứ
501
+ chị_bộ
502
+ vậy
503
+ biết_đâu_đấy
504
+ từ_nay
505
+ có_vẻ
506
+ kể_tới
507
+ đầy
508
+ nhìn_lại
509
+ xuất_kỳ_bất_ý
510
+ riêng
511
+ lấy_xuống
512
+ điểm_gặp
513
+ đại_loại
514
+ biết_chừng_nào
515
+ tọt
516
+ thôi
517
+ cho_tới
518
+ bệt
519
+ biết_chắc
520
+ sốt_sột
521
+ thật_lực
522
+ tại_đó
523
+ chịu_lời
524
+ chưa_cần
525
+ rứa
526
+ nhỏ
527
+ nghĩ_đến
528
+ giữ_ý
529
+ nhỉ
530
+ nhờ
531
+ nhớ
532
+ nức_nở
533
+ nói_rõ
534
+ vậy_nên
535
+ thanh_không
536
+ cứ_việc
537
+ ở_đó
538
+ nói_đến
539
+ thường_tại
540
+ vài_người
541
+ có_chăng_là
542
+ tại_tôi
543
+ lại_quả
544
+ từng_cái
545
+ điều
546
+ dùng_đến
547
+ cách_bức
548
+ cho_ăn
549
+ đâu_nào
550
+ nhà_ngoài
551
+ chứ_còn
552
+ mối
553
+ chết_tiệt
554
+ thời_điểm
555
+ ắt_là
556
+ đáng_lý
557
+ tà_tà
558
+ ăn_sáng
559
+ đáng_lí
560
+ bất_giác
561
+ lên_xuống
562
+ căn_cắt
563
+ hết_chuyện
564
+ có_nhà
565
+ như_thế
566
+ cao
567
+ dành_dành
568
+ tự_khi
569
+ gây
570
+ có_thể
571
+ lên_mạnh
572
+ ngay
573
+ phải_khi
574
+ ông_ổng
575
+ xiết_bao
576
+ vào
577
+ vài
578
+ nhờ_nhờ
579
+ phè
580
+ vào_gặp
581
+ rồi
582
+ điều_kiện
583
+ ví_thử
584
+ ngồi_trệt
585
+ mang_mang
586
+ thế_là
587
+ ít_thôi
588
+ ra_sao
589
+ khó_biết
590
+ đặt_ra
591
+ nhiên_hậu
592
+ nghe_đâu_như
593
+ lúc_lâu
594
+ đâu_cũng
595
+ đến_thế
596
+ ứ_ừ
597
+ chung_cuộc
598
+ âu_là
599
+ tạo_cơ_hội
600
+
601
+ à_này
602
+ so
603
+ bởi_vậy
604
+ nhằm_vào
605
+ thời_gian_tính
606
+ thấp_thỏm
607
+ càng_càng
608
+ lớn_nhỏ
609
+ giờ_đến
610
+ có_điều_kiện
611
+ tốt_hơn
612
+ phải_lời
613
+ bản
614
+ giờ_lâu
615
+ ở_năm
616
+ dùng
617
+ nghỉm
618
+ cả
619
+ chùn_chũn
620
+ ái_chà
621
+ chịu
622
+ giống
623
+ quan_trọng_vấn_đề
624
+ đến_khi
625
+ hay_đâu
626
+ lòng_không
627
+ em
628
+ nào_đó
629
+ đến_bao_giờ
630
+ bất_đồ
631
+ tấn_tới
632
+ nghiễm_nhiên
633
+ ứ_hự
634
+ rất
635
+ lại_giống
636
+ làm_nên
637
+ ngăn_ngắt
638
+ lấy_làm
639
+ cật_sức
640
+ khác_xa
641
+ xệp
642
+ cô_tăng
643
+ nhớ_ra
644
+ nơi_nơi
645
+ tăng_cấp
646
+ một_ít
647
+ nếu
648
+ mọi_người
649
+ lại_còn
650
+ phần
651
+ gây_ra
652
+ tênh_tênh
653
+ biết_trước
654
+ thiếu_điểm
655
+ chiếc
656
+ chắc_vào
657
+ như_thể
658
+ sau_nữa
659
+ tựu_trung
660
+ ai_nấy
661
+ nếu_được
662
+ xa
663
+ thường_khi
664
+ giữ_lấy
665
+ bởi_chưng
666
+ nếu_như
667
+ của_ngọt
668
+ dùng_hết
669
+ trực_tiếp_làm
670
+ sở_dĩ
671
+ lớn_lên
672
+ bởi_thế_cho_nên
673
+ điểm_đầu_tiên
674
+ ấy_là
675
+ quay
676
+ ối_giời_ơi
677
+ một
678
+ không
679
+ cùng
680
+ thà_là
681
+ dưới_nước
682
+ có_chuyện
683
+ ông_ấy
684
+ oai_oái
685
+ chứ_không_phải
686
+ việc_gì
687
+ nói_khó
688
+ ngay_thật
689
+ sao
690
+ bội_phần
691
+ anh
692
+ có_dễ
693
+ xăm_xắm
694
+ thêm_chuyện
695
+ giống_như
696
+ trong_khi
697
+ sau
698
+ bỏ_ra
699
+ ngày_qua
700
+ trước_tuổi
701
+ xa_cách
702
+ rón_rén
703
+ bây_giờ
704
+ không_chỉ
705
+ hết_cả
706
+ buổi_làm
707
+ sáng_ngày
708
+ chúng_tôi
709
+ hay_nói
710
+ lấy_lý_do
711
+ ngay_tức_thì
712
+ này_nọ
713
+ thuần_ái
714
+ trong_số
715
+ bỏ_không
716
+ có_thế
717
+ thuộc_cách
718
+ căn_tính
719
+ sang_sáng
720
+ lại_cái
721
+ nhân_tiện
722
+ xa_nhà
723
+ khó_làm
724
+ bởi_thế
725
+ nhiều_ít
726
+ buổi_ngày
727
+ quả_thế
728
+ thực_hiện
729
+ thím
730
+ chăng_nữa
731
+ chú
732
+ đặt
733
+ chú_mình
734
+ cho_nên
735
+
736
+ chung_qui
737
+ cấp_số
738
+ vụt
739
+ chung_quy
740
+ duy_có
741
+ tại_sao
742
+ nặng_mình
743
+ biết_đâu_chừng
744
+ làm_dần_dần
745
+ đến_điều
746
+ bất_chợt
747
+ ăn_chịu
748
+ ở_được
749
+ ồ_ồ
750
+ thốc_tháo
751
+ vì_vậy
752
+ nói_toẹt
753
+ thật_thà
754
+ tháng_năm
755
+ ô_hô
756
+ nói_nhỏ
757
+ dùng_làm
758
+ tuy
759
+ đã_lâu
760
+ sau_cuối
761
+ từ_căn
762
+ lúc_đó
763
+ chí_chết
764
+ bất_kỳ
765
+ ăn_riêng
766
+ giống_nhau
767
+ làm_lòng
768
+ bất_kể
769
+ đã_không
770
+ bỗng_đâu
771
+ chịu_chưa
772
+ mang
773
+ lần_nào
774
+ ít_hơn
775
+ giữ
776
+ thái_quá
777
+ thộc
778
+ đưa_tay
779
+ thật_tốt
780
+ rằng
781
+ không_gì
782
+ rồi_thì
783
+ rằng_là
784
+ giờ
785
+ lấy_để
786
+ quá
787
+ còn_nữa
788
+ khác
789
+ tại_nơi
790
+ ít_ra
791
+ tất_thảy
792
+ chăng_chắc
793
+ dẫu_sao
794
+ dần_dà
795
+ lời_chú
796
+ khác_khác
797
+ ít_lâu
798
+ phía_sau
799
+ cuối_điểm
800
+ khoảng
801
+ chỉ_có
802
+ xem_ra
803
+ bỏ_mẹ
804
+ tránh_ra
805
+ nhìn_thấy
806
+ mang_lại
807
+ cứ
808
+ thấp_cơ
809
+ mình
810
+ mỗi
811
+ cùng_ăn
812
+ xăm_xăm
813
+ sau_sau
814
+ hay_là
815
+ đưa_cho
816
+ thường_xuất_hiện
817
+ sao_đang
818
+ đã_hay
819
+ từng_giờ
820
+ phần_lớn
821
+ nhân_dịp
822
+ giữa
823
+ tháng_tháng
824
+ nhờ_đó
825
+ phần_nhiều
826
+ nghĩ_xa
827
+ đáng
828
+ có_tháng
829
+ chết_nỗi
830
+ cũng
831
+ bị_chú
832
+ có_phải
833
+ phót
834
+ nhận_ra
835
+ phóc
836
+ làm_tại
837
+ đã_thế
838
+ tạo
839
+ trong_mình
840
+ tại
841
+ sắp_đặt
842
+ lấy_ráo
843
+ nhờ_chuyển
844
+ biết_bao
845
+ ra_bài
846
+ thốt_nhiên
847
+ ra_lại
848
+ làm_vì
849
+ hỏi
850
+ giờ_đi
851
+ vượt
852
+ do_vì
853
+ lấy_ra
854
+ về_sau
855
+ tăng
856
+ cụ_thể_như
857
+ thành_thử
858
+ thường_hay
859
+ bằng_như
860
+ tông_tốc
861
+ đều
862
+ nhìn_theo
863
+ ăn_trên
864
+ bỏ
865
+ phần_sau
866
+ nhất_định
867
+ chưa_từng
868
+ tắp_tắp
869
+ mà_vẫn
870
+ bớ
871
+ bộ
872
+ thi_thoảng
873
+ nhanh
874
+ ra_gì
875
+ đúng_với
876
+ tất_cả_bao_nhiêu
877
+ khi_trước
878
+ như_trên
879
+ ơi
880
+
881
+ chầm_chập
882
+ tha_hồ
883
+ chính_thị
884
+ ngày_nào
885
+ có_khi
886
+
887
+ nhận_việc
888
+ choa
889
+ ở_như
890
+ tên_chính
891
+ thục_mạng
892
+ làm_ngay
893
+ không_cùng
894
+ sử_dụng
895
+ chỉn
896
+ bởi_tại
897
+ không_có_gì
898
+ quá_bộ
899
+ bước_tới
900
+ vạn_nhất
901
+ hỏi_xem
902
+ việc
903
+ như_là
904
+ khá_tốt
905
+ quá_đáng
906
+ thường_sự
907
+ cây_nước
908
+ trước_ngày
909
+ bập_bà_bập_bõm
910
+ đâu_đó
911
+ được_cái
912
+ ráo_trọi
913
+ nhất_sinh
914
+ ngồi_sau
915
+ con_dạ
916
+ từ_tính
917
+ sa_sả
918
+ tại_đâu
919
+ càng_hay
920
+ lần_sang
921
+ bỏ_cuộc
922
+ tại_đây
923
+ nghe_thấy
924
+ nghĩ
925
+ ra_ý
926
+ trong_này
927
+ mở_ra
928
+ ai
929
+ ráo_cả
930
+ ngày_xưa
931
+ tình_trạng
932
+ xem_số
933
+ phải_không
934
+ tháng
935
+ thốt_thôi
936
+ đặt_mức
937
+ nữa_rồi
938
+ bỗng_nhiên
939
+ đặt_làm
940
+ vừa_vừa
941
+ không_phải
942
+ nói_ra
943
+ á_à
944
+ người_hỏi
945
+ vậy_thì
946
+ lời
947
+ tốt_ngày
948
+ có_người
949
+ chị_ấy
950
+ ái_dà
951
+ phỉ_phui
952
+ chính_là
953
+ ý_da
954
+ bên
955
+ lấy_vào
956
+ ngày_ấy
957
+ đáng_kể
958
+ cho_rằng
959
+ rồi_đây
960
+ chớ_chi
961
+ còn_về
962
+ bỏ_cha
963
+ nhưng_mà
964
+ vượt_khỏi
965
+ phía_trên
966
+ ở_trên
967
+ lớn
968
+ lúc_ấy
969
+ thoạt_nhiên
970
+ chung_ái
971
+ phải_tay
972
+ bỗng_thấy
973
+ nhất_nhất
974
+ nhất_quyết
975
+ bỏ_việc
976
+ để_được
977
+ nghe_lại
978
+ bằng_không
979
+ trếu_tráo
980
+ có_ngày
981
+ đặt_để
982
+ sang
983
+ thì_giờ
984
+ bài_bỏ
985
+ lại_người
986
+ tiếp_theo
987
+ nhất_tề
988
+ lượng_số
989
+ qua_lại
990
+ xảy_ra
991
+ hiện_nay
992
+ chính_giữa
993
+ mang_về
994
+ thật
995
+ chứ_như
996
+ chợt_nghe
997
+ hỗ_trợ
998
+ đến_ngày
999
+ làm_tôi
1000
+ mọi_việc
1001
+ nói_đủ
1002
+ được_lời
1003
+ lượng_từ
1004
+ thật_vậy
1005
+ dở_chừng
1006
+ dễ
1007
+ phải_lại
1008
+ thời_gian
1009
+ sao_bản
1010
+ vì_thế
1011
+ từ_loại
1012
+ tháng_ngày
1013
+ dữ
1014
+ vừa_rồi
1015
+ lần_theo
1016
+ chỉ_là
1017
+ chắc_hẳn
1018
+ họ
1019
+ phỏng_như
1020
+ bông
1021
+ loại
1022
+ vâng_dạ
1023
+ vấn_đề
1024
+ sáng_rõ
1025
+ tuy_nhiên
1026
+ gồm
1027
+ phương_chi
1028
+ sắp
1029
+ gần_đây
1030
+ hay_tin
1031
+ hay_làm
1032
+ nặng_căn
1033
+ cơ_dẫn
1034
+ cần
1035
+ dễ_đâu
1036
+ dù_cho
1037
+ nghe_trực_tiếp
1038
+ cật_lực
1039
+ mà_cả
1040
+ số_thiếu
1041
+ chơi_họ
1042
+ ngày_rày
1043
+ đủ_dùng
1044
+ ăn_chung
1045
+ thật_chắc
1046
+ có_điều
1047
+ bấy_nay
1048
+ thậm_cấp
1049
+ ví_phỏng
1050
+ cho_nhau
1051
+ thuộc_bài
1052
+ nữa_là
1053
+ nhớ_lại
1054
+ thế_à
1055
+ vốn_dĩ
1056
+ chưa_có
1057
+ giá_trị
1058
+ ắt_phải
1059
+ sao_vậy
1060
+ bất_quá_chỉ
1061
+ thế_chuẩn_bị
1062
+ lượng_cả
1063
+ không_bao_lâu
1064
+ mọi_lúc
1065
+ thế_đó
1066
+ bay_biến
1067
+ về
1068
+ nhón_nhén
1069
+ đưa_về
1070
+ dào
1071
+ còn
1072
+ làm_như
1073
+
1074
+ vô_luận
1075
+
1076
+ tự_lượng
1077
+
1078
+ luôn_cả
1079
+ toẹt
1080
+
1081
+ cứ_điểm
1082
+
1083
+ chưa_bao_giờ
1084
+ dạ
1085
+ chịu_tốt
1086
+ tăng_thêm
1087
+ bằng_người
1088
+ phỏng_theo
1089
+ có_đâu
1090
+ lâu_các
1091
+ tuốt_tuồn_tuột
1092
+ riêng_từng
1093
+ tỏ_vẻ
1094
+ cao_số
1095
+ như
1096
+ đại_phàm
1097
+ lên_cơn
1098
+ đủ_điểm
1099
+ thế_nên
1100
+ lần
1101
+ trả_trước
1102
+ là_nhiều
1103
+ tắp
1104
+ quay_đi
1105
+ a_ha
1106
+ xăm_xúi
1107
+ lòng
1108
+ tắp_lự
1109
+ phải_người
1110
+ bỏ_mình
1111
+ chú_dẫn
1112
+ đủ_điều
1113
+ khoảng_không
1114
+ đã_vậy
1115
+ yêu_cầu
1116
+ câu_hỏi
1117
+ cho_tới_khi
1118
+ nước_đến
1119
+ để
1120
+ chính_điểm
1121
+ tìm_hiểu
1122
+ ăn_hỏi
1123
+ dẫu
1124
+ ngươi
1125
+ gần_hết
1126
+ như_tuồng
1127
+ khỏi_nói
1128
+ tìm_ra
1129
+ bất_thình_lình
1130
+ trực_tiếp
1131
+ mới
1132
+ xa_gần
1133
+ xa_tanh
1134
+ chứ_gì
1135
+ ngoải
1136
+ dài_ra
1137
+ bao_nả
1138
+ này
1139
+ trên_dưới
1140
+ số_cụ_thể
1141
+ nói_là
1142
+ nào
1143
+ luôn
1144
+ nước_nặng
1145
+ khác_gì
1146
+ cả_đến
1147
+ đó_đây
1148
+ thay_đổi
1149
+ gần_ngày
1150
+ phía_trong
1151
+ như_thế_nào
1152
+ tạo_ý
1153
+ buổi
1154
+ quay_lại
1155
+ khá
1156
+ có_cơ
1157
+ cảm_ơn
1158
+ dễ_ngươi
1159
+ khó
1160
+ như_chơi
1161
+ phải_giờ
1162
+ tuổi
1163
+ tốc_tả
1164
+ răng
1165
+ nhờ_có
1166
+ rồi_xem
1167
+ ngoài_xa
1168
+ chưa_tính
1169
+ được_nước
1170
+ thình_lình
1171
+ phía_bên
1172
+ sau_đó
1173
+ lại_ăn
1174
+ sao_bằng
1175
+ quá_bán
1176
+ nguồn
1177
+ phụt
1178
+ nhất_thì
1179
+ cùng_nhau
1180
+ nên_chi
1181
+ nghe_nhìn
1182
+ lấy_được
1183
+ cho_chắc
1184
+ bỏ_riêng
1185
+ ơi_là
1186
+ lên_cao
1187
+ mới_đây
1188
+ thế_thì
1189
+ bằng_vào
1190
+ cuộc
1191
+ kể_từ
1192
+ bất_kì
1193
+ đầu_tiên
1194
+ trả_lại
1195
+ ngôi_thứ
1196
+ ít_nhất
1197
+ cách_không
1198
+ nhằm_khi
1199
+ chung_quy_lại
1200
+ cu_cậu
1201
+ xuất_kì_bất_ý
1202
+ nhất_thiết
1203
+ phải_biết
1204
+ nghen
1205
+ đưa_đến
1206
+ kể
1207
+ đâu_phải
1208
+ dễ_gì
1209
+ đến_gần
1210
+ quả_là
1211
+ đến_nay
1212
+ cao_xa
1213
+ thốt_nói
1214
+ nghe_nói
1215
+ bởi_nhưng
1216
+ phè_phè
1217
+ công_nhiên
1218
+ đặt_trước
1219
+ bước_đi
1220
+ lấy_cả
1221
+ chứ_không
1222
+ tuần_tự
1223
+ thích_tự
1224
+ mà_lại
1225
+ để_mà
1226
+
1227
+ với_lại
1228
+ đến_giờ
1229
+ ngày_càng
1230
+ bản_bộ
1231
+ dẫu_rằng
1232
+ ừ_ừ
1233
+ nói_bông
1234
+ như_quả
1235
+ bèn
1236
+ về_phần
1237
+ chậc
1238
+ tìm_việc
1239
+ làm_được
1240
+ lúc_đến
1241
+ có_đáng
1242
+ mọi_sự
1243
+ vâng
1244
+ úi_chà
1245
+ khác_nhau
1246
+ tự_ăn
1247
+ ngay_từ
1248
+ nhung_nhăng
1249
+ khác_thường
1250
+ số_người
1251
+ khó_tránh
1252
+ bỗng
1253
+ cứ_như
1254
+ bởi_đâu
1255
+ một_khi
1256
+ tính_cách
1257
+ tiếp_đó
1258
+ qua_khỏi
1259
+ mất_còn
1260
+ là_thế_nào
1261
+ giống_người
1262
+ ông_nhỏ
1263
+ hoặc_là
1264
+ vung_tàn_tán
1265
+ cũng_được
1266
+ thanh_ba
1267
+ con_tính
1268
+ chắc_chắn
1269
+ vị_tất
1270
+ ngày_nọ
1271
+ bên_bị
1272
+ cóc_khô
1273
+ ngay_bây_giờ
1274
+ thì_là
1275
+ làm_riêng
1276
+ chứ_ai
1277
+ tuy_đã
1278
+ đâu_đây
1279
+ trừ_phi
1280
+ lý_do
1281
+ đâu_đâu
1282
+ ôi_thôi
1283
+ nhiều
1284
+ quá_trình
1285
+ ăn_chắc
1286
+ chuyển_tự
1287
+ duy
1288
+ ngày_giờ
1289
+ khi_nên
1290
+ chắc_dạ
1291
+ nên_chăng
1292
+ tuốt_luốt
1293
+ dành
1294
+ không_nhận
1295
+ văng_tê
1296
+ cả_thể
1297
+ tấm_các
1298
+ nói_thêm
1299
+ thà_rằng
1300
+ đưa
1301
+ xoét
1302
+ ráo
1303
+ à_ơi
1304
+ thích_thuộc
1305
+ đặc_biệt
1306
+ ngày_xửa
1307
+ chưa_dùng
1308
+ duy_chỉ
1309
+ phỏng
1310
+ phía_dưới
1311
+ rồi_ra
1312
+ thế_lại
1313
+ thường_tính
1314
+ bà_ấy
1315
+ những_lúc
1316
+ chành_chạnh
1317
+ trước_đó
1318
+ thứ_bản
1319
+ số_là
1320
+ lại_thôi
1321
+ thoạt
1322
+ giờ_đây
1323
+ lại_nói
1324
+
1325
+ đ��_số
1326
+ tha_hồ_chơi
1327
+ từ_giờ
1328
+ khó_chơi
1329
+ quá_giờ
1330
+ trở_thành
1331
+ ngay_cả
1332
+ ví_dù
1333
+ sau_hết
1334
+ cấp
1335
+ bằng_cứ
1336
+ ngay_lúc
1337
+ ít_khi
1338
+ đủ_nơi
1339
+ bên_cạnh
1340
+ lên_nước
1341
+ chúng_mình
1342
+ qua_thì
1343
+ được_tin
1344
+ đây
1345
+ biết_việc
1346
+ thực_hiện_đúng
1347
+ tên_tự
1348
+ làm_theo
1349
+ nghe_rõ
1350
+ mở
1351
+ tột
1352
+ rồi_sau
1353
+ ăn_ngồi
1354
+ vào_khoảng
1355
+ lấy_có
1356
+ thảo_hèn
1357
+ cái_ấy
1358
+ đến_nỗi
1359
+ cực_lực
1360
+ đủ
1361
+ suýt_nữa
1362
+ nói_phải
1363
+ thậm_chí
1364
+ cho_biết
1365
+ hơn_hết
1366
+ mợ
1367
+ buổi_mới
1368
+ tại_vì
1369
+ từng_phần
1370
+ thứ
1371
+ năm_tháng
1372
+ rốt_cuộc
1373
+ nói_thật
1374
+ ơ_kìa
1375
+ nước_ăn
1376
+ thì_ra
1377
+ hầu_hết
1378
+ lâu_nay
1379
+ ngày_cấp
1380
+ bài_bác
1381
+ như_trước
1382
+ sao_cho
1383
+ loại_từ
1384
+ phải_rồi
1385
+ ba
1386
+ đều_nhau
1387
+ trả
1388
+ lúc_sáng
1389
+ ớ_này
1390
+ bỗng_không
1391
+ mọi_thứ
1392
+ cây
1393
+ vừa_lúc
1394
+ lấy
1395
+ vừa_khi
1396
+ phốc
1397
+ chớ_không
1398
+ người_mình
1399
+ bằng_nhau
1400
+ nghe_hiểu
1401
+ tại_lòng
1402
+ nhé
1403
+ không_những
1404
+ cả_nhà
1405
+ nữa_khi
1406
+ lần_lần
1407
+ bị
1408
+ rày
1409
+ sau_đây
1410
+ tay_quay
1411
+ bằng
1412
+ con_con
1413
+ nghe_ra
1414
+ sẽ_hay
1415
+ thích
1416
+ chủn
1417
+ than_ôi
1418
+ càng
1419
+ vài_tên
1420
+ bị_vì
1421
+ ối_dào
1422
+ hoặc
1423
+ xềnh_xệch
1424
+ không_để
1425
+ ra_tay
1426
+ nặng_về
1427
+ veo_veo
1428
+ sau_này
1429
+ cả_ăn
1430
+ coi_bộ
1431
+ ý_chừng
1432
+ làm_bằng
1433
+ vâng_vâng
1434
+ cao_ráo
1435
+ thanh_tính
1436
+ không_hay
1437
+ lại_đây
1438
+ xin_gặp
1439
+ nói_trước
1440
+ phần_nào
1441
+ tránh
1442
+ rén_bước
1443
+ đơn_vị
1444
+ nay
1445
+ thửa
1446
+ tuốt_tuột
1447
+ tột_cùng
1448
+ oái
1449
+ quá_lời
1450
+ lúc_trước
1451
+ lấy_số
1452
+ đưa_em
1453
+ khó_thấy
1454
+ ít_nhiều
1455
+ ở_nhờ
1456
+ cùng_với
1457
+ nọ
1458
+ khi_khác
1459
+ tối_ư
1460
+ nớ
1461
+ lần_này
1462
+ dầu_sao
1463
+ làm_gì
1464
+ bởi_ai
1465
+ gặp_phải
1466
+ hỏi_xin
1467
+ nhất
1468
+ chẳng_nữa
1469
+ rõ_là
1470
+ đúng
1471
+ ai_đó
1472
+ xa_tắp
1473
+ căn_cái
1474
+ ba_bản
1475
+ tấm_bản
1476
+ cũng_vậy_thôi
1477
+ cùng_tột
1478
+ nhà_tôi
1479
+ bỗng_nhưng
1480
+ khó_nói
1481
+ quá_tuổi
1482
+ nấy
1483
+ ngay_khi_đến
1484
+ ổng
1485
+ vâng_chịu
1486
+ vở
1487
+ sẽ
1488
+ bấy_lâu_nay
1489
+ tuy_thế
1490
+ tự_tạo
1491
+ điều_gì
1492
+ lúc_này
1493
+ mỗi_một
1494
+ ngồi_không
1495
+ mỗi_người
1496
+ lúc_nào
1497
+ qua_ngày
1498
+ gây_giống
1499
+ bỗng_chốc
1500
+ hay_biết
1501
+ cao_răng
1502
+ tuyệt_nhiên
1503
+ giảm
1504
+ thúng_thắng
1505
+ dạ_dạ
1506
+ vả_lại
1507
+ nhau
1508
+ vừa_mới
1509
+ vùng_nước
1510
+ nói_lại
1511
+ ngọn_nguồn
1512
+ trên
1513
+ cao_sang
1514
+ ngôi
1515
+ chung_cho
1516
+ sì_sì
1517
+ năm
1518
+ đảm_bảo
1519
+ thế
1520
+ sẽ_biết
1521
+ ngộ_nhỡ
1522
+ dễ_khiến
1523
+ thậm_từ
1524
+ tự
1525
+ cả_nghĩ
1526
+ riệt
1527
+ ăn_về
1528
+ rồi_nữa
1529
+ lần_khác
1530
+ chưa_chắc
1531
+ tìm_cách
1532
+ cả_người
1533
+ thương_ôi
1534
+ tha_hồ_ăn
1535
+ bấy_nhiêu
1536
+ ít_biết
1537
+ chắc
1538
+ hay_hay
1539
+ tất_tần_tật
1540
+ cha
1541
+ tới_nơi
1542
+ vậy_là
1543
+ thế_sự
1544
+ dạ_khách
1545
+ cho
1546
+ ào_ào
1547
+ tanh_tanh
1548
+ đến_hay
1549
+ biết_bao_nhiêu
1550
+ alô
1551
+ bỏ_xa
1552
+ thuộc_từ
1553
+ lúc_đi
1554
+ biết_được
1555
+ chẳng_lẽ
1556
+ chính
1557
+ hết_rồi
1558
+ tự_cao
1559
+ cho_hay
1560
+ vài_ba
1561
+ chớ_gì
1562
+ nếu_vậy
1563
+ có_chăng
1564
+ cho_thấy
1565
+ bản_thân
1566
+ tay
1567
+ thẩy
1568
+ cho_được
1569
+ khi_không
1570
+ chuyển
1571
+ hết_nói
1572
+ có_ai
1573
+ bán_cấp
1574
+ cho_tin
1575
+ ít_quá
1576
+ bước_khỏi
1577
+ là_vì
1578
+ xuể
1579
+ ba_tăng
1580
+ bây_chừ
1581
+ có_chứ
1582
+ tăng_chúng
1583
+ nữa
1584
+ lúc
1585
+ biết_mấy
1586
+ sau_chót
1587
+ từ_điều
1588
+ ầu_ơ
1589
+ đạt
1590
+ quan_trọng
1591
+ cho_rồi
1592
+ như_ý
1593
+ bất_ngờ
1594
+ khó_nghe
1595
+ ít
1596
+ nào_cũng
1597
+ cô_ấy
1598
+ nhược_bằng
1599
+ chết_thật
1600
+ cơn
1601
+ thanh_chuyển
1602
+ quá_tay
1603
+ thoắt
1604
+ từng_đơn_vị
1605
+ đầy_phè
1606
+ bất_luận
1607
+ lấy_lại
1608
+ ăn_người
1609
+ trệt
1610
+ đến
1611
+ thế_mà
1612
+ thảo_nào
1613
+ quá_ư
1614
+ làm_sao
1615
+ biết_thế
1616
+ ơ
1617
+ nước_cùng
1618
+ đáng_lẽ
1619
+ thường
1620
+ mở_mang
1621
+ chung
1622
+ rút_cục
1623
+ đến_tuổi
1624
+ ngày_đến
1625
+ nhớ_lấy
1626
+ nhà_làm
1627
+ bởi
1628
+ hết_ráo
1629
+ nhận_được
1630
+ tránh_khỏi
1631
+ cho_về
1632
+ áng
1633
+ những
1634
+ ăn_cuộc
1635
+ ngoài_này
1636
+ tít_mù
1637
+ điểm_chính
1638
+ nhóm
1639
+ sau_cùng
1640
+ cách_đều
1641
+ bức
1642
+ qua
1643
+ tới
1644
+ tin_vào
1645
+ nhận_thấy
1646
+ nói_với
1647
+ vô_hình_trung
1648
+ ráo_nước
1649
+ đang_tay
1650
+ cô_mình
1651
+ về_không
1652
+ đến_cùng
1653
+ đây_rồi
1654
+ nhất_là
1655
+ chưa_dễ
1656
+ úi_dào
1657
+ tới_gần
1658
+ tốt_bạn
1659
+ thốt
1660
+ thốc
1661
+ đã_là
1662
+ làm_tắp_lự
1663
+ đúng_ngày
1664
+ ăn
1665
+ qua_chuyện
1666
+ chú_mày
1667
+ nghĩ_ra
1668
+ trước_nay
1669
+ nào_là
1670
+ chu_cha
1671
+ chẳng_những
1672
+ thật_sự
1673
+ dù_dì
1674
+ tìm
1675
+ vậy_mà
1676
+ để_cho
1677
+ chắc_lòng
1678
+ ví_bằng
1679
+ xoành_xoạch
1680
+ vèo
1681
+ đó
1682
+ sự
1683
+ rích
1684
+ làm_thế_nào
1685
+ bản_riêng
1686
+ bao_nhiêu
1687
+ đã
1688
+ đến_cùng_cực
1689
+ trước_tiên
1690
+ quả_thật
1691
+ đã_đủ
1692
+ như_vậy
1693
+ số
1694
+ quá_nhiều
1695
+ nói_riêng
1696
+ cao_lâu
1697
+ nên_tránh
1698
+ chuẩn_bị
1699
+ một_số
1700
+ không_được
1701
+ cho_đến_nỗi
1702
+ về_tay
1703
+ bán_dạ
1704
+ bằng_ấy
1705
+ phỏng_tính
1706
+ nhất_đán
1707
+ gì_đó
1708
+ tiếp_tục
1709
+ trước
1710
+ dù_sao
1711
+ tên_cái
1712
+ bao_giờ
1713
+ có_số
1714
+ mà_không
1715
+ lấy_sau
1716
+ cơ_chừng
1717
+ chăng
1718
+ theo_bước
1719
+ liên_quan
1720
+ dài_lời
1721
+ úi
1722
+ về_nước
1723
+ những_ai
1724
+ thêm
1725
+ dễ_sợ
1726
+ cổ_lai
1727
+ béng
1728
+ để_phần
1729
+ không_đầy
1730
+ phứt
1731
+ cơ_hồ
1732
+ dễ_dùng
1733
+ nên
1734
+ toé_khói
1735
+ phần_việc
1736
+ dữ_cách
1737
+ tuổi_cả
1738
+ cả_thảy
1739
+ còn_như
1740
+ bỏ_nhỏ
1741
+ nơi
1742
+ hay_nhỉ
1743
+ để_không
1744
+ mỗi_ngày
1745
+ cả_năm
1746
+ xin_vâng
1747
+ chia_sẻ
1748
+ có_được
1749
+ theo_như
1750
+ hay_không
1751
+ thứ_đến
1752
+ bởi_sao
1753
+ ít_thấy
1754
+ lại_nữa
1755
+ bấy
1756
+ amen
1757
+ chính_bản
1758
+ trong_lúc
1759
+ phắt
1760
+ nghe_tin
1761
+ lâu_ngày
1762
+ đối_với
1763
+ thanh
1764
+ ngoài_ra
1765
+ ít_nữa
1766
+ nào_đâu
1767
+ dù_gì
1768
+ cùng_chung
1769
+ thôi_việc
1770
+ cần_cấp
1771
+ bản_ý
1772
+ phỏng_nước
1773
+ lần_tìm
1774
+ nghe_chừng
1775
+ nói_tốt
1776
+ thường_số
1777
+ người_khác
1778
+ bộ_thuộc
1779
+ bên_có
1780
+ bằng_nấy
1781
+ dễ_ăn
1782
+ cái
1783
+ không_biết
1784
+ các
1785
+ tên_họ
1786
+ bao_lâu
1787
+ những_muốn
1788
+ cùng_tuổi
1789
+ số_cho_biết
1790
+ nói_xa
1791
+ nhanh_tay
1792
+ đặt_mình
1793
+ khó_nghĩ
1794
+ trước_sau
1795
+ từ_từ
1796
+ nhỏ_người
1797
+ gần_xa
1798
+ tấm
1799
+ tức_tốc
1800
+ từ_ấy
1801
+ buổi_sớm
1802
+ đúng_tuổi
1803
+ chơi
1804
+ dài
1805
+ mỗi_lúc
1806
+ luôn_luôn
1807
+ nhiệt_liệt
1808
+ không_bao_giờ
1809
+ thấp_xuống
1810
+ pho
1811
+ hoàn_toàn
1812
+ chung_nhau
1813
+ lên
1814
+ chung_chung
1815
+ chắc_người
1816
+ dẫn
1817
+ không_khỏi
1818
+ một_lúc
1819
+ ngày
1820
+ bỏ_mất
1821
+ trước_nhất
1822
+ lúc_khác
1823
+ lên_đến
1824
+ xa_xả
1825
+ so_với
1826
+ xem
1827
+ trong_ấy
1828
+ thế_ra
1829
+ ngay_lập_tức
1830
+ phải_cái
1831
+ ắt_thật
1832
+ nghe
1833
+ dễ_thường
1834
+ qua_lần
1835
+ xa_xa
1836
+ ư
1837
+ vì_sao
1838
+ lấy_giống
1839
+ chớ
1840
+ cô_quả
1841
+ lên_ngôi
1842
+ chị
1843
+ như_nhau
1844
+ chỉ
1845
+ ắt
1846
+ biết
1847
+ chớ_kể
1848
+ chớ_như
1849
+ mở_nước
1850
+ khác_nào
1851
+ chứ
1852
+ nước_lên
1853
+ cơ_hội
1854
+ nhà
1855
+ thực_ra
1856
+ họ_gần
1857
+ làm_lại
1858
+ ba_ngày
1859
+ tìm_bạn
1860
+ thấp
1861
+ là_là
1862
+ rồi_tay
1863
+ chọn_bên
1864
+ cũng_thế
1865
+ thấy
1866
+ số_phần
1867
+ ra_bộ
1868
+ từ
1869
+ nhìn_xuống
1870
+ tính_căn
1871
+ khi_nào
1872
+ vào_lúc
1873
+ nhận_biết
1874
+ căn
1875
+ hiện_tại
1876
+ từ_khi
1877
+ ơ_hay
1878
+
1879
+ phù_hợp
1880
+ thuộc
1881
+ tớ
1882
+ nghe_như
1883
+ chui_cha
1884
+ sớm
1885
+ ừ_nhé
1886
+ đưa_tin
1887
+ tuy_là
1888
+ thoạt_nghe
1889
+ ra_người
1890
+ xem_lại
1891
+ không_còn
1892
+ người_nhận
1893
+ tập_trung
1894
+ vấn_đề_quan_trọng
1895
+ nhà_khó
1896
+ vì_chưng
1897
+ vậy_ra
1898
+ thành_ra
1899
+ chúng_ông
1900
+ cảm_thấy
1901
+ xoẳn
1902
+ rốt_cục
1903
+ của_tin
1904
+ tôi_con
1905
+ những_là
1906
+ số_loại
1907
+ xon_xón
1908
+ vô_vàn
1909
+ từng_nhà
1910
+ đồng_thời
1911
+ gần_đến
1912
+ đến_đâu
1913
+ thay_đổi_tình_trạng
1914
+ là_cùng
1915
+ cũng_như
1916
+ đến_cả
1917
+ làm_cho
1918
+ bển
1919
+ bài_cái
1920
+ nếu_không
1921
+ lấy_thế
1922
+ cũng_vậy
1923
+ cấp_trực_tiếp
1924
+ luôn_tay
1925
+
1926
+ không_thể
1927
+ thường_thường
1928
+ cần_gì
1929
+ mọi_khi
1930
+ đáo_để
1931
+ ăn_làm
1932
+ thanh_điều_kiện
1933
+ đầy_tuổi
1934
+ đưa_vào
1935
+ đưa_xuống
1936
+ bất_nhược
1937
+ khiến
1938
+ thời_gian_sử_dụng
1939
+ cái_họ
1940
+ hết
1941
+ lại
1942
+ thế_thế
1943
+ dần_dần
tutorial.py ADDED
@@ -0,0 +1,12 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ from retrieval.retrieval import Retrieval, BM25
2
+
3
+ # retrieval = Retrieval(k=4)
4
+ # contexts = retrieval.get_context()
5
+
6
+
7
+ docs = open('../document2.txt', encoding='utf-8').read()
8
+ retrieval = Retrieval(docs=docs)
9
+ # retrieval.tuning(docs)
10
+ contexts = retrieval.get_context("Khi nào bệnh nhên nên đến bệnh viện?")
11
+ for context in contexts:
12
+ print(context)