Kims12 commited on
Commit
46e9dda
β€’
1 Parent(s): afd67dc

Update app.py

Browse files
Files changed (1) hide show
  1. app.py +12 -16
app.py CHANGED
@@ -7,12 +7,9 @@ import os
7
  def process_excel(file):
8
  # μ—‘μ…€ 파일 읽기
9
  df = pd.read_excel(file.name)
10
-
11
- # λͺ¨λ“  셀을 μ•„λž˜λ‘œ 3μΉΈμ”© 이동
12
- shifted_df = df.shift(3)
13
-
14
  # Dμ—΄μ˜ 데이터 μΆ”μΆœ
15
- product_names = shifted_df.iloc[:, 3].dropna() # D열은 0λΆ€ν„° μ‹œμž‘ν•˜λ―€λ‘œ indexλŠ” 3
16
 
17
  # ν‚€μ›Œλ“œ μΆ”μΆœ 및 λΉˆλ„ 계산
18
  all_keywords = []
@@ -31,28 +28,27 @@ def process_excel(file):
31
  result_df = pd.DataFrame(keyword_counts.items(), columns=['Keyword', 'Frequency'])
32
  result_df = result_df.sort_values(by='Frequency', ascending=False).reset_index(drop=True)
33
 
 
 
 
 
34
  # 디렉토리 생성 확인 및 파일 μ €μž₯
35
  output_dir = "output"
36
  if not os.path.exists(output_dir):
37
  os.makedirs(output_dir)
38
 
39
- # κ²°κ³Όλ₯Ό μ €μž₯ν•  파일λͺ… μ„€μ •
40
- output_file_shifted = os.path.join(output_dir, "shifted_excel.xlsx")
41
- output_file_keywords = os.path.join(output_dir, "keyword_counts.xlsx")
42
-
43
- # μ΄λ™λœ λ°μ΄ν„°ν”„λ ˆμž„κ³Ό ν‚€μ›Œλ“œ 카운트 κ²°κ³Όλ₯Ό 각각 μ €μž₯
44
- shifted_df.to_excel(output_file_shifted, index=False)
45
- result_df.to_excel(output_file_keywords, index=False)
46
 
47
- return [output_file_shifted, output_file_keywords]
48
 
49
  # Gradio μΈν„°νŽ˜μ΄μŠ€ μ •μ˜
50
  iface = gr.Interface(
51
  fn=process_excel,
52
  inputs=gr.File(file_types=[".xlsx"]), # μ—‘μ…€ 파일만 μ—…λ‘œλ“œν•  수 있게 μ„€μ •
53
- outputs=[gr.File(label="Shifted Excel File"), gr.File(label="Keyword Counts Excel File")],
54
- title="Excel Shift Rows and Keyword Extraction",
55
- description="μ—‘μ…€ 파일의 λͺ¨λ“  셀을 μ•„λž˜λ‘œ 3μΉΈμ”© μ΄λ™μ‹œν‚€κ³ , Dμ—΄μ—μ„œ ν‚€μ›Œλ“œλ₯Ό μΆ”μΆœν•˜μ—¬ λΉˆλ„λ₯Ό κ³„μ‚°ν•œ ν›„ κ²°κ³Όλ₯Ό μ œκ³΅ν•©λ‹ˆλ‹€."
56
  )
57
 
58
  if __name__ == "__main__":
 
7
  def process_excel(file):
8
  # μ—‘μ…€ 파일 읽기
9
  df = pd.read_excel(file.name)
10
+
 
 
 
11
  # Dμ—΄μ˜ 데이터 μΆ”μΆœ
12
+ product_names = df.iloc[:, 3].dropna() # D열은 0λΆ€ν„° μ‹œμž‘ν•˜λ―€λ‘œ indexλŠ” 3
13
 
14
  # ν‚€μ›Œλ“œ μΆ”μΆœ 및 λΉˆλ„ 계산
15
  all_keywords = []
 
28
  result_df = pd.DataFrame(keyword_counts.items(), columns=['Keyword', 'Frequency'])
29
  result_df = result_df.sort_values(by='Frequency', ascending=False).reset_index(drop=True)
30
 
31
+ # A4, B4λΆ€ν„° κ²°κ³Όλ₯Ό μ‹œμž‘ν•˜λ„λ‘ λ°μ΄ν„°ν”„λ ˆμž„μ„ μˆ˜μ •
32
+ result_df_shifted = pd.DataFrame(index=range(3)) # 빈 λ°μ΄ν„°ν”„λ ˆμž„ 생성 (3μΉΈ μ•„λž˜λ‘œ 이동)
33
+ result_df_shifted = pd.concat([result_df_shifted, result_df]).reset_index(drop=True)
34
+
35
  # 디렉토리 생성 확인 및 파일 μ €μž₯
36
  output_dir = "output"
37
  if not os.path.exists(output_dir):
38
  os.makedirs(output_dir)
39
 
40
+ output_file = os.path.join(output_dir, "keyword_counts.xlsx")
41
+ result_df_shifted.to_excel(output_file, index=False, header=False, startrow=3) # 3ν–‰μ—μ„œ μ‹œμž‘
 
 
 
 
 
42
 
43
+ return output_file
44
 
45
  # Gradio μΈν„°νŽ˜μ΄μŠ€ μ •μ˜
46
  iface = gr.Interface(
47
  fn=process_excel,
48
  inputs=gr.File(file_types=[".xlsx"]), # μ—‘μ…€ 파일만 μ—…λ‘œλ“œν•  수 있게 μ„€μ •
49
+ outputs="file",
50
+ title="Excel Keyword Extractor",
51
+ description="μ—‘μ…€ 파일의 Dμ—΄μ—μ„œ ν‚€μ›Œλ“œλ₯Ό μΆ”μΆœν•˜κ³  λΉˆλ„λ₯Ό κ³„μ‚°ν•˜μ—¬ μƒˆλ‘œμš΄ μ—‘μ…€ 파일둜 좜λ ₯ν•©λ‹ˆλ‹€."
52
  )
53
 
54
  if __name__ == "__main__":