import gradio as gr
import requests
import json
from datetime import datetime, timedelta
API_KEY = "V38CNn4HXpLtynJQyOeoUensTEYoFy8PBUxKpDqAW1pawT1vfJ2BWtPQ98h6"
MAJOR_COUNTRIES = [
"United States", "United Kingdom", "Canada", "Australia", "Germany",
"France", "Japan", "South Korea", "China", "India",
"Brazil", "Mexico", "Russia", "Italy", "Spain",
"Netherlands", "Sweden", "Switzerland", "Norway", "Denmark",
"Finland", "Belgium", "Austria", "New Zealand", "Ireland",
"Singapore", "Hong Kong", "Israel", "United Arab Emirates", "Saudi Arabia",
"South Africa", "Turkey", "Egypt", "Poland", "Czech Republic",
"Hungary", "Greece", "Portugal", "Argentina", "Chile",
"Colombia", "Peru", "Venezuela", "Thailand", "Malaysia",
"Indonesia", "Philippines", "Vietnam", "Pakistan", "Bangladesh"
]
def search_serphouse(query, country, page=1, num_result=100):
url = "https://api.serphouse.com/serp/live"
now = datetime.utcnow()
yesterday = now - timedelta(days=1)
date_range = f"{yesterday.strftime('%Y-%m-%d')},{now.strftime('%Y-%m-%d')}"
payload = {
"data": {
"q": query,
"domain": "google.com",
"loc": country,
"lang": "en",
"device": "desktop",
"serp_type": "news",
"page": str(page),
"verbatim": "1",
"num": str(num_result),
"date_range": date_range
}
}
headers = {
"accept": "application/json",
"content-type": "application/json",
"authorization": f"Bearer {API_KEY}"
}
try:
response = requests.post(url, json=payload, headers=headers)
response.raise_for_status()
return response.json()
except requests.RequestException as e:
error_msg = f"Error: {str(e)}"
if response.text:
error_msg += f"\nResponse content: {response.text}"
return {"error": error_msg}
def format_results_from_raw(results):
try:
# 디버그 정보 생략
debug_info = ""
if isinstance(results, dict) and "error" in results:
return "Error: " + results["error"], ""
if not isinstance(results, dict):
raise ValueError("결과가 사전 형식이 아닙니다.")
# 'results' 키 내부의 구조 확인 (중첩된 'results' 처리)
if 'results' in results:
results_content = results['results']
if 'results' in results_content:
results_content = results_content['results']
# 'news' 키 확인
if 'news' in results_content:
news_results = results_content['news']
else:
news_results = []
else:
news_results = []
else:
news_results = []
if not news_results:
return "검색 결과가 없습니다.", ""
# 뉴스 결과를 리스트 형태로 포맷팅 (이미지 썸네일 포함)
list_output = ""
for idx, result in enumerate(news_results, 1):
title = result.get("title", "제목 없음")
link = result.get("url", result.get("link", "#"))
snippet = result.get("snippet", "내용 없음")
channel = result.get("channel", result.get("source", "알 수 없음"))
time = result.get("time", result.get("date", "알 수 없는 시간"))
image_url = result.get("img", result.get("thumbnail", ""))
# base64로 인코딩된 이미지를 처리하지 않음
if image_url and not image_url.startswith("data:image"):
thumbnail_html = f''
else:
thumbnail_html = ''
# 리스트 형식의 기사 (이미지 썸네일 포함)
list_item = f"""