Spaces:

Kims12
/

na_ver

Sleeping

File size: 6,425 Bytes

b43fad9
67096dc
 
b43fad9
67096dc
 
863de1b
67096dc
b43fad9
71ba060
bfacc72
b43fad9
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
bfacc72
b43fad9
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
bfacc72
b43fad9
cb9d18f
67096dc
b43fad9
 
 
 
 
 
 
bfacc72
b43fad9
 
 
 
 
 
 
 
 
 
 
 
 
 
 
863de1b
bfacc72
b43fad9
 
 
 
 
863de1b
bfacc72
b43fad9
71ba060
bfacc72
 
 
 
71ba060
bfacc72
b43fad9
 
 
 
 
 
bfacc72
b43fad9
 
 
71ba060
b43fad9
bfacc72
b43fad9
 
 
 
 
 
 
 
71ba060
b43fad9
71ba060
bfacc72
b43fad9
 
bfacc72
b43fad9
 
bfacc72
 
 
b43fad9
bfacc72
 
b43fad9
 
 
 
bfacc72
 
 
 
 
 
 
 
 
 
 
 
b43fad9
bfacc72
 
 
 
 
67096dc
b43fad9

import os
import time
import hmac
import hashlib
import base64
import requests
import pandas as pd
import tempfile
import gradio as gr

# --- 네이버 광고 API: 서명 생성 및 헤더 구성 ---
def generate_signature(timestamp, method, uri, secret_key):
    message = f"{timestamp}.{method}.{uri}"
    digest = hmac.new(secret_key.encode("utf-8"), message.encode("utf-8"), hashlib.sha256).digest()
    return base64.b64encode(digest).decode()

def get_header(method, uri, api_key, secret_key, customer_id):
    timestamp = str(round(time.time() * 1000))
    signature = generate_signature(timestamp, method, uri, secret_key)
    return {
        "Content-Type": "application/json; charset=UTF-8",
        "X-Timestamp": timestamp,
        "X-API-KEY": api_key,
        "X-Customer": str(customer_id),
        "X-Signature": signature
    }

# --- 네이버 광고 API: 연관검색어 및 검색량 조회 ---
def fetch_related_keywords(keyword):
    API_KEY = os.environ["NAVER_API_KEY"]
    SECRET_KEY = os.environ["NAVER_SECRET_KEY"]
    CUSTOMER_ID = os.environ["NAVER_CUSTOMER_ID"]
    
    BASE_URL = "https://api.naver.com"
    uri = "/keywordstool"
    method = "GET"
    headers = get_header(method, uri, API_KEY, SECRET_KEY, CUSTOMER_ID)
    params = {
        "hintKeywords": [keyword],
        "showDetail": "1"
    }
    response = requests.get(BASE_URL + uri, params=params, headers=headers)
    data = response.json()
    if "keywordList" not in data:
        return pd.DataFrame()
    df = pd.DataFrame(data["keywordList"])
    if len(df) > 100:
        df = df.head(100)
    
    def parse_count(x):
        try:
            return int(str(x).replace(",", ""))
        except:
            return 0

    df["PC월검색량"] = df["monthlyPcQcCnt"].apply(parse_count)
    df["모바일월검색량"] = df["monthlyMobileQcCnt"].apply(parse_count)
    df["토탈월검색량"] = df["PC월검색량"] + df["모바일월검색량"]
    df.rename(columns={"relKeyword": "정보키워드"}, inplace=True)
    result_df = df[["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"]]
    return result_df

# --- 네이버 검색 API: 블로그 문서수 조회 ---
def fetch_blog_count(keyword):
    client_id = os.environ["NAVER_SEARCH_CLIENT_ID"]
    client_secret = os.environ["NAVER_SEARCH_CLIENT_SECRET"]
    url = "https://openapi.naver.com/v1/search/blog.json"
    headers = {
        "X-Naver-Client-Id": client_id,
        "X-Naver-Client-Secret": client_secret
    }
    params = {"query": keyword, "display": 1}
    response = requests.get(url, headers=headers, params=params)
    if response.status_code == 200:
        data = response.json()
        return data.get("total", 0)
    else:
        return 0

# --- 임시 엑셀 파일 생성 ---
def create_excel_file(df):
    with tempfile.NamedTemporaryFile(suffix=".xlsx", delete=False) as tmp:
        excel_path = tmp.name
    df.to_excel(excel_path, index=False)
    return excel_path

# --- 입력 키워드 처리 함수 ---
def process_keyword(keywords: str, include_related: bool):
    """
    1. 여러 키워드를 엔터로 구분하여 리스트로 만듭니다.
    2. 각 키워드에 대해 네이버 광고 API로 검색량 정보를 조회하고, 
       첫 번째 키워드에 대해 옵션(연관검색어 포함)이 True인 경우 연관검색어도 추가합니다.
    3. 최종 결과 DataFrame에 각 "정보키워드"마다 네이버 검색 API로 블로그 문서수를 조회하여 "블로그문서수" 컬럼을 추가합니다.
    """
    input_keywords = [k.strip() for k in keywords.splitlines() if k.strip()]
    result_dfs = []
    
    for idx, kw in enumerate(input_keywords):
        df_kw = fetch_related_keywords(kw)
        if df_kw.empty:
            continue
        # 입력 키워드에 해당하는 결과 포함
        row_kw = df_kw[df_kw["정보키워드"] == kw]
        if not row_kw.empty:
            result_dfs.append(row_kw)
        else:
            result_dfs.append(df_kw.head(1))
        # 첫 번째 키워드의 연관검색어 추가 (입력 키워드 제외)
        if include_related and idx == 0:
            df_related = df_kw[df_kw["정보키워드"] != kw]
            if not df_related.empty:
                result_dfs.append(df_related)
    
    if result_dfs:
        result_df = pd.concat(result_dfs, ignore_index=True)
        result_df.drop_duplicates(subset=["정보키워드"], inplace=True)
    else:
        result_df = pd.DataFrame(columns=["정보키워드", "PC월검색량", "모바일월검색량", "토탈월검색량"])
    
    # 각 정보키워드에 대해 블로그 문서수 조회
    result_df["블로그문서수"] = result_df["정보키워드"].apply(fetch_blog_count)
    result_df.sort_values(by="토탈월검색량", ascending=False, inplace=True)
    
    return result_df, create_excel_file(result_df)

# --- Gradio UI 구성 ---
with gr.Blocks(css=".gradio-container { max-width: 960px; margin: auto; }") as demo:
    gr.Markdown("# 네이버 연관검색어, 검색량 및 블로그 문서수 조회")
    gr.Markdown(
        "여러 키워드를 **엔터**로 구분하여 입력하세요. 각 키워드에 대한 검색량 정보를 조회하며, "
        "첫 번째 키워드에 대해 '연관검색어 포함' 옵션을 선택하면 연관검색어 결과도 함께 조회됩니다. \n\n"
        "또한, 각 정보키워드에 대한 네이버 블로그 문서수도 함께 출력됩니다."
    )
    
    with gr.Row():
        with gr.Column(scale=1):
            keyword_input = gr.Textbox(
                label="키워드 입력 (여러 개일 경우 엔터로 구분)", 
                lines=6, 
                placeholder="예:\n강원도풀빌라\n자바스크립트"
            )
            include_checkbox = gr.Checkbox(label="연관검색어 포함 (첫번째 키워드에 한함)", value=False)
            search_button = gr.Button("검색", variant="primary")
        with gr.Column(scale=1):
            gr.Markdown("### 검색 결과")
            df_output = gr.Dataframe(label="결과 테이블")
            excel_output = gr.File(label="엑셀 다운로드")
    
    search_button.click(
        fn=process_keyword, 
        inputs=[keyword_input, include_checkbox], 
        outputs=[df_output, excel_output]
    )

# 앱 실행 (Hugging Face Spaces 배포 가능)
demo.launch()