Spaces:

ckfrpark
/

Elec_1

Runtime error

ckfrpark commited on Apr 13, 2024

Commit

2854fa8

verified ·

1 Parent(s): f9458f6

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -1,21 +1,26 @@
-import gradio as gr
 import requests
 from bs4 import BeautifulSoup
-def scrape_website(url):
-    # 웹 페이지의 내용을 가져옵니다.
-    response = requests.get(url)
-    # BeautifulSoup 객체를 생성하여 HTML을 파싱합니다.
-    soup = BeautifulSoup(response.text, 'html.parser')
-    # 웹 페이지의 타이틀을 추출합니다.
-    title = soup.find('title').text
-    return title
-with gr.Blocks() as demo:
-    gr.Markdown("### 웹 스크래핑 프로그램")
-    url_input = gr.Textbox(label="URL을 입력하세요")
-    output = gr.Textbox(label="웹 페이지 타이틀")
-    gr.Button("스크랩").click(scrape_website, inputs=url_input, outputs=output)
-if __name__ == "__main__":
-    demo.launch()

+# 필요한 라이브러리를 임포트합니다.
 import requests
 from bs4 import BeautifulSoup
+import pandas as pd
+# 웹 페이지의 URL을 지정합니다.
+url = '여기에_추출하고자_하는_웹페이지의_URL을_입력하세요'
+# requests를 사용하여 웹 페이지의 내용을 가져옵니다.
+response = requests.get(url)
+# BeautifulSoup 객체를 생성하여 HTML을 파싱합니다.
+soup = BeautifulSoup(response.text, 'html.parser')
+# 웹 페이지의 특정 부분을 선택하여 데이터를 추출합니다.
+# 예시: 페이지의 모든 'p' 태그에 있는 텍스트를 추출합니다.
+# 실제 사용 사례에 맞게 선택자를 조정해야 합니다.
+texts = [p.text for p in soup.find_all('p')]
+# 추출한 데이터를 출력합니다.
+for text in texts:
+    print(text)
+# 선택적: 추출한 데이터를 DataFrame으로 변환하고 엑셀 파일로 저장합니다.
+df = pd.DataFrame(texts, columns=['Text'])
+df.to_excel('extracted_data.xlsx', index=False)