clipDownload, title 추출 불가

c8f02dfe · 정용석 · 7db73fe0 · c8f02dfe
Commit c8f02dfe authored Jan 15, 2025 by 정용석
Hide whitespace changes
Inline Side-by-side

Showing with 47 additions and 9 deletions

clipDownload.py
+47 -9

No files found.
--- a/clipDownload.py
+++ b/clipDownload.py
@@ -12,15 +12,53 @@ service = Service(ChromeDriverManager().install())  # webdriver-manager로 자
 driver = webdriver.Chrome(service=service)

 driver.get("https://chzzk.naver.com/clips/KWydos957E")
-driver.implicitly_wait(300)
+time.sleep(3)
+
+# iframe으로 전환
+iframe = WebDriverWait(driver, 20).until(
+    EC.presence_of_element_located((By.TAG_NAME, "iframe"))
+)
+driver.switch_to.frame(iframe)

 # video 태그 확인
-url_element = driver.find_element(By.TAG_NAME, 'video')
-vid_url = url_element.get_attribute('src')
-print(vid_url)
-print("출력")
-# 잠시 대기
-time.sleep(30)
+# 비디오 태그를 명시적으로 기다림
+try:
+    url_element = WebDriverWait(driver, 20).until(
+        EC.presence_of_element_located((By.TAG_NAME, 'video'))
+    )
+    print(url_element)
+    # 비디오 URL 가져오기
+    vid_url = url_element.get_attribute('src')
+
+except Exception as e:
+    print("Error:", e)
+finally:
+    print("비디오 URL:", vid_url)
+    # 잠시 대기

-# 브라우저 종료
-#driver.quit()
+# 제목 추출 -> 보완필요
+# try:
+#     # "si_desc" 클래스가 있는 <p> 태그 찾기
+#     p_element = WebDriverWait(driver, 10).until(
+#         EC.presence_of_element_located((By.CLASS_NAME, "si_desc"))
+#     )
+    
+#     # 텍스트에서 <a> 태그를 제외하고 텍스트만 추출
+#     text = p_element.text.strip()
+    
+#     # 출력
+#     print(p_element)
+#     print(p_element.text)
+#     print("추출된 텍스트:", text)
+    
+# except Exception as e:
+#     print("Error:", e)
+# finally:
+#     driver.quit()
+
+# url로 영상 다운로드
+from urllib.request import urlretrieve
+urlretrieve(vid_url, 'a.mp4')
+
+time.sleep(30)
+driver.quit()