selenium 은 자동으로 컴퓨터가 웹 페이지에 들어가서 지정된 행동을 하는 라이브러리입니다.
해당 라이브러리를 설치하여 , api 를 사용하여 크롤링 하는 홈페이지에서 크롤링을 할 수 있습니다.
윈도우에 selenium 을 설치하는 방법은 아래 링크를 참조하세요. ( 파이선은 설치 되었다는 전제 )
http://melonicedlatte.com/2017/06/29/115042.html
1 2 3 4 5 | from IPython.display import Image from selenium import webdriver # 1. Java, 2. Python from selenium.webdriver.common.keys import Keys driver = webdriver.Chrome('C:\ProgramData\Microsoft\Windows\Start Menu\Programs/chrome') | cs |
위와 같이 chrome 의 경로를 입력해도 동작하지 않고 에러가 발생합니다.
괄호 안에 아무 것도 없어도 에러가 발생합니다.
단순히 그냥 chrome 을 사용하는 것은 아닌 것 같습니다.
에러 메세지 중에 다음과 같은 링크 경로를 참조하라는 말이 있어서 들어가보았습니다.
해당 링크에서 ChromeDriver 을 설치하라는 말이 있어서 설치하기를 누르고 설치를 진행하였습니다.
https://chromedriver.storage.googleapis.com/index.html?path=2.30/
링크는 위와 같습니다.
저는 Win32 를 다운 받았습니다.
해당 압축 파일의 압축을 풀어주고 실행 파일을 실행해 줍니다.
위와 같이 나오게 됩니다.
1 2 3 4 5 6 7 | from IPython.display import Image from selenium import webdriver # 1. Java, 2. Python from selenium.webdriver.common.keys import Keys driver = webdriver.Chrome('C:\\Users\\04banjang_03\\Documents\\chromedriver_win32\\chromedriver') driver.get("https://www.facebook.com") Image(driver.get_screenshot_as_png()) | cs |
위의 소스코드를 입력하고 확인해보면 ??
unicode 문제 때문에 \를 한 번에 두개씩 입력했습니다.
위와 같이 잘 작동하게 됩니다.
PREVIOUS윈도우에서 pip 쓰는 명령어