Selenium是一个用于测试网站的自动化测试工具,支持各种浏览器包括Chrome、Firefox、Safari等主流界面浏览器,同时也支持phantomJS无界面浏览器。
最近公司忙,没有时间更新博客了,今天终于有点时间,把之前做的selenium模拟豆瓣登录整理出来。网上的模拟豆瓣登录,我看了下,都是豆瓣5.0版本的爬取。而现在豆瓣的版本是6.0,5.0的爬虫不适合于这个。
咱们先看下目前的豆瓣的代码结构

可以发现这个是里面嵌套了一个iframe。
根据这个,下面是具体的代码:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
| from selenium import webdriver import time
username = XXX password = XXX
driver = webdriver.Chrome() driver.get('https://www.douban.com/') iframe = driver.find_element_by_tag_name("iframe") driver.switch_to.frame(iframe) driver.find_element_by_class_name('account-tab-account').click() driver.find_element_by_id('username').send_keys(username) driver.find_element_by_id('password').send_keys(password) driver.find_element_by_class_name('btn-account').click() time.sleep(5) driver.quit()
|
原文链接: http://yoursite.com/2019/05/14/python爬虫系列-使用selenium模拟豆瓣登录/
版权声明: 转载请注明出处.