使用pyppeteer进行页面抓取 发表于 2018-08-17 | 分类于 其他 | | 阅读次数: | 字数统计: 229 字 | 阅读时长 ≈ 1 分钟 这个模块很不错,暂时记录下使用代码,有时间详细记录。 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859import asyncioimport timeimport sslfrom pyppeteer import launchssl._create_default_https_context = ssl._create_unverified_contextasync def main(): browser = await launch(headless=True) page = await browser.newPage() await page.goto('http://127.0.0.1:8000/') await page.click('#login_user') await page.type('#login_user', 'admin') await page.click('#password') await page.type('#password', '123456') await page.click('#login-submit') await page.waitForNavigation() await page.setViewport({ 'width': 1350, 'height': 850 }) await page.screenshot({'path': 'dashboard.png'}) await page.goto('http://127.0.0.1:8000/sql_healthy') time.sleep(3) await page.screenshot({'path': 'healthy.png'}) await page.setViewport({ 'width': 1350, 'height': 1100 }) await page.goto('http://127.0.0.1:8000/online_audit/overview') time.sleep(3) await page.screenshot({'path': 'online_audit.png'}) dimensions = await page.evaluate('''() => { return { width: 1600, height: 1200, deviceScaleFactor: window.devicePixelRatio, } }''') print(dimensions) # >>> {'width': 00, 'height': 600, 'deviceScaleFactor': 1} await browser.close()asyncio.get_event_loop().run_until_complete(main()) 知识就是财富 如果您觉得文章对您有帮助, 欢迎请我喝杯水! 打赏 微信支付