最近碰到一个问题,需求是把做好的报告发到领导邮箱(只能发邮箱,不接受邮箱链接等方式),大家都知道outlook对js是不支持的,只支持最简单的html样式,最后选定的方法是截图,但是报告可能很长啊,怎么能一次性全截下来呢,请大家往下看!
首先本次实现是用的python3.6+selenium+chrome,python的安装和python库的安装就不多说了。用代码控制chrome的时候需要下一个driver,下载地址:http://chromedriver.storage.googleapis.com/index.html
下载之前要注意看看你电脑上装的chrome版本号,把下好的driver放到跟chrome.exe一个文件夹就行了。
接下来直接上代码:
# -*- coding: utf-8 -*- from selenium import webdriver from selenium.webdriver.chrome.options import Options import os import time def get_image(url, pic_name): #chromedriver的路径 chromedriver = r"C:\Users\name\AppData\Local\Google\Chrome\Application\chromedriver.exe" os.environ["webdriver.chrome.driver"] = chromedriver #设置chrome开启的模式,headless就是无界面模式 #一定要使用这个模式,不然截不了全页面,只能截到你电脑的高度 chrome_options = Options() chrome_options.add_argument('headless') driver = webdriver.Chrome(chromedriver,chrome_options=chrome_options) #控制浏览器写入并转到链接 driver.get(url) time.sleep(1) #接下来是全屏的关键,用js获取页面的宽高,如果有其他需要用js的部分也可以用这个方法 width = driver.execute_script("return document.documentElement.scrollWidth") height = driver.execute_script("return document.documentElement.scrollHeight") print(width,height) #将浏览器的宽高设置成刚刚获取的宽高 driver.set_window_size(width, height) time.sleep(1) #截图并关掉浏览器 driver.save_screenshot(pic_name) driver.close() #你输入的参数 url = 'https://movie.douban.com/top250' pic_name = r'D:\image.png' get_image(url, pic_name)
很简单的几行代码,随意截任何网站的图片,通过这个方式也可以截网页任意部位的图,怎么样你学会了吗?
作者:hanfe1