百度拖动旋转验证码识别 – 作者:香芋味的猫丶-安全小百科

*严正声明：本文仅限于技术讨论与分享，严禁用于非法途径。

前言

百度的验证码又双叒更新了。
当然出于好奇，猫又拿起了键盘开搞。

正文来了。

先来看看继上次破解百度旋转验证码后，百度的大佬又做出了哪些改变。

1.抓取图片时加上了马赛克
2.增加了图片库

抓取图片时加上了马赛克

截图是这个亚子的

后台拿到的却是这个亚子的

哦呦，这个马赛克有点东西的呀~图片抓下来都不一样还咋识别，百度这里也是煞费苦心，给您点个赞。

不过话说回来，就算这样也难不住我们的呀，这里我思考了一下还有几种方式来获取这个图片：

1 .通过系统级鼠标来获取

2 .通过网页截图来获取

1.通过系统级鼠标来获取

首先，试了下第一种方式

定位到图片路径位置拿到图片途径，然后再通过模拟器打来另一个页面

然后通过下面这段代码实现保存图片的操作（这里用到了Robot系统级鼠标控制类）

public byte[] sivePic(String url, WebDriver driver, String window_one) {
		((JavascriptExecutor) driver).executeScript("window.open('" + url + "')"); // 用js打开新的窗口
		sleep(2000);
		Set<String> allWindow = driver.getWindowHandles(); // 获取所有的窗口句柄
		sleep(1 * 500);
		for (String i : allWindow) {
			if (i != window_one) {
				driver.switchTo().window(i);
			}
		}
		WebElement img = driver.findElement(By.tagName("img"));
		Actions actions = new Actions(driver);
		Robot robot;
		byte[] picBytes = null;
		File imgFile = null;
		// 声明一个StingSelection 对象，并使用String的参数完成实例化；
		String imgName = "baidu_" + System.currentTimeMillis()+".jpg";
		// 使用Toolkit对象的setContents将字符串放到粘贴板中 ；
		Toolkit.getDefaultToolkit().getSystemClipboard().setContents( new StringSelection(imgName), null);
		try {
			robot = new Robot();
			robot.setAutoDelay(100);
			actions.moveToElement(img).contextClick().perform();
			sleep(100);
			robot.keyPress(KeyEvent.VK_DOWN);
			sleep(100);
			robot.keyRelease(KeyEvent.VK_DOWN);
			sleep(100);
			robot.keyPress(KeyEvent.VK_DOWN);
			sleep(100);
			robot.keyRelease(KeyEvent.VK_DOWN);
			sleep(100);
			// 确认
			robot.keyPress(KeyEvent.VK_ENTER);
			robot.keyRelease(KeyEvent.VK_ENTER);
			sleep(1000);
			// 删除
			robot.keyPress(KeyEvent.VK_DELETE);
			robot.keyRelease(KeyEvent.VK_DELETE);
			sleep(500);
			// 按下crtl v键 ；
			robot.keyPress(KeyEvent.VK_CONTROL);
			robot.keyPress(KeyEvent.VK_V);
			sleep(500);
			// 释放crtl v 键
			robot.keyRelease(KeyEvent.VK_V);
			robot.keyRelease(KeyEvent.VK_CONTROL);
			sleep(500);
			// 文件名字后确认
			robot.keyPress(KeyEvent.VK_ENTER);
			robot.keyRelease(KeyEvent.VK_ENTER);
			sleep(5000);
			String name = System.getenv().get("USERNAME");
			imgFile = new File("C:/Users/" + name + "/Downloads/"+imgName);
			picBytes = FileUtils.readFileToByteArray(imgFile);
			System.out.println("save ok");
		} catch (Exception e) {
			e.printStackTrace();
		} finally {
			imgFile.delete();
		}
		return picBytes;
	}

啊哈，拿到了。

本以为就这样结束了。

万万没想到，抓了几张之后马赛克又出现了。。。。。。。

到此，第一种方法宣告西败。

2.通过网页截图来获取

这个方法就比较靠谱了，百度总不能让用户看到马赛克的图片吧，哈哈（手动狗头）

// 获取ID的随机数
WebElement vcodesElemet = driver.findElement(By.className("mod-vcodes"));
String num = vcodesElemet.getAttribute("id");
num = num.split("mod-vcodes")[num.split("mod-vcodes").length - 1];
WebElement imgElemet = driver.findElement(By.id("vcode-spin-img" + num));
File img = getImgFile(driver, imgElemet.getLocation().getX() - 8,imgElemet.getLocation().getY());

/**
* 截图（验证码） 这里的 152 是页面显示图片的实际宽高
 */
private File getImgFile(WebDriver driver, int i, int j) {
	BufferedImage imgbuf = null;
	File srcFile, imgFile = null;
	try {
		srcFile = ((TakesScreenshot) driver).getScreenshotAs(OutputType.FILE);
		imgbuf = ImageIO.read(srcFile).getSubimage(i, j, 152, 152);
		imgFile = new File("C:\\daidu_" + System.currentTimeMillis() + ".png");
		ImageIO.write(imgbuf, "png", imgFile);
	} catch (IOException e) {
		e.printStackTrace();
	}
	return imgFile;
}

那么到这里我们就拿到了验证图，截来的图片肯定没有原图清晰度高，所以识别率就会稍微降低一些。不过影响不是太大。

到这里抓取图片的问题就解决了。