当前位置: 首页 > news >正文

百度网页搜索反作弊团队检测到您注册的网站 可能被黑客非法入侵整站优化推广

百度网页搜索反作弊团队检测到您注册的网站 可能被黑客非法入侵,整站优化推广,自己做的网站能上传到凡科吗,财佰通突然做网站维护反爬虫机制与反爬虫技术二 1、动态页面处理与验证码识别概述2、反爬虫案例:页面登录与滑块验证码处理2.1、用例简介2.2、库(模块)简介2.3、网页分析2.4、Selenium准备操作2.5、页面登录2.6、模糊移动滑块测试3、滑块验证码处理:精确移动滑块3.1、精确移动滑块的原理3.2、滑…

反爬虫机制与反爬虫技术二

    • 1、动态页面处理与验证码识别概述
    • 2、反爬虫案例:页面登录与滑块验证码处理
      • 2.1、用例简介
      • 2.2、库(模块)简介
      • 2.3、网页分析
      • 2.4、Selenium准备操作
      • 2.5、页面登录
      • 2.6、模糊移动滑块测试
    • 3、滑块验证码处理:精确移动滑块
      • 3.1、精确移动滑块的原理
      • 3.2、滑块验证码图像缺口位置识别
      • 3.3、精确移动滑块实现(完整代码)


1、动态页面处理与验证码识别概述


本文接上篇:反爬虫机制与反爬虫技术(一)

上篇中,我们详细介绍和使用了User-Agent伪装、代理IP、请求频率控制等反爬虫技术,本篇将重点针对动态页面处理验证码识别进行介绍和案件详解

近年来,网站安全性越来越高,许多网站为了避免机器人恶意攻击,采用了滑动验证码。与传统的验证码相比,滑动验证码安全性更高,更难被攻击者破解。但是,这也给爬虫程序带来了困难。Python Selenium是一款非常出色的自动化测试工具,可以用来模拟浏览器行为,可以用于爬虫

例如,一些网站为了防止爬虫,使用了JavaScript来动态生成页面内容,这对于爬虫来说是一个挑战。Python中的Selenium库可以模拟浏览器的行为,执行JavaScript代码,从而获取动态生成的内容

例如在进行数据采集时,很多网站需要进行登录才能获取到目标数据,这时可以使用Selenium库进行模拟登录进行处理

另外,一些网站为了防止爬虫,会在登录或提交表单时添加验证码。随着反爬的不断发展,逐渐出现了更多复杂的验证码,例如:内容验证码、滑动验证码、图片拼接验证码等

Python提供了一些强大的图像处理库,例如Pillow、OpenCV等,可以用来自动识别验证码,从而实现自动化爬取

2、反爬虫案例:页面登录与滑块验证码处理

2.1、用例简介


本案例将以豆瓣的登录页面为例

豆瓣登录:https://accounts.douban.com/passport/login

操作步骤:

1) 打开豆瓣登录页面

2) 点击页面上的密码登录

3) 输入账号密码之后,点击登录豆瓣按钮

4) 点击登录后会弹出滑块验证码,拼接验证

在这里插入图片描述

2.2、库(模块)简介


Selenium是一种自动化测试工具,可以用于控制浏览器执行自动化操作,比如滑动验证码识别。滑动验证码通常是用于网站的登陆、注册等操作,通过鼠标模拟人手在滑动拼图或滑动滑块,达到人机交互的效果。在自动化测试中,如果能够识别滑动验证码,就可以实现完全自动化,提高效率

Selenium详解见文章:传送门

利用OpenCV、PIL等Python的图像处理识别库,可以在页面加载完成后,对验证码图片进行特征提取,然后通过算法自动计算出正确的滑块滑动位置,并模拟用户滑动

OpenCV详解见文章:传送门

本案例需要使用到的库(模块)如下:

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver import ActionChains  # 动作类
from selenium.webdriver.support.wait import WebDriverWait  # 等待类
from selenium.webdriver.support import expected_conditions as EC  # 等待条件类
import time
import re
import numpy as np
import urllib.request as req
import cv2

2.3、网页分析


通过检查网页源代码,按照上述操作步骤进行操作,在HTML中找到用例需要使用到的一些元素

其中,点击登录按钮后,就会出现滑块验证区域,这是一个新增的iframe区域

在这里插入图片描述

2.4、Selenium准备操作


通过以下操作验证Selenium环境WebDriver是否正常:

# 打开自定义配置
options = webdriver.ChromeOptions()
# 设置浏览器不关闭(解决闪退/自动关闭)
options.add_experimental_option('detach', True)
# 禁用浏览器扩展
options.add_argument('--disable-extensions')
# 禁用浏览器弹窗
options.add_argument('--disable-popup-blocking')
# 设置浏览器UA
options.add_argument('--user-agent=Mozilla/5.0')# 声明浏览器对象
driver = webdriver.Chrome(options=options)# 最大化浏览器窗口
driver.maximize_window()# 打开豆瓣登录页
driver
http://www.ds6.com.cn/news/45334.html

相关文章:

  • 团购网站APP怎么做营销策划公司
  • 旅游网站建设怎么做宁波seo外包平台
  • 简约大方自助建站模板优化用户体验
  • 网站服务做推广seoul是啥意思
  • 收费的网站如何免费hyein seo是什么牌子
  • 社区微网站建设方案ppt模板台州优化排名推广
  • wordpress清除多余附件泰安seo排名
  • 门户网站和新闻网站的区别广告公司推广平台
  • 中国工程建设企业协会网站网站销售怎么推广
  • 网站备案 密码找回自己建网站
  • 项目计划书图片网站如何优化
  • 摄影工作室网站模板山东seo推广
  • wordpress微信高级登录衡阳有实力seo优化
  • 宁夏网站建设联系电话web设计一个简单网页
  • 网站上面的主导航条怎么做优化二十条
  • 文登住房和城乡建设局网站网站安全检测
  • 湘潭网站建设 找磐石网络一流怎么在网络上推广
  • 蔡甸做网站seo外链发布平台有哪些
  • proxy网站网站死链检测工具
  • 做网站开发的薪酬怎么样最大的中文搜索引擎
  • 深圳微信网站开发百度知道灰色词代发收录
  • wordpress自定义登录框插件seo优化的搜索排名影响因素主要有
  • 建设网站的整个费用预算怎样搭建一个网站
  • 阿里云服务器怎么用重庆做网络优化公司电话
  • 买网站服务器要多少钱一年百度怎么发自己的小广告
  • 如何建设赌博网站查排名的网站
  • 苏州网站建设学费沧州网站建设公司
  • 门户网站整改情况报告搜索引擎成功案例分析
  • 去哪个网站做农产品推广广州网络推广培训
  • 如何免费弄一个网站网站推广的途径有哪些