摘要: 很多情况下,页面的某些信息需要登录才可以查看。 这里的核心是获取登陆之后的 Cookies 。话不多说,操练起来。 1. 模拟登录并爬取GitHub 1.1 环境准备 requests库 lxml库 1.2 分析登录过程 打开Github的登录页面,https://github.com/login. 阅读全文
posted @ 2019-10-20 17:09 百里屠苏top 阅读(1252) 评论(0) 推荐(0)
摘要: 安装Redis 数据库并启动服务 Windows下安装: 下载地址:https://github.com/MSOpenTech/redis/releases 下载之后解压目录如下: 修改redis.windows.conf文件,设置maxmemory 大小 : 设置redis密码 : 启动redis 阅读全文
posted @ 2019-10-16 16:54 百里屠苏top 阅读(117) 评论(0) 推荐(0)
摘要: 目前,许多网站采取各种各样的措施来反爬虫,其中一个措施就是使用验证码。 验证码的花样也越来越多,几个数字组合的简单的图形验证码,英文字母和混淆曲线相结合的方式。大概包括: 普通图形验证码 极验滑动验证码 点触验证码 微博宫格验证码 接下里我们来具体了解一下。 1 图形验证码 图形验证码是最早出现也是 阅读全文
posted @ 2019-10-14 20:52 百里屠苏top 阅读(516) 评论(0) 推荐(1)
摘要: 上一节,学习了Ajax,Ajax 其实也是JS 动态渲染的页面的一种形式,通过直接分析Ajax,仍然可以借助requests 或者 urllib 来实现数据爬取。 但是JS动态渲染的页面不止Ajax 一种;还有就是像淘宝这种页面,即使是Ajax 获取的数据,但是其Ajax 接口含有很多加密参数,我们 阅读全文
posted @ 2019-10-13 16:37 百里屠苏top 阅读(476) 评论(0) 推荐(0)
摘要: 我们在用requests抓取页面的时候,得到的结果可能和在浏览器中看到的不一样,是因为requests抓取的都是原始的HTML文档,而浏览器中的页面则是经过JavaScript处理数据后生成的结果,这些数据都来源有多种可能是通过Ajax加载的,可能是包含在HTML文档中的,也可能是经过JavaScr 阅读全文
posted @ 2019-10-12 19:55 百里屠苏top 阅读(2917) 评论(0) 推荐(0)
摘要: 1、雷达图 import matplotlib.pyplot as plt import numpy as np values = [0.09,-0.05,0.20,-0.02,0.08,0.09,0.03,0.027] x = np.linspace(0,2*np.pi,9)[:-1] c = n 阅读全文
posted @ 2019-08-23 14:22 百里屠苏top 阅读(2310) 评论(0) 推荐(0)
摘要: 学习笔记,来源:笨方法学python 1、windows下的cmd与powershell 简单的说,Powershell是cmd的超集,换句话说,cmd能做的事情,Powershell都能做,但是Powershell还能额外做许多cmd不能做的活 cmd是和powershell都可以做命令行交互,批 阅读全文
posted @ 2019-08-22 16:07 百里屠苏top 阅读(282) 评论(0) 推荐(0)
摘要: 申明:本人博客为自己学习记录,本文学习内容主要来源以下两篇博客。 https://www.jianshu.com/p/78ba36dddad8 https://blog.csdn.net/lm_is_dc/article/details/81191207 https://www.jianshu.co 阅读全文
posted @ 2019-08-11 20:50 百里屠苏top 阅读(875) 评论(0) 推荐(0)
摘要: 申明:文章来源菜鸟教程,本文纯为个人学习记录。 本节内容: Numpy 字节交换: Numpy副本与视图 Numpy矩阵库(Matrix) Numpy线性代数 Numpy IO Numpy Matplotlib 1、字节交换 在几乎所有的机器上,多字节对象都被存储为连续的字节序列。字节顺序,是跨越多 阅读全文
posted @ 2019-08-06 22:18 百里屠苏top 阅读(265) 评论(0) 推荐(1)
摘要: 申明:博客纯属个人学习记录,不做任何其他用途,学习内容来源于:https://www.runoob.com/?s=numpy。 本节内容: numpy 数学函数 numpy算数函数 numpy统计函数 numpy排序、条件筛选函数 1、Numpy数学函数 三角函数 舍入函数 1.1 三角函数、反三角 阅读全文
posted @ 2019-08-06 19:11 百里屠苏top 阅读(277) 评论(0) 推荐(0)