会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
wangshanglinju
博客园
首页
新随笔
联系
订阅
管理
2026年4月7日
数据分析之Pandas(一)
摘要: 1.简介 1.1 什么是Pandas Pandas是一个开源的数据分析工具,提供了数据结构和数据分析工具,使得在Python中进行数据操作变得更加简单和高效。Pandas主要提供了两种数据结构:Series和DataFrame。Series是一维带标签的数组,类似于Python中的字典;DataFr
阅读全文
posted @ 2026-04-07 09:33 wangshanglinju
阅读(7)
评论(0)
推荐(0)
2026年3月30日
数据分析之Numpy(二)
摘要: 7. numpy统计 NumPy 提供了很多统计函数,用于从数组中查找最小元素,最大元素,百分位标准差和方差等。 7.1 平均值和中位数 平均值 numpy.mean() 函数返回数组中元素的算术平均值。 如果提供了轴,则沿其计算。 算术平均值是沿轴的元素的总和除以元素的数量。 arr = np.a
阅读全文
posted @ 2026-03-30 11:06 wangshanglinju
阅读(11)
评论(0)
推荐(0)
2026年3月20日
数据分析之Numpy(一)
摘要: 1. Anaconda安装 Anaconda就是可以便捷获取包且对包能够进行管理,同时对环境可以统一管理的发行版本。Anaconda包含了conda、Python在内的超过180个科学包及其依赖项。 官网:https://www.anaconda.com/ 2. juypter Jupyter No
阅读全文
posted @ 2026-03-20 10:04 wangshanglinju
阅读(10)
评论(0)
推荐(0)
2021年4月15日
python网络爬虫边看边学(selenium模块三验证码)
摘要: selenium模块 超级鹰取验证码 1、登录超级鹰(http://www.chaojiying.com/),点击“用户登录”,输入用户名和密码登录。 2、点击左侧的“软件ID”栏目,点击“生成一个软件ID”,名称任意,软件ID请记住。 3、点击频道“开发文档”,选择“python”,点击“点击这里
阅读全文
posted @ 2021-04-15 18:52 wangshanglinju
阅读(123)
评论(0)
推荐(0)
2021年4月14日
python网络爬虫边看边学(selenium模块二无头浏览器)
摘要: selenium模块 一、无头浏览器 # 艺恩 https://www.endata.com.cn/BoxOffice/BO/Year/index.html 年度票房数据 # 带下拉列表 from selenium.webdriver import Chrome from selenium.webd
阅读全文
posted @ 2021-04-14 18:30 wangshanglinju
阅读(296)
评论(0)
推荐(0)
2021年4月12日
python网络爬虫边看边学(selenium模块一)
摘要: selenium模块 一、安装并设置 1、安装 pip install selenium 2、安装浏览器驱动 这里提供谷歌浏览器驱动下载,chrome驱动地址:https://npm.taobao.org/mirrors/chromedriver 找到适合本机浏览器的版本号下载。 下载的驱动可以放在
阅读全文
posted @ 2021-04-12 08:39 wangshanglinju
阅读(107)
评论(0)
推荐(0)
2021年4月6日
python爬虫边看边学(多线程多进程协程)
摘要: 进程是资源单位,线程是执行单位,每一个进程至少需要一个线程 一、多线程 1、单线程 def fun(): for i in range(1000): print("fun",i) if __name__ == '__main__': for i in range(1000): print("main
阅读全文
posted @ 2021-04-06 10:22 wangshanglinju
阅读(130)
评论(0)
推荐(0)
2021年4月2日
python爬虫边看边学(xpath模块解析)
摘要: xpath模块解析 Xpath是一门在 XML 文档中查找信息的语言。 Xpath可用来在 XML文档中对元素和属性进行遍历。而我们熟知的HTML恰巧属于XML的一个子集。所以完全可以用xpath去查找html中的内容。 一、安装lxml模块 pip install lxml 用法:1、将要解析的h
阅读全文
posted @ 2021-04-02 18:26 wangshanglinju
阅读(252)
评论(3)
推荐(1)
2021年3月31日
python爬虫边看边学(bs4安装与使用)
摘要: BeautifulSoup 模块 一、安装 pip install bs4 二、使用 bs4在使用的时候需要参考一些html基本语法来进行,我们尝试抓取北京新发地时长的农产品价格。地址:http://www.xinfadi.com.cn/marketanalysis/0/list/1.shtml 步
阅读全文
posted @ 2021-03-31 16:12 wangshanglinju
阅读(628)
评论(0)
推荐(0)
2021年3月28日
python爬虫边看边学(数据解析)
摘要: 数据解析 一、正则表达式 Regular Expression,正则表达式是一种使用表达式的方式对字符串进行匹配的语法规则。 我们抓取到的网页源代码本质上就是一个超长的字符串, 想从里面提取内容。用正则再合适不过了。 正则的优点: 速度快, 效率高, 准确性高 正则的缺点: 新手上手难度有点高。 不
阅读全文
posted @ 2021-03-28 16:54 wangshanglinju
阅读(134)
评论(0)
推荐(0)
下一页
公告