摘要: 一、具体需求 1. 核心目标 面向企业合规、科研检测、标准管理、工程设计等场景,合规批量采集官方权威国家标准(GB/GB/T/GB/Z)全量元数据,支持多维度检索、精准筛选、完整字段导出,覆盖标准生命周期全状态,解决手动查标准慢、漏、错、散的痛点,实现标准信息 “一键查、批量采、规范存、快速用”。 阅读全文
posted @ 2026-03-28 09:41 逸乐太子 阅读(17) 评论(0) 推荐(0)
摘要: 1. 核心目标 面向科研人员、学生与文献管理者,提供合规、批量、全自动的知网文献元数据采集,输出可直接导入 LaTeX/BibTeX、EndNote 的标准格式文件,补齐知网原生导出缺失的摘要、关键词、引用次数、全文永久链接,提升文献管理与写作效率。 2. 功能需求 检索与筛选 支持关键词、作者、单 阅读全文
posted @ 2026-03-28 09:26 逸乐太子 阅读(5) 评论(0) 推荐(0)
摘要: 超级课堂网站是中小学大片式学习平台,将网页上的题目转为本地直接打开的网页。其中数学公式使用MathJax.js转换。 导出的效果如下图所示: 工具界面如下: 阅读全文
posted @ 2025-08-21 08:40 逸乐太子 阅读(9) 评论(0) 推荐(0)
摘要: 为了方便学生刷题与查看答案,将在线的题库导出至本地,方便快速浏览。 导出至本地的效果如下: 浏览器上的效果: 阅读全文
posted @ 2025-07-31 08:16 逸乐太子 阅读(115) 评论(0) 推荐(0)
摘要: 目标网址:https://pubscholar.cn/resource/journals 收集下面期刊的名字。 打开开发者工具,切换网页页码发现接口地址如下: 另外接口请求头中有加密签名: 经分析发现加密位置如下: 如有需要可扫描下方二维码联系我。 阅读全文
posted @ 2025-06-13 19:52 逸乐太子 阅读(25) 评论(0) 推荐(0)
摘要: 目标网址:https://gaokao.chsi.com.cn/sch/search--ss-on,option-qg,searchType-1,start-0.dhtml 需求是采集如下图所示的学校名称、省份、主管部门、类型等信息。 此页面使用了rs加密反爬,可以使用自动化进行数据采集。 如有需要 阅读全文
posted @ 2025-06-06 18:12 逸乐太子 阅读(103) 评论(0) 推荐(0)
摘要: 需求:由于特殊原因,某Python程序在运行中可能会中途崩溃需要重新运行。 工具:ProcessProtector.1.0.0.3.exe 将python程序使用pyinstaller打包成一个exe可执行文件,然后运行之后,使用上述工具进行守护即可。 阅读全文
posted @ 2024-10-08 21:12 逸乐太子 阅读(202) 评论(0) 推荐(0)
摘要: 【Python数据采集】国家自然科学基金大数据知识管理服务门户数据采集 具体需求:从https://kd.nsfc.cn/网站中根据关键词搜索项目信息,收集列表中展示的信息以及详情页面中的参与人员信息等。 在开始干活之前,我们首先要做的是弄清楚需求,然后分析目标网址,确定目标数据所在接口及请求参数等 阅读全文
posted @ 2024-10-07 19:35 逸乐太子 阅读(345) 评论(0) 推荐(0)
摘要: 打包命令 pyinstaller --onefile --windowed **.py 修改**.spec 文件 pathex=['/Library/Frameworks/Python.framework/Versions/3.7/lib/python3.7/site-packages/ddddoc 阅读全文
posted @ 2023-04-20 22:32 逸乐太子 阅读(267) 评论(0) 推荐(0)
摘要: 需求:爬取豆瓣电影短评评论文本内容 目标:将爬取的文本存入 excel 中 爬虫步骤: 1.拼接分页网址,循环请求分页数据,获取HTML代码 2.分析获取到的HTML代码,解析出所需要的数据,提取内容 3.存储爬取到的数据 准备工作: 1.开发工具 pycharm 2.模块 requests、bs4 阅读全文
posted @ 2023-03-17 22:10 逸乐太子 阅读(966) 评论(0) 推荐(0)