会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
mengrennwpu
好学求知,稳健中流
博客园
首页
新随笔
联系
管理
订阅
上一页
1
···
3
4
5
6
7
8
9
10
11
···
17
下一页
2018年12月26日
Bash编程(1) 基础
摘要: 1. 基本知识 (1) $HOME: 当前用户的家目录 (2) `pwd`或$PWD:当前目录 (3) 脚本命名避免使用test,通过type -a test,可以查看所有匹配test的命令 (4) 脚本中应包含作者、时间、命令描述等信息。脚本第一行必须以"#!"开头,告诉系统将使用哪个编译器执行该
阅读全文
posted @ 2018-12-26 10:52 mengrennwpu
阅读(354)
评论(0)
推荐(0)
2018年12月25日
DNS配置
摘要: 可以ping通ip地址,但无法ping通域名,主要是DNS的配置问题。经查阅,DNS配置文件/etc/resolv.conf每次重启后就会失效。本文旨在解决该问题。 1. Ubuntu ubuntu中的/etc/resolv.conf中可以看到如下注解: 即:该文件为动态配置文件,手工修改该文件时将
阅读全文
posted @ 2018-12-25 16:16 mengrennwpu
阅读(211)
评论(0)
推荐(0)
2018年12月6日
资料收集:学习 Linux/*BSD/Unix 的 30 个最佳在线文档
摘要: 文章转自:https://linux.cn/article-10311-1.html 手册页(man)是由系统管理员和 IT 技术开发人员写的,更多的是为了作为参考而不是教你如何使用。手册页对于已经熟悉使用 Linux、Unix 和 BSD 操作系统的人来说是非常有用的。如果你仅仅需要知道某个命令或
阅读全文
posted @ 2018-12-06 11:56 mengrennwpu
阅读(414)
评论(0)
推荐(0)
数据挖掘:提取百度知道QA中的影视信息
摘要: 1. 背景 网站上爬取了部分关于影视的百度知道QA,为了后续提高影视的搜索效果,需要基于百度知道QA的答案抽取相关的影视信息。 2. 流程 目前已有基础的媒资视频库信息,基于媒资视频库中的视频名称,构建分词字典,结合使用AC双数组,然后针对百度的QA进行分词。针对分词后的结果,可以结合视频热度与评分
阅读全文
posted @ 2018-12-06 11:49 mengrennwpu
阅读(384)
评论(0)
推荐(0)
Nginx+Keepalived配置
摘要: 1. Nginx安装 (1) 环境:分别在2台服务器上部署nginx且步骤一致: 如192.138.86.1和192.138.86.2 (2) 下载官网最新稳定版,地址:https://nginx.org/en/download.html,本教程使用的是1.14.2版 (3) 安装Nginx的依赖包
阅读全文
posted @ 2018-12-06 08:54 mengrennwpu
阅读(1176)
评论(0)
推荐(0)
2018年11月4日
Linux抓包工具:tcpdump
摘要: tcpdump 是一个命令行实用工具,允许你抓取和分析经过系统的流量数据包。它通常被用作于网络故障分析工具以及安全工具。 tcpdump 是一款强大的工具,支持多种选项和过滤规则,适用场景十分广泛。由于它是命令行工具,因此适用于在远程服务器或者没有图形界面的设备中收集数据包以便于事后分析。它可以在后台启动,也可以用 cron 等定时工具创建定时任务启用它。 本文中,我们将讨论 tcpdump 最常...
阅读全文
posted @ 2018-11-04 23:11 mengrennwpu
阅读(481)
评论(0)
推荐(0)
2018年11月3日
Kubernetes系列:(1) 初探
摘要: 1. 背景 在部门内容组织了一次K8s的培训,普及了下K8s的概念、框架、操作等,为便于后期查阅,也为了进一步深究K8s,因此开展K8s系列,周期不定… 2. 概念 (1) 含义:来自希腊语,意为”舵手”,又称K8s (2) 历史:2014年由Google创建,是十多年大规模容器管理技术Borg的开源版 (3) 功能:为容器化应用提供资源调度,即容器编排 严格意义:容器是将代码以及所有的依赖打包,...
阅读全文
posted @ 2018-11-03 22:58 mengrennwpu
阅读(530)
评论(0)
推荐(0)
数据挖掘:基于Spark+HanLP实现影视评论关键词抽取(1)
摘要: 1. 背景 近日项目要求基于爬取的影视评论信息,抽取影视的关键字信息。考虑到影视评论数据量较大,因此采用Spark处理框架。关键词提取的处理主要包含分词+算法抽取两部分。目前分词工具包较为主流的,包括哈工大的LTP以及HanLP,而关键词的抽取算法较多,包括TF-IDF、TextRank、互信息等。
阅读全文
posted @ 2018-11-03 21:53 mengrennwpu
阅读(2493)
评论(1)
推荐(0)
2018年9月29日
uwsgi服务启动、关闭、重启操作
摘要: 1. 添加uwsgi相关文件 在之前的文章跟讲到过centos中搭建nginx+uwsgi+flask运行环境,本节就基于那一次的配置进行说明。 在www中创建uwsgi文件夹,用来存放uwsgi相关文件 在uwsgi文件夹中创建uwsgi.pid和uwsgi.status文件,uwsgi.pid文
阅读全文
posted @ 2018-09-29 23:19 mengrennwpu
阅读(8584)
评论(0)
推荐(0)
2018年9月25日
工作采坑札记:4. Hadoop获取InputSplit文件信息
摘要: 1. 场景 基于客户的数据处理需求,客户分发诸多小数据文件,文件每行代表一条记录信息,且每个文件以"类型_yyyyMMdd_批次号"命名。由于同一条记录可能存在于多个文件中,且处于多个文件中的相同记录最终只有时间最新的记录有效,但文件的每行记录并未提供时间信息,因此需要从每个文件名中提取时间信息作为
阅读全文
posted @ 2018-09-25 22:49 mengrennwpu
阅读(2119)
评论(0)
推荐(0)
上一页
1
···
3
4
5
6
7
8
9
10
11
···
17
下一页
公告