2016年1月11日
摘要: 1、document的全量替换 (1)语法与创建文档是一样的,如果document id不存在,那么就是创建;如果document id已经存在,那么就是全量替换操作,替换document的json串内容 (2)document是不可变的,如果要修改document的内容,第一种方式就是全量替换,直 阅读全文
posted @ 2016-01-11 19:11 duanxz 阅读(1338) 评论(0) 推荐(0)
摘要: IK Analyzer是一款结合了词典和文法分析算法的中文分词组件,基于字符串匹配,支持用户词典扩展定义,支持细粒度和智能切分,比如: 智能分词的结果是: 最细粒度分词结果: 整合IK Analyzer比mmseg4j要简单很多,下载解压缩IKAnalyzer2012FF_u1.jar放到目录:E: 阅读全文
posted @ 2016-01-11 19:09 duanxz 阅读(602) 评论(0) 推荐(0)
摘要: 默认Solr提供的分词组件对中文的支持是不友好的,比如:“VIM比作是编辑器之神”这个句子在索引的的时候,选择FieldType为”text_general”作为分词依据时,分词效果是: 它把每一个词都分开了,可以想象如果一篇文章这样分词的搜索的体验效果非常差。能够和Solr集成的中文分词组件有很多 阅读全文
posted @ 2016-01-11 19:05 duanxz 阅读(468) 评论(0) 推荐(1)
摘要: Document Document是Solr索引(动词,indexing)和搜索的最基本单元,它类似于关系数据库表中的一条记录,可以包含一个或多个字段(Field),每个字段包含一个name和文本值。字段在被索引的同时可以存储在索引中,搜索时就能返回该字段的值,通常文档都应该包含一个能唯一表示该文档 阅读全文
posted @ 2016-01-11 19:04 duanxz 阅读(692) 评论(0) 推荐(0)
摘要: 索引 Solr/Lucene采用的是一种反向索引,所谓反向索引:就是从关键字到文档的映射过程,保存这种映射这种信息的索引称为反向索引 左边保存的是字符串序列 右边是字符串的文档(Document)编号链表,称为倒排表(Posting List) 字段串列表和文档编号链表两者构成了一个字典。现在想搜索 阅读全文
posted @ 2016-01-11 19:03 duanxz 阅读(529) 评论(0) 推荐(1)
摘要: 准备安装目标:1.Elasticsearch6.42.head插件3.ik分词插件 第一步:安装Elasticsearch6.4 下载方式:1.官网下载 https://www.elastic.co/downloads/elasticsearch2.百度网盘下载:https://pan.baidu. 阅读全文
posted @ 2016-01-11 19:00 duanxz 阅读(1604) 评论(0) 推荐(0)
摘要: 昨天搭建了一台FTPS服务器,过程中学习了很多不清楚的知识点,还有遇到的问题,记录一下。(大部分内容汇集、整理自网络)一. 关于FTP传输模式 众所周知,FTP传输有两种工作模式,Active Mode和Passive Mode(主动模式和被动模式),简单描述连接过程如下: 主动模式的连接过程... 阅读全文
posted @ 2016-01-11 14:32 duanxz 阅读(4385) 评论(0) 推荐(0)
摘要: 一、NGINX 1.9之前,需要安装第三方的TCP插件: http://chuna2.787528.xyz/i-blog/p/6165378.html 二、1.9之后直接使用Stream配置就可以了,当然需要先安装stream模块: 1.nginx 增加tcp./configure --with-str 阅读全文
posted @ 2016-01-11 13:55 duanxz 阅读(5611) 评论(0) 推荐(0)
摘要: nginx 的第三方模块ngx_http_accesskey_module 来实现下载文件的防盗链步骤(linux系统下),安装Nginx和HttpAccessKeyModule模块(参考LNMP环境搭建:第一步:在/usr/local/src/下下载模块压缩包: wget http://wiki. 阅读全文
posted @ 2016-01-11 13:54 duanxz 阅读(2475) 评论(0) 推荐(0)
摘要: 对于功能,我们可能知道必须改进什么;但对于性能问题,有时我们可能无从下手。其实,任何计算机应用系统最终队可以归结为: cpu消耗 内存使用 对磁盘,网络或其他I/O设备的输入/输出(I/O)操作。 但我们遇到性能问题时,要判断的第一点就是“在这三种资源中,是否有哪一种资源达到了有问题的程度”,因为这 阅读全文
posted @ 2016-01-11 13:53 duanxz 阅读(1021) 评论(0) 推荐(0)
摘要: TCP协议主为了在主机间实现高可靠性的包交换传输协议。本文将描述协议标准和实现的一些方法。因为计算机网络在现代社会中已经是不可缺少的了,TCP协议主要在网络不可靠的时候完成通信,对军方可能特别有用,但是对于政府和商用部门也适用。TCP是面向连接的端到端的可靠协议。它支持多种网络应用程序。TCP对下层 阅读全文
posted @ 2016-01-11 13:37 duanxz 阅读(6893) 评论(0) 推荐(1)
摘要: ARPA Internet上的主机被要求采用并实现此标准。 介绍TELNET Protocol的目的是提供一个相对通用的,双向的,面向八位字节的通信方法。它主要的目标是允许接口终端设备的标准方法和面向终端的相互作用。可以预见到,此协议也可被用于终端到终端的通信和处理到处理的通信(分布式计算)。 ... 阅读全文
posted @ 2016-01-11 13:37 duanxz 阅读(2398) 评论(0) 推荐(0)
摘要: 1.介绍FTP的目标是提高文件的共享性,提供非直接使用远程计算机,使存储介质对用户透明和可靠高效地传送数据。虽然我们也可以手工使用它,但是它的主要作用是供程序使用的。在阅读本文之前最好能够阅读TCP协议标准规范和Telnet协议标准规范。2.概览在本节中我们将讨论一些表面上的问题,有些名词的定义请参... 阅读全文
posted @ 2016-01-11 13:35 duanxz 阅读(42048) 评论(0) 推荐(2)