搜索引擎的体系结构
admin 13年前 (2012-02-03) 2603浏览 0评论
搜索引擎按照功能可以分为如下几部分: 1. 巡视软件(robot/spider/crawler) 作用:自动从网上抓取信息。 2. 页面存储器 作用:将抓取回来的信息存储起来,也就是数据库。 3. 分析索引器 作用:对抓取回来的信息进行分析,建立索引...
admin 13年前 (2012-02-03) 2603浏览 0评论
搜索引擎按照功能可以分为如下几部分: 1. 巡视软件(robot/spider/crawler) 作用:自动从网上抓取信息。 2. 页面存储器 作用:将抓取回来的信息存储起来,也就是数据库。 3. 分析索引器 作用:对抓取回来的信息进行分析,建立索引...
admin 13年前 (2012-02-03) 2866浏览 0评论
两周前,Facebook宣布了一个Open Compute项目,彻底公开机房和服务器设计。 这件事的背景是,Facebook最近在俄勒冈州的普林维尔(Prineville),建成了一个世界上最先进的节能机房,号称能效提高38%,建造成本降低24%。 ...
admin 13年前 (2012-02-03) 3012浏览 0评论
Google把“相似图片搜索”正式放上了首页。 你可以用一张图片,搜索互联网上所有与它相似的图片。点击搜索框中照相机的图标。 转载请注明:爱开源 » 相似图片搜索的原理
admin 13年前 (2012-02-03) 2751浏览 0评论
这是利用数学算法,进行高难度图像处理的一个例子。事实上,图像处理的数学算法,已经发展到令人叹为观止的地步。 Scriptol列出了几种神奇的图像处理算法,让我们一起来看一下。 一、像素图生成向量图的算法 数字时代早期的图片,分辨率很低。尤其是一些电子...
admin 13年前 (2012-02-03) 2402浏览 0评论
curl是一种命令行工具,作用是发出网络请求,然后得到和提取数据,显示在”标准输出”(stdout)上面。 它支持多种协议,下面举例讲解如何将它用于网站开发。 一、查看网页源码 直接在curl命令后加上网址,就可以看到网页源码...
admin 13年前 (2012-02-03) 3274浏览 0评论
以往,我用的是AWStats日志分析软件。它可以生成很详细的报表,但是不太容易定制,得不到某些想要的信息。所以,我就决定自己写一个Bash脚本,统计服务器的日志,顺便温习一下脚本知识。 事实证明,这件事比我预想的难。虽然最终脚本只有20多行,但花了我...
admin 13年前 (2012-02-03) 2638浏览 0评论
七、远程操作 SSH不仅可以用于远程主机登录,还可以直接在远程主机上执行操作。 上一节的操作,就是一个例子: $ ssh user@host ‘mkdir -p .ssh && cat >> .ssh/au...
admin 13年前 (2012-02-03) 2712浏览 0评论
SSH是每一台Linux电脑的标准配置。 随着Linux设备从电脑逐渐扩展到手机、外设和家用电器,SSH的使用范围也越来越广。不仅程序员离不开它,很多普通用户也每天使用。 SSH具备多种功能,可以用于很多场合。有些事情,没有它就是办不成。本文是我的学...
admin 13年前 (2012-02-03) 4307浏览 0评论
以前的vnc4server,在host运行vnc4server后,在远程登录之后只有一个terminal,gnome根本不启动,提示一个could not acquire name on session bus错误。后来找到解决方法,要host退出g...