搜索引擎的体系结构
admin 13年前 (2012-02-03) 2583浏览 0评论
搜索引擎按照功能可以分为如下几部分: 1. 巡视软件(robot/spider/crawler) 作用:自动从网上抓取信息。 2. 页面存储器 作用:将抓取回来的信息存储起来,也就是数据库。 3. 分析索引器 作用:对抓取回来的信息进行分析,建立索引...
爱开源开源
admin 13年前 (2012-02-03) 2583浏览 0评论
搜索引擎按照功能可以分为如下几部分: 1. 巡视软件(robot/spider/crawler) 作用:自动从网上抓取信息。 2. 页面存储器 作用:将抓取回来的信息存储起来,也就是数据库。 3. 分析索引器 作用:对抓取回来的信息进行分析,建立索引...
admin 13年前 (2012-02-03) 2847浏览 0评论
两周前,Facebook宣布了一个Open Compute项目,彻底公开机房和服务器设计。 这件事的背景是,Facebook最近在俄勒冈州的普林维尔(Prineville),建成了一个世界上最先进的节能机房,号称能效提高38%,建造成本降低24%。 ...
admin 13年前 (2012-02-03) 2994浏览 0评论
Google把“相似图片搜索”正式放上了首页。 你可以用一张图片,搜索互联网上所有与它相似的图片。点击搜索框中照相机的图标。 转载请注明:爱开源 » 相似图片搜索的原理
admin 13年前 (2012-02-03) 2732浏览 0评论
这是利用数学算法,进行高难度图像处理的一个例子。事实上,图像处理的数学算法,已经发展到令人叹为观止的地步。 Scriptol列出了几种神奇的图像处理算法,让我们一起来看一下。 一、像素图生成向量图的算法 数字时代早期的图片,分辨率很低。尤其是一些电子...
admin 13年前 (2012-02-03) 2378浏览 0评论
curl是一种命令行工具,作用是发出网络请求,然后得到和提取数据,显示在”标准输出”(stdout)上面。 它支持多种协议,下面举例讲解如何将它用于网站开发。 一、查看网页源码 直接在curl命令后加上网址,就可以看到网页源码...
admin 13年前 (2012-02-03) 3253浏览 0评论
以往,我用的是AWStats日志分析软件。它可以生成很详细的报表,但是不太容易定制,得不到某些想要的信息。所以,我就决定自己写一个Bash脚本,统计服务器的日志,顺便温习一下脚本知识。 事实证明,这件事比我预想的难。虽然最终脚本只有20多行,但花了我...
admin 13年前 (2012-02-03) 2617浏览 0评论
七、远程操作 SSH不仅可以用于远程主机登录,还可以直接在远程主机上执行操作。 上一节的操作,就是一个例子: $ ssh user@host ‘mkdir -p .ssh && cat >> .ssh/au...
admin 13年前 (2012-02-03) 2686浏览 0评论
SSH是每一台Linux电脑的标准配置。 随着Linux设备从电脑逐渐扩展到手机、外设和家用电器,SSH的使用范围也越来越广。不仅程序员离不开它,很多普通用户也每天使用。 SSH具备多种功能,可以用于很多场合。有些事情,没有它就是办不成。本文是我的学...
admin 13年前 (2012-02-03) 4248浏览 0评论
以前的vnc4server,在host运行vnc4server后,在远程登录之后只有一个terminal,gnome根本不启动,提示一个could not acquire name on session bus错误。后来找到解决方法,要host退出g...
admin 13年前 (2012-01-30) 3272浏览 0评论
自从很早之前装了zend optimizer一直没有发现有问题,今天在命令行下调用php.exe,出现了一大堆的warning: PHP Warning: PHP Startup: soap: Unable to initialize module ...
admin 13年前 (2012-01-30) 2568浏览 0评论
了解下PHP的历史, 有助于更加深刻的了解PHP发展到今天的轨迹, 下面的文字都是从» PHP手册中转载过来的. PHP 在过去的几年里走过了漫长的道路。成长为处理 web 的最卓越的语言并非易事。如果对 PHP 如何发展到今天很感兴趣,那么请继续读...
admin 13年前 (2012-01-30) 3561浏览 0评论
今天在我的微博(Laruence)上发出一个问题: 我在面试的时候, 经常会问一个问题: “如何设置一个30分钟过期的Session?”, 大家不要觉得看似简单, 这里面包含的知识挺多, 特别适合考察基本功是否扎实, 谁来回答试试? 呵呵 为什么问这...
admin 13年前 (2012-01-29) 3090浏览 0评论
一个简单的脚本,运行在PHP环境下,方便列出目录下的所有文件(以下代码为列出当前与脚本同目录的文件,可以自行修改opendir(“./”))这个相对路径达到显示其他路径下文件的效果) <?php echo “...
admin 13年前 (2012-01-29) 2822浏览 0评论
需求:有一个网站,提供视频在线播放,视频格式为flv,视频路径直接写在网页源代码中,而视频路径每一次的请求都不一样,比如某个视频在网页源代码中的地址为:http://url/dl/88bd09b075a2033d8b515fae13398253/4f...
admin 13年前 (2012-01-29) 3218浏览 0评论
我:我们有两台机,都是一样的 xeon E5620 2.4G 的CPU,但是,跑算Pi的程序,5000个迭代,一个机器跑48秒,另一个只需要32秒 coly:CPU核数一样吗? 我:一样的。不一样应该没关系,我这是单进程。 coly:内存速度不一样?...
admin 13年前 (2012-01-29) 4941浏览 0评论
前言:使用linux桌面连接远程kvm服务器,使用virt-manager,出现下面报错: Traceback (most recent call last): File “/usr/share/virt-manager/virt-manager.p...
admin 13年前 (2012-01-18) 5399浏览 1评论
iptables -A PREROUTING -t nat -i ppp1 -p tcp –dport 8080 -j DNAT –to 1.1.1.3:22 iptables -A POSTROUTING -t nat -o ppp1 -p tcp...
admin 13年前 (2012-01-18) 2794浏览 0评论
网页的缓存是由HTTP消息头中的“Cache-control”来控制的,常见的取值有private、no-cache、max-age、must-revalidate等,默认为private。其作用根据不同的重新浏览方式分为以下几种情况: (1) 打开...