解决MySQL中文乱码以及版本不一致问题
admin 12年前 (2013-04-15) 2904浏览 0评论
这几天基于Heritrix写了一个爬虫,用到MySQL,在导入导出数据时,遇到一些乱码问题,好不容易解决了,记录一下,以备查看。 一、导出数据 先说明一下自己的环境:Mac OS X 10.8.3, MySQL Community Server 5...
admin 12年前 (2013-04-15) 2904浏览 0评论
这几天基于Heritrix写了一个爬虫,用到MySQL,在导入导出数据时,遇到一些乱码问题,好不容易解决了,记录一下,以备查看。 一、导出数据 先说明一下自己的环境:Mac OS X 10.8.3, MySQL Community Server 5...
admin 12年前 (2013-04-15) 2663浏览 0评论
导读:本文主要详细测试online DDL中的删除,添加主键操作。关于MySQL5.6在线DDL的全文信息,请参照:MySQL5.6版本InnoDB存储引擎在线DDL变更的官方信息中文翻译版, 文章地址:http://www.mysqlops.com...
admin 12年前 (2013-04-14) 3676浏览 0评论
第一步: 登陆weibo我们首先需要从: url_prelogin = ‘http://login.sina.com.cn/sso/prelogin.php?entry=weibo&callback=sinaSSOControll...
admin 12年前 (2013-04-14) 4020浏览 0评论
一、验证码的基本知识 1. 验证码的主要目的是强制人机交互来抵御机器自动化攻击的。 2. 大部分的验证码设计者并不得要领,不了解图像处理,机器视觉,模式识别,人工智能的基本概念。 3. 利用验证码,可以发财,当然要犯罪:比如招商银行密码只有6位,验证...
admin 12年前 (2013-04-14) 3019浏览 0评论
以 前写过一个刷校内网的人气的工具,Java的(以后再也不行Java程序了),里面用到了验证码识别,那段代码不是我自己写的:-) 校内的验证是完全单色没有任何干挠的验证码,识别起来比较容易,不过从那段代码中可以看到基本的验证码识别方式。这几天在写一个...
admin 12年前 (2013-04-14) 2936浏览 0评论
用python加“验证码”为关键词在baidu里搜一下,可以找到很多关于验证码识别的文章。我大体看了一下,主要方法有几类:一类是通过对图片进行处理,然后利用字库特征匹配的方法,一类是图片处理后建立字符对应字典,还有一类是直接利用ocr模块进行识别。不...
admin 12年前 (2013-04-13) 3804浏览 0评论
之前做JAVA课大作业的时候曾经用过weibo的API,weibo的API采用OAuth2的认证方法进行认证,也就是避免开发者知晓用户密码的一种手段。不过这样对于开发一些简单使用的客户端程序就不太友好了,可以通过程序模拟授权过程来跳过这一步骤。之前是...
admin 12年前 (2013-04-13) 2977浏览 0评论
之前写过在python中使用weibo API的方法,通过python SDK使用weibo API,但是因为weibo API有频率限制,不够目前需求使用,所以通过爬虫模拟登录weibo进行直接抓取还是很有必要的,第一步要做的事情就是模拟登录过程。...
admin 12年前 (2013-04-13) 2521浏览 0评论
在Python实践中,我们往往遇到排序问题,比如在对搜索结果打分的排序(没有排序就没有Google等搜索引擎的存在),当然,这样的例子数不胜数。《数据结构》也会花大量篇幅讲解排序。之前一段时间,由于需要,我复习了一下排序算法,并用Python实现了各...
admin 12年前 (2013-04-13) 3281浏览 0评论
function trimmed_title($text, $limit=12) { if ($limit) { $val = csubstr($text, 0, $limit); return $val[1] ? $val[0]."......
admin 12年前 (2013-04-12) 3473浏览 0评论
在 Oracle 吃掉 SUN 取得 MySQL 之后, 大家一直以為 Oracle 会砍掉 MySQL, 不过直到现在还是没有动手, 但是仍然有点小动作让人担心, 像是移除 test case[1]. 不过对於使用 MySQL 己久, 并且很熟悉 ...
admin 12年前 (2013-04-12) 3092浏览 0评论
原文参考:http://www.davidodwyer.com/category/tags/tcpdump-mysql #!/bin/bash tcpdump -i eth0 -s 0 -l -w – dst port 3306 | strings ...
admin 12年前 (2013-04-12) 2778浏览 0评论
案例描述 在定时脚本运行过程中,发现当备份表格的sql语句与删除该表部分数据的sql语句同时运行时,mysql会检测出死锁,并打印出日志。 两个sql语句如下: (1)insert into backup_tabl...
admin 12年前 (2013-04-11) 3812浏览 0评论
我的Linode十分繁忙,在跑一些密集操作数据库的Rake任务时尤其如此。但我观察发现,Linode服务器的4核CPU,只有第1个核心(CPU#0)非常忙,其他都处于idle状态。 不了解Linux是如何调度的,但在Linode的这种状态下,显然有优...
admin 12年前 (2013-04-11) 11191浏览 0评论
一直莫名其妙的遇到类似这样错误:connect() to unix:/tmp/php-fcgi.sock failed (11: Resource temporarily unavailable) while connecting to upstre...
admin 12年前 (2013-04-11) 3221浏览 0评论
1.worker_processes 越大越好(一定数量后性能增加不明显) 2.worker_cpu_affinity 所有cpu平分worker_processes 要比每个worker_processes 都跨cpu分配性能要好;不考虑php的...
admin 12年前 (2013-04-11) 2708浏览 0评论
在选择用什么工具开发,唯一的指导标准就是:用最少的人力,最少的时间开发JavaEye网站,并且后期维护和持续升级,乃至重写的时候,代价最小。 首先排除Java和C#,代码太多太麻烦; 其次排除PHP,项目一大,代码一多,代码的管理很成问题,PHP缺乏...
admin 12年前 (2013-04-10) 3405浏览 0评论
1 — 获取UUID 在客户端,checkout代码就在本地建立了工作拷贝,根据这份工作拷贝使用如下命令来获取当前版本库的UUID。 $ svn info /home/svn/morepos Path: morepos Working C...