python判断是否含有中文字符及长度
admin 12年前 (2013-07-03) 3745浏览 0评论
学习了。 下面这个小工具包含了 判断unicode是否是汉字,数字,英文,或者其他字符。 全角符号转半角符号。 unicode字符串归一化等工作。 还有一个能处理多音字的汉字转拼音的程序。 #!/usr/bin/env python # -*- co...
admin 12年前 (2013-07-03) 3745浏览 0评论
学习了。 下面这个小工具包含了 判断unicode是否是汉字,数字,英文,或者其他字符。 全角符号转半角符号。 unicode字符串归一化等工作。 还有一个能处理多音字的汉字转拼音的程序。 #!/usr/bin/env python # -*- co...
admin 12年前 (2013-06-28) 2983浏览 0评论
Django settings 文件包含你的 Django 安装的所有配置信息.本文档解释了 settings 如何工作及共有哪些选项可用. 基本设置 一个 settings 文件就是一个拥有一些模块级变量的 Python 模块. 下面是几个 set...
admin 12年前 (2013-05-30) 4505浏览 0评论
学习webpy过程中,出现 UnicodeDecodeError: ‘ascii’ codec can’t decode byte 0xe6 in position 29: ordinal not in range...
admin 12年前 (2013-05-21) 17517浏览 0评论
python 2.4后引入新的模块subprocess,用于取代原有的commands模块。利用subprocess可以非常方便地跑多个后台任务,例如下面的示例代码(省去所有的错误处理): from subprocess import Popen, ...
admin 12年前 (2013-05-21) 2835浏览 0评论
tcpxm 基于pylibcap的抓包工具 原理 python开发,调用pylibcap进行抓包 3个线程:一个负责抓包并分析内容,一个负责写日志,一个用来清除过期数据 使用tcpdump抓取的数据还需要2次分析,tcpxm可以很方便的抓取和分析tc...
admin 12年前 (2013-05-14) 6048浏览 1评论
老大布置的任务,要分析一个5G大小的nginx log file,因为我的python也是刚学,所以摸索了很久,才实现了这个需求,废话不多话,简单粗暴,直接上代码! 功能介绍: 1、统计Top 100 访问次数最多的ip,并显示地理位置信息!这个是用...
admin 12年前 (2013-05-08) 2851浏览 0评论
支持SQL标准的可用数据库有很多,其中多数在Python中都有对应的客户端模块. 这里我使用的mysql,它需要安装MySQLdb包.它相当于Python的数据接口规范Python DB API. root@10.1.1.45:~# apt-get ...
admin 12年前 (2013-05-07) 3044浏览 0评论
Wheatserver是通用的C实现的通用服务器以及框架,更多的请参考Wheatserver WSGI应用服务器众多,较为出色的有uWSGI,Gunicorn,gevent和Apache mod_wsgi。性能评测参考http://nichol.as...
admin 12年前 (2013-04-28) 3224浏览 0评论
## ##****************************************************************************** ## NAME: SendMail ## PURPOSE: ## ## REVIS...
admin 12年前 (2013-04-28) 2911浏览 0评论
这些天有个项目是需要一部分Android开发。本想去官网看文档,众所周知的原因,官网无法连接。下载了本地的文件,由于是做的整站镜像,搜索功能无法正常使用,这对于经常要使用此功能的我来说很是麻烦。于是想到了把文件上传到GAE,再利用Google的本地功...
admin 12年前 (2013-04-28) 3330浏览 0评论
服务器每天都有这样那样的信息需要实时推送。最初一直是Mail,最容易实现,成本也低。后来有了短信接口,就有了相对实时但要花钱的方式推送。 知道GAE可以直接跟gtalk挂钩推送消息,可能一直挂Gtalk的人远没有挂QQ和MSN的多(密之声:Gtalk...
admin 12年前 (2013-04-28) 2747浏览 0评论
作为Java和python这类相对设计比较完善的解释型语言而言,总有很严密的垃圾回收机制用以防止资源被浪费甚至内存溢出之类的问题。起先我始终认为这会大大提升系统的性能,然而这次碰上了悖论。 刚过完春节,春节前,考虑到会有很多人发送贺卡,邮件系统的压力...
admin 12年前 (2013-04-28) 3290浏览 0评论
公司项目中需要使用长链接方式的获取后端数据库——主要是Redis的实时数据。 由于项目本身是PHP的初次看到这个项目,首先想到的是Apache + mod_php的方式,配合php的ob_start()方式直接调用,就如同我之前的一篇东西所说的那样。...
admin 12年前 (2013-04-28) 2848浏览 0评论
上次提到过Ubuntu上Coreseek+php的安装的安装一文,我个人建议Coreseek最好采用Python作为数据源,相对灵活性很大。这次我就分享一下我写的一个CoreSeek的Python数据源基类。 这个基类的优势在于特别是对于“分库分表”...
admin 12年前 (2013-04-26) 3351浏览 0评论
C重构,C重构,看的已经有点郁闷了!这次打算收尾了,将几种方法的性能做个横向比较吧,近期不再研究。 相关文章: Cython快速实现Python的C重构 无须coding快速实现Python的C重构 老一套的python源码: def sheepBo...
admin 12年前 (2013-04-26) 3413浏览 0评论
正如之前说的,很多情况下我们需要对代码中的部分甚至于全部进行基于C语言的重构以大幅提升性能。对于很多团队来说,由于C语言过于复杂,很难像Python,PHP或者其他高级语言那样快速上手。本文就着重介绍如何通过现有的资源,快速的将python转成C而尽...
admin 12年前 (2013-04-26) 4327浏览 0评论
说起Python,首先想到的他是一种“胶水语言”。作为一种合格的胶水语言,比起开发的难易程度或者开发效率来讲,语言的适应性和可扩充性同样很重要。python的一大特色是有许多方便灵活的扩展模块。 对于上次我们曾经说过ctypes的方式可能对于已经存在...
admin 12年前 (2013-04-26) 3508浏览 0评论
记得在zipsite项目中,对于文本文件本身就没有序列化的问题,但对于富媒体文件的序列化,我采用的方法是pickle。后来我忽然觉得使用pickle是可以实现简单的分布任务处理的。 废话不表,上代码: 首先是一个“有限事务机”,讲白一点就是所有的任务...