python模拟登陆登陆一:验证码与cookies的同步处理思路
admin 10年前 (2015-03-05) 3995浏览 0评论
自动登陆可能是写爬虫的第一步,如果都不能登陆,很多东西爬不到的。这也不是第一次写包含验证码识别的自动登陆脚本了。这次有点被坑住了,把这次的记录下来。 这次要自动登陆的网站地址是:2013年株洲市中小学教师全员培训 http://zhuzhou20...
admin 10年前 (2015-03-05) 3995浏览 0评论
自动登陆可能是写爬虫的第一步,如果都不能登陆,很多东西爬不到的。这也不是第一次写包含验证码识别的自动登陆脚本了。这次有点被坑住了,把这次的记录下来。 这次要自动登陆的网站地址是:2013年株洲市中小学教师全员培训 http://zhuzhou20...
admin 10年前 (2015-02-21) 4537浏览 0评论
1、报错: import urllib2 url = u"http://www.baidu.com/wd=测试" urllib2.urlopen(url).read() 错误如下: Traceback (most recent c...
admin 10年前 (2015-02-21) 3419浏览 0评论
在Python中,是支持可变长参数,甚至词典参数的,具体见 《Python中函数的参数传递与可变长参数》 而使用词典参数的方式,可以让我们节省很多不必要的初始化工作。 以初始化MySQL的conn为例: # App Config DB_HOST = ...
admin 10年前 (2015-02-21) 3323浏览 0评论
1.Python中也有像C++一样的默认缺省函数 def foo(text,num=0): print text,num foo("asd") #asd 0 foo("def",100) #def 100 定义...
admin 10年前 (2015-02-16) 3007浏览 0评论
Python 代码优化常见技巧 代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构、优化、扩展以及文档相关的事情通常需要消耗 80% 的工作量。优化通常包含两方面的内容:减小代码...
admin 10年前 (2015-02-16) 4118浏览 0评论
以下是我做调试或分析时用过的工具的一个概览。如果你知道有更好的工具,请在评论中留言,可以不用很完整的介绍。 日志 没错,就是日志。再多强调在你的应用里保留足量的日志的重要性也不为过。你应当对重要的内容打日志。如果你的日志打的足够好的话,单看日志你就能...
admin 10年前 (2015-02-15) 3146浏览 0评论
最近需要用python写一个环境搭建工具,多线程并行对环境各个部分执行一些操作,并最终知道这些并行执行的操作是否都执行成功了,也就是判断这些操作函数的返回值是否为0。但是threading并没有显式的提供获取各个线程函数返回值的方法,只好自己动手,下...
admin 10年前 (2015-02-15) 3612浏览 0评论
Python中,队列是线程间最常用的交换数据的形式。Queue模块是提供队列操作的模块,虽然简单易用,但是不小心的话,还是会出现一些意外。 创建一个“队列”对象 import Queue q = Queue.Queue(maxsize = 10) Q...
admin 10年前 (2015-02-11) 3314浏览 0评论
1. logging介绍 Python的logging模块提供了通用的日志系统,可以方便第三方模块或者是应用使用。这个模块提供不同的日志级别,并可以采用不同的方式记录日志,比如文件,HTTP GET/POST,SMTP,Socket等,甚至可以自己实...
admin 10年前 (2015-02-06) 7486浏览 0评论
TL;DR 经常有朋友问,如果用Python来做Web开发,该选用什么框架?用Pyramid开发Web该选用怎样的组合等问题?在这里我将介绍一些Python Web开发中常用的第三方库。基本适用于Django以外的Web框架(Pyramid, Fla...
admin 10年前 (2015-02-06) 3035浏览 0评论
数据结构 数据结构的概念很好理解,就是用来将数据组织在一起的结构。换句话说,数据结构是用来存储一系列关联数据的东西。在Python中有四种内建的数据结构,分别是List、Tuple、Dictionary以及Set。大部分的应用程序不需要其他类型的数据...
admin 10年前 (2015-01-30) 3718浏览 0评论
10月开始学习python, 学习一段时间之后,发现python真的是一门非常优美,开发迅速的语言, 漂亮的缩进, 功能强大的模块,丰富的图形库, 同时还能自己用c/c++添加你需要的扩展。 10月28号的, 在熟悉了这么一段时间后, 简单的用py...
admin 10年前 (2015-01-21) 3363浏览 0评论
这篇文章主要介绍了 实现的解析 配置文件代码,也可以说是 版的 代码中包含大量注释,需要的朋友可以参考下 #/usr/bin/env python #-*- coding:utf-8 -*- """ 1.解析 cr...
admin 10年前 (2015-01-20) 3107浏览 0评论
#!/usr/bin/env python #coding=utf8 from weibo import APIClient import urllib import urllib2 import httplib import re def get_...
admin 10年前 (2015-01-20) 2729浏览 0评论
正确处理文本,特别是正确处理Unicode。是个老生常谈的问题,有时甚至会难倒经验丰富的开发者。并不是因为这个问题很难,而是因为对软件中的文本,开发者没有正确理解一些关键概念及其表示方法。在StackOverflow上搜索关于UnicodeDecod...
admin 10年前 (2014-12-30) 4129浏览 0评论
背景介绍: 目前项目中使用了大量的AWS EC2 Instances作为服务器,在自动化运维方面,我们之前一直使用的是AWS CLI命令行工具,然后在Shell脚本中调用。 最近我想通过脚本实现一个“Clone”的功能,模拟Web Console上的...
admin 10年前 (2014-12-27) 3647浏览 0评论
首先要说的是,Python的版本,目前主要分为两大类: Python 2.x的版本的,被称为Python2:是目前用的最广泛的,比如Python 2.7.3。 Python 3.x的版本的,被称为Python3:是最新的版本的,比如Python 3....
admin 10年前 (2014-12-26) 4854浏览 0评论
1. Python的两种版本,Python 2.x和Python 3.x,的划分,不了解的去参考: 【整理】总结Python2(Python 2.x版本)和Python3(Python 3.x版本)之间的区别 2.对于各种字符编码要有个基本的了解比如...