50个数据科学和机器学习速查表
9年前 (2015-07-28) 3924浏览 0评论
在数据科学领域有成千上万的包和数以百计的函数公式,你虽然不需要掌握所有的这些知识,但是有一个速查表在你的学习中是非常重要的。学习大数据包括对统计学、数学、编程知识(尤其是R、python、SQL)等知识的理解,还需要理解业务来驱动决策。这些表单也许能...
9年前 (2015-07-28) 3924浏览 0评论
在数据科学领域有成千上万的包和数以百计的函数公式,你虽然不需要掌握所有的这些知识,但是有一个速查表在你的学习中是非常重要的。学习大数据包括对统计学、数学、编程知识(尤其是R、python、SQL)等知识的理解,还需要理解业务来驱动决策。这些表单也许能...
9年前 (2015-07-25) 3533浏览 0评论
Oracle有一个闪回(flashback)功能,能够用户恢复误操作的数据。本文讨论MySQL数据库中支持闪回的方案。 1、 闪回的目标 即使为了数据安全,我们搭建了主从。但实时主从备份只能防止硬件问题,比如主库的硬盘损坏。但对于误操作,则无能为力。...
9年前 (2015-07-25) 3416浏览 0评论
SQL 入门 在准备成为MySQL DBA之前,能熟练的编写SQL是一个必要条件。exists 和 join之间的等价转换;基本的行列转换;SQL 循环等的熟练掌握对之后的运维和调优工作都有很大的帮助。 推荐书籍: SQL Cookbook原版中文版...
9年前 (2015-07-25) 2974浏览 0评论
SQL(Structure Query Language)语言是数据库的核心语言。 SQL的发展是从1974年开始的,其发展过程如下: 1974年—–由Boyce和Chamberlin提出,当时称SEQUEL。 1976年...
9年前 (2015-07-25) 3142浏览 0评论
本文一共分析了三个案例,分别介绍并发系统中的共享资源并发访问、计算型密集型任务缓存访问 、单一热点资源峰值流量问题和解决方案。 Q1:订票系统,某车次只有一张火车票,假定有1w个人同时打开12306网站来订票,如何解决并发问题? A1: 首先介绍数据...
9年前 (2015-07-25) 3057浏览 0评论
Hadoop,HBase,NO-SQL是当今业界比较火的一些名词。满互联网都是对它的他们的赞许,其实光芒的背后还有部分缺点。本文只是我vogts的一些观点和想法。 HBase的优点: 分布式,易扩展,高性价比,运维成本低都是它的优点。HBase可以支...
9年前 (2015-07-24) 4173浏览 0评论
#!/usr/bin/python # -*- coding: utf-8 -*- import urllib2 import sys import json class zabbixtools: def __init__(self): self.u...
9年前 (2015-07-19) 6030浏览 1评论
进程和线程究竟是什么东西?传统网络服务模型是如何工作的?协程和线程的关系和区别有哪些?IO过程在什么时间发生? 在刚刚结束的 PyCon2014 上海站,来自七牛云存储的 Python 高级工程师许智翔带来了关于 Python 的分享《Python中...
9年前 (2015-07-19) 3446浏览 0评论
最近一段时间由于工作需要,开始关注针对Mysql数据库的select查询语句的相关优化方法。 由于在参与的实际项目中发现当mysql表的数据量达到百万级时,普通SQL查询效率呈直线下降,而且如果where中的查询条件较多时,其查询速度简直无法容忍。曾...
9年前 (2015-07-17) 3251浏览 0评论
$arg_PARAMETER 功能:如果在请求中设置了查询字符串,那么这个变量包含在查询字符串是GET请求PARAMETER中的值。 $args ...
9年前 (2015-07-16) 12224浏览 0评论
最近项目需求,要了解下logstash的一些性能,根据现有的技术方案,主要是针对 logstash-input-file 插件以及 logstash-output-kafka 插件进行测试,不过最近关注 logstash 的人应该清楚,目前处于新老版...
9年前 (2015-07-15) 5441浏览 0评论
最近一直在忙着搞Ceph存储的优化和测试,看了各种资料,但是好像没有一篇文章把其中的方法论交代清楚,所以呢想在这里进行一下总结,很多内容并不是我原创,只是做一个总结。如果其中有任何的问题,欢迎各位喷我,以便我提高。 优化方法论 做任何事情还是要有个方...
9年前 (2015-07-15) 3298浏览 0评论
摘要: PHP解析multipart/form-datahttp请求的body part请求头时,重复拷贝字符串导致DOS。远程攻击者通过发送恶意构造的multipart/form-data请求,导致服务器CPU资源被耗尽,从而远程DOS服务器。 影...
9年前 (2015-07-14) 3370浏览 0评论
Linux 系统中僵尸进程 – hazir – 博客园 Linux 系统中僵尸进程和现实中僵尸(虽然我也没见过)类似,虽然已经死了,但是由于没人给它们收尸,还能四处走动。僵尸进程指的是那些虽然已经终止的进程,但仍...
10年前 (2015-07-08) 4110浏览 0评论
在redhat网站查到下面的信息,说是因为内存不够的原因。我觉得这个可以当作出现这个问题的解释,但是却解释得不够“完美”,我仍旧还在疑惑中:如果是是因为内存不够的原因,那么在每次测试之前,只要保证机器状态一样,那么TCP: time wait buc...
10年前 (2015-07-08) 3234浏览 0评论
对于一个server,我们一般考虑他所能支撑的qps,但有那么一种应用, 我们需要关注的是它能支撑的连接数个数,而并非qps,当然qps也是我们需要考虑的性能点之一。这种应用常见于消息推送系统,也称为comet应用,比如聊天室或即时消息推送系统等。c...
10年前 (2015-07-08) 4714浏览 0评论
操作系统是 Linux RHEL 5.3,在dmesg的输出中发现很多类似的报错信息: Out of socket memory printk: 8 messages suppressed. 从网上搜了一下,发现两篇不错的解释这个错误的文章,综合一下...
10年前 (2015-07-08) 3806浏览 0评论
I recently did some work on some of our frontend machines (on which we run Varnish) at StumbleUpon and decided to track down ...