运维往事 一次负载均衡坏点检测事故

  之前做运维,有一些印象很深的事故,今天来讲其中一个,为了大家能理解,先说一些背景。现在因为流量巨大,单台机器肯定不足以为所有用户提供服务,所以大公司几乎任何一个服务的背后都是一套集群,然而任意一台机器不是100%可靠,如果你想让你服务尽可能接近100%可靠,你的集群就得具备检测和剔除坏点的能力。
Continue reading

运维往事 公司生产服务器不让连公网

  15年毕业,就莫名其妙做了运维,也成为了阿里最后一批业务运维(pe)。刚开始做运维的时候由于基础知识太差,很多事情做了就做了,但也不理解为什么那么做了,知道后来跳出运维的圈子,自己做了开发,思路、见识、视野渐渐开阔之后也就慢慢明白了之前好多不懂的东西,想着想着也觉得比较有意思,这里记录下。
Continue reading

OpenTSDB简介

  OpenTSDB(Open time series data base),开发时间序列数据库。DB这个词很有误导性,其实并不是一个db,单独一个OpenTSDB无法存储任何数据,它只是一层数据读写的服务,更准确的说它只是建立在Hbase上的一层数据读写服务。行业内各种db都很多了,为什么还会出现它?它到底有什么好?它做了什么?别着急,我们来一一分析下。
Continue reading

Kubernetes简介

声明:本文主要是自Google全球云服务总裁David K. Rensin 《kubernetes》一书中的内容,介绍可能不够详尽,文章也缺乏组织性,先发出来,这个月我会继续完善本文,也欢迎各位指教。

  kuberbetes在希腊语中是「舵手、领航员」的意思,据我了解k8s算是Google borg的开源版本,正是因为google 15年放出borg的论文和近两年docker的火热,k8s也成为炙手可热的项目,部分云厂商比如Google、MS Azure、AWS甚至直接提供了kubernetes解决方案。
Continue reading