巨头的云计算前传:躲在正史身后的“跌宕起伏”和“不可理喻”( 五 )


但百度与云计算的渊源 , 严格来说甚至早于盛大创新院和阿里云 。这个故事的开头 , 或许要从2005年讲起 。
2005年的8月有两件大事 , 一是百度成功登陆美国纳斯达克 , 成为中国互联网征战海外的标志性事件;二是湖南卫视《超级女声》总决赛落下帷幕 , 李宇春夺冠 , 比赛期间万人空巷 , 那一届超女至今仍是中国电视史上的流量巅峰 。
这两件事之间有个不得不提的联系 , 那一年超女的流量压垮过国内绝大多数社区和论坛 , 百度贴吧是当时唯一能扛住的网络讨论区 , 因此迅速成为了粉丝们的主要根据地 。
这完全超出了百度的预料 , 他们内测的所有数据 , 无一比得过李宇春;为了减轻系统负担 , 管理员删掉了张靓颖吧一栋有三十余万跟帖的高楼 , 惹得众人不快 , 他们惊觉为此上门前来交涉的粉丝带头人竟然还有高校教授……
超女这股东风 , 是贴吧崛起史上浓墨重彩的一笔 , 让老百度人印象深刻 。同时 , 这也从侧面反映了一个事实:百度比现在任何一家云巨头 , 都更早地接受了高并发的考验 。
不光是贴吧火热 , 百度上市后的两三年时间里 , 新产品层出不穷 。百度人逐渐意识到一个问题:不能每个新产品的所有构成都从头做起吧 , 能不能摸索出一些通用的、可复用的基础模块或服务 , 减少工程师们的重复劳动?
于是一个叫ibase的小部门成立了 , 侯震宇(现百度集团副总裁)担任负责人 , 它的职能是最大程度上统一百度非搜索业务的技术底座 , 建立一些基础的通用库——尽管当初还没有“技术底座”这样的说法 。
巨头的云计算前传:躲在正史身后的“跌宕起伏”和“不可理喻”
文章图片

文章图片

侯震宇
侯震宇曾告诉雷峰网 , 从打造通用技术底座的角度 , 百度云的历史应该可以追溯到2006年 。
2006年 , 百度世界大会发布了百度的博客产品——百度hi 。百度hi开始向用户提供图片的存储和展示功能 , 其中 , 图片存储功能被做成了一个可以通用的存储模块 。
这里就是百度云的发端 , 也是中国互联网最早的面向C端的云存储系统的雏形 。
“百度网盘现在这样的大存储 , 也是从当年我们云上的那个所谓的通用存储模块开始的 。”侯震宇说:“把一些基础功能模块化让我们的研发事半功倍 , 也正是从那时开始 , 2008年成立了一个新的部门 , 它可以说是之前的ibase小部门的升级 , 来围绕怎么为百度的产品提供专门的通用服务、底座” 。
这个新部门最后定名为了百度的基础架构部 , 侯震宇出任百度基础架构部主任架构师 , 他属于真正第一批搭建百度的技术体系的人 , 也是第一批中国互联网上“造云的人” 。
就在这时 , 百度关注到了谷歌的三篇云计算论文 。这三篇被认为是云计算历史里程碑的论文 , 分别讲述了分布式文件GFS(GoogleFileSystem)、分布式数据库BigTable和编程模式Map/Reduce , 也加速了百度向云靠拢 。
很快 , 在2010年 , 百度就决定在原有的基础架构部上 , 建立一个更大的公司级的基础架构部 , 目标从针对非搜索产品 , 变成把所有的百度技术底座打通 。百度全公司的基础设施和工程项目在这一年 , 首次正式统一 。
2010年也是百度在PC互联网时代的顶峰和股价的一个高峰 , 资金充裕的百度工程师开始大规模采买各种服务器 。据悉当时的服务器规模只有小几万台 , 百度大手一挥 , 很快立项了两个十万台量级的机房项目 。
当管理的资源上了一个新的台阶 , 后而达到恐怖的量级的时候 , 百度开始考虑搭建一种可以横向拉通的底层基础设施 。