存储 频道

搜狗冼茂源:莫把Hadoop当成“万金油”

  【IT168 专稿】2013年11月22-23日,作为国内知名专注于Hadoop技术与应用分享的大规模行业盛会,2013 Hadoop中国技术峰会(China Hadoop Summit 2013)将于北京福朋喜来登集团酒店隆重举行。届时,来自国内外各行业领域的近千名CIO、CTO、架构师、IT经理、咨询顾问、工程师、Hadoop技术爱好者,以及从事Hadoop研究与推广的IT厂商和技术专家将共襄盛举。

  
点击进入2013 Hadoop中国技术峰会官网

  Haoop中国技术峰会由China Hadoop Summit专家委员会主办,由IT168、ITPUB、ChinaUnix协办,渠达传媒负责承办。本届大会将秉承“效能、应用、创新”为主题,旨在通过开放、广泛的分享和交流,着力于促进中国企业用户提高应用Hadoop的能力和水平,降低Hadoop技术应用门槛和投资预算门槛,推广大数据的应用价值。

搜狗冼茂源:莫把Hadoop当成“万金油”

  ▲搜狗搜索开发部高级工程师冼茂源

  在本次大会即将召开之际,IT168记者有幸采访到了本次大会的特邀演讲嘉宾——搜狗搜索开发部高级工程师冼茂源先生。自2010年加入搜狗公司,冼茂源便一直专注于分布式平台相关的开发工作,曾负责Hadoop/HBase与搜狗业务相结合的特殊特性的开发、Hadoop任务调度、安全管理、存储优化、监控及管理系统的开发,以及Hadoop上数据挖掘算法的研发工作。在Hadoop系统问题排查、代码修改及调优,分布式应用实现架构等方面,他都拥有丰富的实践经验。

  Hadoop≠“万金油”

  目前,冼茂源主要负责搜狗自主研发的分布式相关系统的开发和管理工作,并于近期将Hadoop子项目——Hama与搜狗SiteRank计算相结合,负责平台部分的问题排查及性能优化。

  据冼先生介绍,作为中国第二大搜索引擎公司,搜狗非常重视Hadoop创新技术的研究。在搜狗的搜索后台数据积累及数据制作过程中,Hadoop都承担了重要角色。其中,HBase用于各种垂直搜索业务的数据存储,MapReduce则应用于这些业务的数据制作当中。而在搜狗的Hadoop实际应用中,搜狗根据业务的需求,对HBase bulkload、HBase compacthook、Hadoop中的安全管理、任务调度、监控等,都进行了代码修改及深度使用。

  虽然Hadoop如今可以说是大数据处理领域的王者,但作为批处理系统,Hadoop对于实时查询及流式计算却并不擅长。在冼茂源看来,目前Hadoop在互联网领域的应用瓶颈部分来源于一个误区——即把Hadoop当作“万金油”。Hadoop可以兼顾大数据量和精确性,但不能保证实时性。面对特定场景依然部署Hadoop的项目,其应用极易出现问题,这不仅会受到用户的质疑,还会进而造成系统落地难等问题。另一方面,随着企业数据规模的不断扩大,单Master集群逐渐成为了Hadoop持续支持爆炸性数据存储及计算需求的瓶颈,这也正是Apache社区在刚刚发布的Hadoop 2.0中引入多Master、多Namespace结构的原因。

  Hadoop未来趋势:生态圈与架构齐发展

  尽管Hadoop目前还存在一些问题,但其未来的发展前景依然颇被看好。冼茂源认为,未来Hadoop技术会朝着两个方向发展,在生态圈方面,随着开发环境的不断完善,内存计算、图计算等更多的技术会不断出现以补充Hadoop Mapreduce架构的不足。而在Hadoop架构自身上,HA、Federation等不断提高其鲁棒性和可扩展性的功能也会进一步完善并逐步接近工业级应用的质量标准。

  对于国内众多的Hadoop技术爱好者,冼茂源建议他们要利用机会多实践,在使用中多了解系统,多看代码。另外他还希望新手们能踊跃参与开源项目,即使只是向社区贡献一个小的bug fix,也能提升新手的自身能力。

  作为本届Hadoop中国技术峰会的演讲嘉宾,冼茂源将在会上与大家分享Hadoop子项目Hama的计算原理、发展趋势及其在实际项目中的使用经验。“希望本次大会能对进一步促进Hadoop技术在中国的深入推广,同时,为相关的从业者提供一个自由交流和互相学习的机会,互通有无,为中国的开源技术添点力。会上关于Hadoop在实际业务中的使用、Hadoop及其生态系统中相关技术的发展及前瞻类话题,都很值得大家期待”,冼茂源表示。

  据悉,Hadoop中国技术峰会2013是国内基于Hadoop平台的第一次全产业链的大数据行业技术峰会,大会将围绕Hadoop生态系统展开全方位的技术分享、专题讨论与成果展示。大会议题将涉及以下七大方面:Hadoop技术创新、Hadoop基础架构部署与优化、虚拟化与Hadoop、Hadoop在互联网领域的应用、Hadoop在非互联网行业的应用、Hadoop与企业现有IT架构的整合、大数据创业与投资。

  更多精彩尽在2013年11月22~23日的Hadoop中国技术峰会(China Hadoop Summit 2013),北京永泰福朋喜来登酒店。

  现在报名即可享购票优惠。

3
相关文章