【IT168 现场报道】2016年10月27日-29日,2016中国系统架构师大会(SACC 2016)在北京万达索菲特大饭店举行。作为中国规模最大的架构师豪门盛会,本届大会以“架构创新之路”为主题,站在创新的风口上,与大家共同打造一场通过架构创新及各种IT新技术来带动企业转型增效,助力架构师们腾飞的技术盛会。
开幕式次日,阿里巴巴资深专家沈询久阿里企业级互联网架构下的敏捷服务开发与架构实践做了精彩的分享。
沈询,是他的花名,本名王晶昱,目前在阿里主要负责淘宝分布式数据库(TDDL/DRDS)、淘宝分布式消息系统(Notify/ONS)。
阿里技术架构发展历程
阿里技术架构发展历程能够发展成今天成熟的体系,这中间也经历了很多的困难和磨砺。
说到最初的前期技术,沈询说,2003年那个时期,正赶上非典时期。当初阿里的技术还不是很成熟,主要运用phpAuction LAMP MySQL读写分离等技术,总体来说就是一切从简、快速上线。
发展2004年,正是网购兴起的时期,满足用户的需求是当下急需完成的指标。当时选择Java代替PHP,进一步拥抱开源产品,基于ISearch的搜索,自建CDN。
2006年,阿里开始尝试自己做开发。开始尝试分布式缓存TDBM、分布式存储TFS、分布式搜索引擎,随着技术的更新迭代所遇到的问题也越来越多。
对于用户来说,快速体检交付就是最大的需求。尝试分布式存储TFS系统, 当时的程序员把开源的系统再做二次开发 ,其目的解决系统流量大的过程中的扩展性问题 。
架构发展中存在哪些难题?
然而,成就一个成熟的网站需要很多人,强大的技术。所做的东西越来越多,需求越来越大,需要购买先进的技术经验或者借鉴有力技术做二次开发 。当技术越用越复杂时,随之而来的问题就会越来越多:
1几百人开始维护一个团队的时候很多人都不认识,源代码冲突问题严重,项目团队直接协同成本越来越高
2人员更新速度比较快,人员学习老代码难度大,项目代码发布很难 ,发布一个版本需要半年。这就意味着需要大量开发、测试人员, 结果必然导致延长开发时间。
3一个交易流程涉及到200多个步骤,跨越多个服务中心。其中,买家付款->p4p扣款->卡密发货->卖家得到发货通知->支付宝扣款->买家得到付款成功。其中,卡密发货因为涉及到外部系统,所以延迟在2s以上。
4 数据库能力达到上限
如何应对及发展策略
沈询说,流程越来越长意味着用户体验效果降低,交易延迟增加一秒,后果可能造成很多用户离开。那么,延迟问题给客户带来的影响非常重要,需亟待解决的问题。那么网站使用服务就会跟不上用户需求的结果,从当年谷歌和雅虎竞争搜索引擎的例子中完全能够验证。对于服务者来说,想尽一切办法,超过竞争对手就是服务的根本要旨。
沈询介绍,就数据库拆分,可按需扩容,尽可能对业务透明。用Proxy模型减少连接数,选择恰当的切分维度。
最后,沈询表示,最近几年,阿里的核心技术体系架构已经非常稳定可靠了。在这些核心中间件的基础上,不断地深入细化运维体系,尽可能地做到自动化、智能化,同时节省了比较多的设备成本和运维成本。
Aliware的缘起本质于阿里经过验证的那些组件以及在过去15年中的互联网实践,将开源的技术进一步形成产品,打造给现在需要服务的互联网公司, 让大家都能够享受到互联网技术的红利,效率的提升就是现在和未来阿里正在做和准备做的事。