因为看到多人吐槽铁路部售票网站12306.cn之烂、采购中标价格之高,所以一时兴起,好奇这个订票到底难不难,就查阅了信息。
但这个问题太专业了,即便是IT从业者,没接触过“海量事务高速处理系统”/High Performance Distributed Transaction Processing高性能分布式交易处理系统,理解也会有偏差,即便接触过大量数据并发处理的程序员或者是架构师之类,又有几个能有机会遇到1分钟需要有10万笔交易的并发数据处理?
没经历过就凭自己的点微薄经验信口开河,很可能失之毫厘、谬之千里。IT从业者都难以判断,那业外人士就更难以理解了!
有几个数据值得注意:
- 2012年临近中秋+十一假期,12306网站日点击量达到14.9亿次
- 12306网站 每秒PV高峰时上千万
- 12306.cn 一天最高售票188万多张票
- 2011-12-12淘宝双12 凌晨1st分内,淘宝网瞬间涌入高达270万人,一小时内成交278万笔4.75亿
- 淘宝一天最多能上三千万笔的交易,但一分钟的峰值最多也就5.5万笔,平均的流量也就2万多,火车票一般放号出来最多20分钟就卖光了,一分钟接近10万笔交易,比淘宝的瞬时流量大多了,
【这几个数据来源有的不同,但相互可以印证:12306每分钟瞬时交易数=188万/20分钟≈10万笔交易/分钟;淘宝交易数278万/60分=4.6万笔】
【数据来源 基本在下面】
多查找些资料,就会发现,这个中国式铁路售票系统还真不简单!看到有人说什么只要免费地由老师给学生布置作业就能够完成任务,这些就纯属无知者无畏地胡扯,这样很搞笑吗?很有意思吗?
罗慕遥,.net程序员出生,进入网页游戏行业,随后…
11 票,来自 mo Land、逍遥、黄美婷 更多
中央拨款1000万建网站,部长给副部长500万建网站,副部长给秘书100万建网站,秘书给外包公司50万建网站,外包公司转包一家技术公司10万建网站,技术公司给校领导5万建网站,校领导给主任1万建网站,主任给了计算机老师5000建网站,老师给学生布置作业建网站。于是乎,神奇的铁道部购票网站隆重诞生了!
zhihu.com/question/20015484/answer/13675935Ricky,崇尚简单即为美,360无线PM。寻找潜在…
2 票,来自 mo Land、孙保儒
单就网站不包括服务来说,其成本撑死不过5W,这个报价还是专业公司的报价,小公司或工作室也就1W多吧
http://www.zhihu.com/question/20015484/answer/13673488
几点看法:
- 要搞定这个问题,是需要时间在实践中积累的,12306的一个严重问题就是它是类似突变出的产物,不是在实战中成长起来的。让腾讯在1年内立马达到亿人在线,它肯定问题多多;让淘宝1年内就做出每分钟处理5万笔交易,它肯定再测试也立马崩溃。
- 外行以及伪内行的很多吐槽,很无知很浅薄,但在当前中国很主流很有市场。
- 铁道部最初舍弃外国方案采用自家设计是否恰当?
谁又能事先料到这个问题会如此严重?假若成功了人们又会评论省钱了+支持民族产业,但失败了人们就会辱骂。而现在人们就是要当事后诸葛。
现在铁道部欲推倒重来,重建全新的售票系统,又有人在吐槽了,这是多大的浪费,是不是又有猫腻。
王津THU的比喻很不错,12306售票系统的海量负载导致的问题变复杂甚至变性,在其它领域也可看到,一个载重1000吨的大件运输车和一个55吨的重卡是极度不同的,一个人开了小汽车开重卡也是极度不同的(刹车就很不同),开一个小卖铺与开一间大超市的库存管理也是相当不同的,打篮球时大个子与小个子的战术也是相当不同的。也就是说,本来是同一件事,只是程度/量的巨大差别,会导致事情的以性质都发生巨大改变。面对这种情况,以常态的经验臆测超级变态时的情况,就会判断严重失误。
后记:有时间继续考察学习。
★相关资料与分析评论
@中国铁路 : 【针对近期12306网上购票难的情况 铁路部门表示歉意】近日正处在中秋和“十一”黄金周售票的高峰期,12306网站日点击量达到14.9亿次,在网上发售客票超过今年春运最高值,导致出现网络拥堵、重复排队等现象。对此,铁路部门表示歉意。weibo.com/chineserailways
透过12306五大焦点看高性能高并发系统-IT168http://t.cn/zOLFkHF
12306购票系统的出现是目前IT界的一大难题,12306的仓促上线使得这些问题“并发”,最终导致“爆机”,而反观淘宝、亚马逊以及Facebook等,无一不是经过多年的技术积淀后才勉强能够应付,而12306正式上线运营至今不过短短半年多时间而已
12306系统开始售票那一瞬间,必然有成千上百万的人一拥而上。尽管从铁道部发布的数据来看,其最高的一天一共卖出了188万多张票,这个数据放在一天来看的话,确实不多。但是如果是在短短几分钟之内呢?那整个系统承受的压力自然不言而喻。-IT168http://t.cn/zOLFkHF
由12306.cn谈谈网站性能技术
2012年1月16日 陈皓
http://coolshell.cn/articles/6470.html
春运前夕抢票且票量供远小于求这种业务模式是相当变态的,让几千万甚至上亿的人在某个早晨的8点钟同时登录同时抢票的这种业务模式是变态中的变态。几十分钟内,一个网站能接受几千万的访问量,这很恐怖。据说12306高峰访问是10亿PV,集中在早8点到10点,每秒PV高峰时上千万 via酷壳
酷壳 @左耳朵耗子【程序员,酷壳博主(CoolShell.cn)】:集中式的卖票很难搞定,在各个省市建分站,分开卖票,是能让现有系统性能有质的提升的最好方法。为了那么一两个星期而搞那么大的系统,而其它时间都在闲着,有些可惜了,这也就是铁路才干得出来这样的事了。
@金山 【新浪微博开放平台认证开发者,围脖投票、地震寻人报平安应用作者】 : 声援12306同仁《12306根本没有解决方案,只有优化方法》,看你们辛苦工作却饱受质疑,冒被拍砖之危险特撰此文,希望能熄广大群众之愤火,特别是希望众IT志士能展其所长,对12306提出优化建议。@王津THU
转发(505) | 评论(176) 9月21日11:53 来自新浪微博 weibo.com/kangjinshan
http://weibo.com/1639733600/yCSD7EViX
@战鹰QBQ:淘宝的交易量是大,一天最多能上三千万笔的交易,但一分钟的峰值最多也就5.5万笔,平均的流量也就2万多,火车票一般放号出来最多20分钟就卖光了,一分钟接近10万笔交易,比淘宝的瞬时流量大多了,更不要说淘宝根本不用考虑同一件商品并发购买缺货的问题,卖重复了淘宝退货就可以了。
@王津THU【清华大学Web与软件技术研究中心电子商务研究室主任、高级架构师 王津】 : 有些事情,末学澄清一下:“海量事务高速处理系统”是一种非常特别的系统,应用的场合很少,中国目前研究这种系统的人不多,有真正的实践经验的人更少。多年前末学本人在接触这种系统之前也无法想象“到了某个时刻”系统的性能下降之剧烈乃至崩溃。恳请大家不臆测不轻视类似12306系统的难度。
转发(1743) | 评论(842) 1月11日16:54 来自新浪微博
http://weibo.com/2484714107/y0i3b53dd
@王津THU : 当系统设计负载很高的时候,构架会发生重大的改变,可能变得我们都不认识了,即便在机械设计领域也是如此。此图是一辆载重900吨的卡车,车长42.8米、宽7米,有64个车轮。它两端各有一个驾驶室,里面都有一台电脑。若不是亲眼所见,很难相信会有这样的卡车。
转发(160) | 评论(42) 1月14日19:30 来自新浪微博
北邮高志鹏【北京邮电大学 网络与交换技术国家重点实验室 教师】:12306崩溃有理。想想京东或者淘宝的限时抢购,如此商业的系统虽未崩溃但是已经无法处理交易。 (1月16日 11:08)http://weibo.com/drallen
@周洪波-TSP【福田北斗物联网公司总经理】: 的确,海量数据处理这个词在中国被用烂了,这个系统和数据挖掘、查询类的海量数据处理不一样。它是一个High Performance Distributed Transaction Processing高性能分布式交易处理系统,数据处理不是核心,交易(Transaction)处理是核心。 (1月16日 11:13)
2011-12-12淘宝双12成交额达43.8亿元
(女装超10亿 家居5亿 3C4.8亿 男装超4亿 母婴3.7亿 鞋类超3亿 化妆品超3亿 内衣超2.2亿 全球购超1.3亿 本地化生活服务8k万 淘宝外卖1万单 电影票1万张)
凌晨1st分内,淘宝网瞬间涌入高达270万人,一小时内成交278万笔4.75亿 @21世纪网 http://t.cn/StjfoR