Seznam pomalu spouští druhou serverovnu a v článku Nagano ožívá jsou popsané zajímavé poznatky z této akce – například posun od varianty Šípková Růženka k variantě dvě živé serverovny.
Po přečtení zmíněného článku si říkám, že to musí být naprosto šílené na realizaci a koordinaci a nechtěl bych být v kůži Seznamáků. Ať si říká o Seznamu kdo chce, co chce, jedno se mu myslím vzít nedá – kromě návštěvnosti jsou za ním všichni jeho konkurenti i technologicky a ten odstup je možná daleko větší, než u oné zmíněné návštěvnosti.
Řešení Seznamu obdivuji proto, že děláme v mnohem a mnohem miniaturnější variantě v podstatě stejnou věc – rozkládáme naše weby vždy na dva stroje a tak si snad aspoň trochu dovedu představit, co musí v Seznamu řešit. Pokud celou věc hodně zjednoduším, najdu podobné výhody i nevýhody a pokud v níže uvedením textu zaměním slovo server za serverovna, myšlenka zůstane stejná:
Výhody
Kromě rozložení zátěže je hlavní výhodou vzájemná zastupitelnost těch strojů v případě havárie jednoho z nich. Pokud jeden ze serverů zkolabuje, je otázkou několika vteřin převést jeho provoz na zbývající stroj. Oba servery by měly být výkonné tak, že dočasně stihne odbavovat provoz i jen jeden z nich. Možná bude odezva trochu pomalejší, ale servery pojedou a uživatelům se dá například aspoň dát na vědomí, co se děje. Při jednom stroji není jaksi kam dát na vědomí.
Nevýhody
Kromě dvojnásobných nákladů na hardware a provoz je tu hlavně nutnost udržovat oba servery v naprosto stejném stavu a veškeré zásahy do konfigurací i aplikací dělat na dvou místech a nikdy na to nezapomenout. Mnoho těchto úkonů lze automatizovat, ale prostě člověk musí dávat bacha dvojnásobně. Navíc je třeba veškeré změny kontrolovat na dvou místech.
Dva servery se ve stejné konfiguraci udržet ještě dají, ale udržet ve stejném stavu dvě serverovny se stovkami serverů je myslím úkol nadlidský a dospěli k tomu i v Seznamu, viz článek.
Tak, jako je jiný level rozkládání provozu v podání Seznamu, tak je to ještě vyšší level v podání Googlu a jeho datacenter, to už je asi úplně nad chápání běžného smrtelníka.
A virtualizujete? ;) Kdyby například firma Hostway virtualizovala svou infrastrukturu, tak se jim nemohlo stát to, co se jim v letos v létě přihodilo (http://www.eweek.com/article2/0,1759,2166174,00.asp).
Kdo profesionálně dělá clustering a high availibility, nad informacemi uniklými ze Seznamu může říct jenom WTF! Ono je to hezké, všechno si vyvinout in-house, bohužel podle mých informací se zdá, že na to nemají ani odborně ani kapacitně. Místo, aby své zázemí stavěli plně distribuovaně, mají jakousi nehomogenní směs databází a strojů slepených k sobě. Než aby si v tom udělali nějaký pořádek, raději spouštějí jednu novou službu za druhou. Není dobré založit firmu na hromadě nadšených phpkářů. A teď dělaji kopii chaosu v jiné serverovně. To nemůže dopadnout dobře.
disclaimer: nikoho ze Seznamu neznám, žádné informace o nich nemám, celý můj příspěvek je založen na osobních dohadech, fámách a lžích