Archiv pro štítek: seznam

Moje zkušenost s MailChimpem a aktuální kauza s jeho blokací na Seznamu

MailChimp používám už nějaký ten pátek a nejsem si úplně jist, že kritici MailChimpu, kteří hází vinu především na něj, ho někdy použili a znají jeho fungování. Na druhou stranu ani z mé jedné zkušenost nelze vyvozovat, že MailChimp je bez chyb. V této kauze chybovali pravděpodobně oba.

A teď už moje zkušenost se „spamováním“ přes MailChimp

Někdy loni v létě jsem potřeboval oslovit uživatele Slunečnice se slevovou nabídkou v jejím eshopu. Máme tisíce legálně získaných e-mailů od uživatelů Slunečnice, převážně odběratelů jejích newsletterů. Protože ale maily ležely v interním systému, který má nejlepší léta za sebou, bylo nutné je přenést do MailChimpu. Import proběhl bez problémů, rozeslání také a pak to přišlo. E-mail od podpory MailChimpu, okamžitý ban účtu a nutnost hodně podrobně vysvětlovat, proč bylo více jak 30 % mailů nedoručitelných a kde jsem ty adresy vzal. A to podotýkám, že účet byl placený.

Problém byl v tom, že seznam adres byl sbírán mnoho let a spousty se jich stalo nefunkčními. Že tam bude hodně neexistujících adres jsem tušil a naivně jsem si řekl, že mi to aspoň MailChimp pročistí. Nebyl to dobrý nápad :)

Nakonec jsem vše vysvětli a účet dostal zpět, ale ukazuje to, jak MailChimp funguje a jak se snaží, aby přes ně nechodilo nic podezřelého. Je mi proto docela divné, že podle Seznamu chodí z MailChimpu tuny spamu. Spíš si myslím, že mnoho uživatelů Seznamu se někde upíše, pak jim chodí legální newslettery, oni se neumí odhlásit a tak klikají na „je to spam“.

Články k tématu jinde:

Rozkládám, rozkládáš, rozkládáme

Seznam pomalu spouští druhou serverovnu a v článku Nagano ožívá jsou popsané zajímavé poznatky z této akce – například posun od varianty Šípková Růženka k variantě dvě živé serverovny.

Po přečtení zmíněného článku si říkám, že to musí být naprosto šílené na realizaci a koordinaci a nechtěl bych být v kůži Seznamáků. Ať si říká o Seznamu kdo chce, co chce, jedno se mu myslím vzít nedá – kromě návštěvnosti jsou za ním všichni jeho konkurenti i technologicky a ten odstup je možná daleko větší, než u oné zmíněné návštěvnosti.

Řešení Seznamu obdivuji proto, že děláme v mnohem a mnohem miniaturnější variantě v podstatě stejnou věc – rozkládáme naše weby vždy na dva stroje a tak si snad aspoň trochu dovedu představit, co musí v Seznamu řešit. Pokud celou věc hodně zjednoduším, najdu podobné výhody i nevýhody a pokud v níže uvedením textu zaměním slovo server za serverovna, myšlenka zůstane stejná:

Výhody

Kromě rozložení zátěže je hlavní výhodou vzájemná zastupitelnost těch strojů v případě havárie jednoho z nich. Pokud jeden ze serverů zkolabuje, je otázkou několika vteřin převést jeho provoz na zbývající stroj. Oba servery by měly být výkonné tak, že dočasně stihne odbavovat provoz i jen jeden z nich. Možná bude odezva trochu pomalejší, ale servery pojedou a uživatelům se dá například aspoň dát na vědomí, co se děje. Při jednom stroji není jaksi kam dát na vědomí.

Nevýhody

Kromě dvojnásobných nákladů na hardware a provoz je tu hlavně nutnost udržovat oba servery v naprosto stejném stavu a veškeré zásahy do konfigurací i aplikací dělat na dvou místech a nikdy na to nezapomenout. Mnoho těchto úkonů lze automatizovat, ale prostě člověk musí dávat bacha dvojnásobně. Navíc je třeba veškeré změny kontrolovat na dvou místech.

Dva servery se ve stejné konfiguraci udržet ještě dají, ale udržet ve stejném stavu dvě serverovny se stovkami serverů je myslím úkol nadlidský a dospěli k tomu i v Seznamu, viz článek.

Tak, jako je jiný level rozkládání provozu v podání Seznamu, tak je to ještě vyšší level v podání Googlu a jeho datacenter, to už je asi úplně nad chápání běžného smrtelníka.

Čekání na robota

Poměrně častým dotazem v různých diskusích a konferencích je „Za jak dlouho můj nový web zaindexuje Google (Seznam), kdy se dostanu do výsledků vyhledávání?“. Šance na poměrně exaktní změření a nalezení odpovědi se mi naskytla při příležitosti spuštění našeho nového projektu Podnikatel.cz. Ten neměl žádné zpětné odkazy, do spuštění testu byl za heslem a nikdo o něm nevěděl (v okamžiku spuštění mého malého testu ho nepodporovaly ani ostatní naše weby, od pondělí 20. 8. se už odkazy na Podnikatele objevily na našich ostatních serverech).

Jak jsem testoval

Jednoduše. V okamžiku odheslování webu (16. 8. 2007 v 14:45 hod.) jsem adresu www.podnikatel.cz přidal přes standardní rozhraní pro přidávání nových webů na Google, Seznam a Jyxo. A pak už nezbývalo než čekat, co se bude dít.

A nejrychlejším robotem se stává …

Seznam

První se doslova přihnal Seznam a to jeho „Seznam Screen-Shot Generator“ (14:45:15), který pořídil obrázek titulky. Hned vzápětí dorazil i klasický Seznambot (14:45:39). Ten se se mrkl na robots.txt a spokojeně odešel.
Vrátil se pak o den později a mezi 02:19:31 a 02:29:01 stáhl 22 různých stránek. A přesně těchto 22 stránek se o další den později, tj. 18. 8., objevilo ve výsledcích vyhledávání (konkrétně okolo 03:30 hod.) Seznam tak v rychlosti indexace porazil zbylé dva soupeře na hlavu – zatímco oni ještě své roboty ani neposlali na obhlídku, Seznam už zobrazoval nový server ve výsledcích vyhledávání.

Ti další

Yahoo!

Jako druhý se dostavil robot Yahoo, kterého jsem ani „nezval“ a nevím, kde na adresu přišel. Okolo ale brousil už při zaheslovaném webu. Yahoobot dorazil 16. 8. v 17:18:58 a rovněž jen mrkl na robots.txt. O dva dny později ho doplnil další robot Yahoo identifikující se jako „Yahoo-MMCrawler/3.x“. Roboty Yahoo se pak vracely pravidelně a k dnešnímu dni už Yahoo ve výsledcích vyhledávání zobrazuje 71 stránek. Škoda, že význam Yahoo je pro česky psané stránky naprosto zanedbatelný.

Centrum

Třetí přispěchalo Centrum se svým Morfeem a to 17. 8. v čase 10:18:22. Podíval se na robots.txt a odešel. Morfeo jsem rovněž „nezval“ a vzhledem k jeho (ne)významu nadále ani nesledoval.

Microsoft

Hned za Morfeem dorazil Microsoft se svým MSNbotem a to v 10:45:26. Podíval se na robots.txt a titulní stranu. Za necelé dvě hodiny se vrátil a pak se vracel víceméně pravidelně po celý den pro různé stránky webu. V dalších dnech MSN indexoval (a indexuje) jak zběsilý a ve výsledku vyhledávaní již má titulku.

Google

Konečně dorazil dlouho očekávaný host – Google a to 21. 8. v 01:04:24. Google si stáhl titulku a zmizel. Od té doby se poměrně pravidelně vrací pro titulní stranu, ale dál se nepouští. Ve výsledku hledání nemá zatím žádnou stránku z Podnikatele.

Jyxo

Jako poslední ze třech pozvaných dorazilo Jyxo (22. 8. 03:01:22). Stáhlo robots.txt a asi deset stránek. Ve výsledcích vyhledávání je od 22. 8. od cca 23:30 jeden dokument – titulka.

Závěr

Nejrychlejší jak v poslání robota na nový web, tak v přidání stránek do výsledků vyhledávaní je jasně Seznam, což je pro mě příjemné překvapení. Google i Jyxo jsou na tom cca týden po spuštění webu skoro stejně – neví o webu nic. Yahoo či MSN indexuje ostošest i bez „ruční“ pozvánky.
Z tohoto testu nelze dělat samozřejmě žádné obecné závěry, nicméně rychlost Seznamu je zřejmá, stejně jako jistá ležérnost Jyxa a Google. Na druhou stranu ale rychlost robotů není to podstatné, podstatné je to, jak na tom budou zmíněné vyhledávače za měsíc či za půl roku a kolik lidí budou Podnikateli vodit.