Jest niedziela 27.09.2009. Coś koło godziny dziewiątej rano. Jak prawie codziennie wchodzę na Implebot’a żeby sprawdzić jak “się sprawy mają”, a tu przykra niespodzianka. Awaria
Patrząc na komunikat o błędzie chyba chodzi o to, że wysypała się tabela w bazie z adresami email sybskrybentów. Nie jestem pewny – nie znam się dobrze na MySql
Pomyślałem sobie “spokojnie, przecież awarie się zdarzają i na pewno za kilka godzin wszystko będzie OK”. Tyle tylko, że minęło od momentu, w którym zauważyłem awarię około 25 godzin! Wygląda na to, że to jakaś grubsza sprawa. Mam nadzieję, że zespół Implebot’a ma w miarę świeże kopie zapasowe swojej bazy danych bo jeśli nie… aż strach pomyśleć. Jeśli nie i listy subskrybentów ( budowane nieraz przez kilka lat ) zostały utracone uważam, że biznes Piotra Majewskiego stoi pod dużym znakiem zapytania.
Najgorsze chyba jest to, że na oficjalnym forum wsparcia dla tego systemu nie pojawiła się żadna, nawet najkrótsza wzmianka o awarii. Pełen profesjonalizm w oczach klienta
Edit: właśnie przed chwilą ( 11.30 ) system ruszył i listy subskrybentów zostały przywrócone. Oto co napisał na forum Piotr Majewski
Witam,
Wszystko już działa.
Pech chciał, że w trakcie przenosin serwera Ekademii trafiło nam się przeciążenie serwera impleBOT (zupełnie inna maszyna). Po zrestartowaniu usług w nocy z soboty na niedzielę MySQL pozostawił znacznik “crashed” na tabeli subskrybentów. Nie zostały utracone dane, jednak przez dobę obsługa subskrybentów nie działała.
Naprawa trwała 3 minuty – prosta operacja na bazie danych. Problem polegał na jej niezauważeniu, a nie trudności.
Tabela została przed chwilą naprawiona i wszystko już działa. Zwracam też uwagę, że baza danych jest codziennie backupowana.
Awaria trwała tak długo z powodu urlopów – do środy administrator i osoba obsługująca e-maile są na urlopie, a ja rozłożony chorobą w weekend nie zaglądałem do poczty.
Tylko prawo Murphego może wytłumaczyć takie zbieg okoliczności.
W tygodniu, gdy wrócimy do normalnej pracy zastanowimy się jak wynagrodzić Wam tą awarię, za którą jeszcze raz przepraszam.
W tym miesiącu przeprowadzimy też migrację impleBOTa na nowy, mocniejszy serwer, co powinno wykluczyć tego typu przeciążenia.
pozdrawiam,
Piotr Majewski
impleBOT / FreeBOT
Problem polegał na jej niezauważeniu, a nie trudności.
– bez komentarza.


Kategoria
Tagi: 