epic fail.part 2

Совсем недавно, около 10 дней назад, по сообщению Interfax, конденсатом залило сервера, на которых хранились заявки граждан на получение загранпаспортов.  Ничего страшного, бывает. Жара. Смешно  другое, что в результате, система простояла не менее 5 дней. Итак, у вас есть система, заказчиками которой являются все жители страны старше 16 лет, при этом каждый заказчик платит вам 2500р ($83)  за паспорт...но у Вас все-таки не хватает денег на резервную систему и даже  нормальный кондиционер. При общей стоимости системы не менее 200 млн рублей.   Раз система простояла 5 дней, то вряд ли они ее восстаналивали из backup -это заняло бы гораздо меньше времени. Скорее всего (это мое предположение), собирали заново, недостающее пересканировали..

Ok, можно украсть и разворовать все что угодно, но сделать резервную  систему изо всякого хлама стоит совсем недорого. Сейчас многотерабайтный NAS стоит несколько тысяч рублей.  Навтыкать дисков в Linux машинку и  поднять Openfiler - делов на пару часов. Складывать там резервные копии - простейший скрипт. Но, см. например сюда:  "70 баз работают 8 лет в режиме noarchivelog, при сбое носителей простой базы может дойти до 3-х дней , естественно с потерей данных за последний день, мало того даже холодные бэкапы не делаюся, делается полный экспорт базы, из которого база (90 Гб) восстанавливается 30 часов. Это всех устраивает!". Без комментариев. Дело не миллионах рублей и дачах, построенных на эти деньги. Дело все-таки в отношении к своей работе...

PS Ну  а пока вспомните, когда последний раз вы пробовали восстановиться, из того, что вы считаете своим backup :))  Так, на всякий случай, чтобы про вас не написали в газете.....

9 комментариев:

  1. за пять дней можно было до ближайшего пирата доехать и купить базу

    ОтветитьУдалить
  2. Анонимный30/8/10 9:25 AM

    Уважаемый Дмитрий
    не все базы работают в ArchiveLog

    Например для DWH это противопоказано, соответственно важно разобраться в предмете, прежде чем публично критиковать.

    ОтветитьУдалить
  3. > для DWH это противопоказано

    Это почему ? Поясните пожалуйста! Вот у меня был опыт работы с многотерабайтной (20 Tb) DWH в archivelog....

    Staging может работать без archivelog, пожалуйста, время полного восстановления тут измеряется часама, но сама DWH - я не понимаю пока почему.

    ОтветитьУдалить
  4. Ilya Vetyugov30/8/10 12:30 PM

    > для DWH это противопоказано
    Это наверное, для тех т.н "DWH", где новые записи возникают следующим образом - тупо делается truncate таблиц и потом в них производится полная заливка многих гигабайт данных. А потом еще иногда "DWH developers" жалуются, что в этой новой версии oracle медленнее всё работает, вот раньше быстро было...Есть такие имплементации.

    Thanks,
    ___
    Ilya

    ОтветитьУдалить
  5. все админы деляться на две категории: те кто делают бэкап и те кто его будут делать

    http://www.youtube.com/watch?v=GHqyivkq66w&feature=player_embedded
    вторую часть ролика не смотрите, там про субд конкурентов, а первая половина ролика теперь и вам будет близка, поскольку оракл с 1с подружились :)

    ОтветитьУдалить
  6. Анонимный30/8/10 5:46 PM

    Скорее всего так и было, архивные логи и резервное хранилище просто отсутствовали как класс.
    архивные логи для OLTP систем подобного класса вообще must have. Не иначе DBA "взяли" с военной кафедры или за копейки студента наняли, отсюда и предсказуемый результат

    ОтветитьУдалить
  7. Анонимный31/8/10 11:53 AM

    >> можно было до ближайшего пирата доехать
    >> и купить базу

    Правильно. Ребята просто бекапились "на Горбушку" :^) Действительно, зачем нужен бекап, если у каждого дурака и так есть актуальная копия? :^)

    ОтветитьУдалить
  8. Анонимный2/9/10 6:51 PM

    Дима, ну это ж северный Гондурас, ты же знаешь :)
    А если по делу - сейчас нет особенной проблемы даже для 60-100Тб базы держать 1-2 стендбая ( стоимость железок ну даже два стендбая, даже если это кластера ну тысяч в 50-100$ выльется), и совершенно спокойно оно живет при генерации 1-2Тб журналов в сутки. И по самой обычной гигабитной сетке ходит в SAN с asm :)
    PS. Памятуя 8i, бэкапы надо каждый раз в тестовом порядке ресторить :)

    ОтветитьУдалить
  9. Суды у нас в крае тож работают без архивлогов и бэкапов, в результате дважды с помощью бубна и чудес небесных восстановливал данные. Но новая версия, приезжают умельцы и создают все с нуля и снова noarchivelog.

    ОтветитьУдалить