Exadata better than EMC

Must read вот этот пост


Чтобы было понятен контекст, Kevin работал с 2007 года в Exadata dev team, и считается многими ведущим экспертом по Exadata. В этом году он перешел в EMC и…по прошествии нескольких месяцев начинает писать про Exadata совершенно с другой стороны. Ничего не напоминает ? Вы конечно удивитесь, но он делает примерно тоже самое что вы можете видеть в этом блоге – берет скриншот и его разбирает. Почему случился такой переворот ? Причина проста - дело в том, что этот слайд со всем его булшитом начинают показывать заказчики и задавать вопросы – вот как вы это объясните ? И в какой-то момент это достает и уже хочется написать ответ.

Попробуйте прочитать пост Kevin в оригинале. Если не получается, далее идет очень вольный пересказ  c моими комментариями, для занятых. Важно, что на слайде Exadata сравнивается с EMC Storage  c решением для OLTP. EMC имеет технологию GreenPlum, c которой и следовало бы сравнивать Exadata (и которую она скорее всего победила бы).

Теперь по пунктам:

1.5 mln IOPS и тут же следующей позицией идет Hybrid Columnar Compression (HCC). Во первых цифра 1.5 mln IOPS была получена на данных без компресси, во вторых HCC не может использовать в OLTP, потому что это будет крайне медленно да и Exadata при попытке обновить запись будет переносить ее  в другой блок, без HCC. Тут мы видим смешение возможностей OLTP и DWH.

Average Database Compression Factor – о, этой новый слоган.  Сергей Данилов придумал этот термин за месяц до маркетинга Oracle и был на этом пойман -)  Мы об этом много писали вот тут. Нет никакого average database compression. Turkcell что только не делал чтобы влезть в нужный им объем, в том числе часть данных просто не переносил.  x10 это в лучшем случае для отдельных таблиц, да еще и с предварительной сортировкой данных перед загрузкой.  И еще раз, HCC не применимо к OLTP.

Database bandwidth, чтобы получить впечатляющую цифру, просто умножили на 10 (компрессию) реальную производительность дисков. Выше, HCC не принимимо к OLTP.

Database cache usable capacity – тут помимо того, что Database Cache это то что на стороне СУБД, вместо 5 Tb опять таки умножают на 10.

У меня был праздник когда я прочитал этот пост. То что я делал в течении последнео времени  оказывается также беспокоит людей из (ex) oracle dev –булшит в презентациях. Полное перемешивание возможностей для OLTP и Warehouse. Следующий пост будет об этом.

У Oracle прекрасный продукт предназначенный для построения хранилищ, но compensation заставляет придумывать совершенно сумасшедшие схемы подачи материала. Такого 'салата' в презентациях Oracle не было еще никогда.

Прошу прощения за трэш в комментариях в этом блоге – теперь все не по-делу будет просто удаляться.  Вы можете также увидеть пример такого же трэша и у Kevin, когда кто-то (из индии?) пишет ему – ‘чувак, да ты не разбираешься’ -)))

Update 1. Чистое совпадение, что Kevin хвалит IBM вот тут..просто алеверды, ничего более -))

57 комментариев:

  1. Дима, на самом деле у наших слушателей тоже идиосинкразия на такие маркетинговые слайды. И мы их на презентациях не показываем. Поэтому это круто, что ты их препарируешь, но ты наверное единственный, кто их показывает :)

    Если разобраться, то все цифры там правильные, или теоретически возможные при соблюдении ряда условий о которых ты говоришь (что данные сожмутся в 10 раз и т.д.)

    Заказчиков интересует простая вещь - что именно они получат, со своим приложением или хранилищем от Экзадаты. И тут подобные слайды не аргумент, потому что уж очень много нужно объяснять про каждую цифру.

    ОтветитьУдалить
  2. >И мы их на презентациях не показываем

    Это за гранью добра и зла. Берем

    http://mrivkin.narod.ru/pres/Mark_Exadata_CBD1.7z

    Май 2011,

    Слайд 29

    Для OLTP-систем

    * Smart flash кэш обеспечивает 1 млн операций ввода/вывода
    в секунду
    * Сжатие в 50x для архивных данных

    Не ввода- вывода, а операций чтений по 8k. У вас OLTP - это то что только читает ?

    50x не будет работать для OLTP, я написал в посте почему.

    Все вы показываете.

    ОтветитьУдалить
  3. Не буду комментировать чужую презентацию, ты это делаешь лучше. Или автор пусть комментирует.
    Тем более, я думаю, что есть примеры когда все это так.

    Но я еще раз говорю - в реальности заказчиков интересуют не абстрактные (хотя и возможно достижимые) цифры, а влияние на их собственные приложения. И разговор ведется о том, что у них есть, насколько их собственные данные сжимаются и проч.

    А еще лучше - провести тестирование и посмотреть, что происходит на самом деле.

    Ты можешь привести реальные цифры из реальных проектов по Экзадате?

    ОтветитьУдалить
  4. Какой он невоспитанный этот Кевин! Да как он смеет ловить Оракл на булшите и тем более писать об этом!? Ведь это же очевидно, что заказчик просто обязан занести деньги Ораклу просто за то, что это Оракл. А тем кто требует каких-то нелепых доказательств - Данилов рассмеется в лицо и проигнорирует :))

    ОтветитьУдалить
  5. Анонимный24/7/11 12:35 PM

    *** надевая маркетинговую маску ***

    А мне нравится. Отличный слайд. Булшита в упор не вижу.

    Главное, убедительно отвечает на вопрос почему Oracle круче.

    Находка для любого "маркетингового дроида" -- типа меня :^)



    *** снимая маркетинговую маску ***

    Примитивные сравнения не работают.

    Контекст -- король в королевстве правды. Нет контекста -- нет правды.

    А на английском еще лаконичнее: In the kingdom of truth, context is king.

    Написал небольшое эссе о невозможности сравнения в комментариях к предыдущему посту. Даже тесты TPC уже ничего не сравнивают. У Кевина тоже красиво написано про TPC-C.



    *** а в это время ... ***

    Правильные пацаны проводят правильные семинары и фоткаются на фоне Exadata:

    http://www.igormelnikov.com/2011/07/rac-is-simple-taf.html

    ОтветитьУдалить
  6. >Тем более, я думаю, что есть примеры когда все это так.

    Я понял в чем проблема - ты все таки на стал читать Kevin'а. Основная проблема не в цифрах и их достижимости, а в том что на одном слайде через строчку перечисляют цифры, относящиеся к разным типам систем: к OLTP & DWH. Говорят что достигают 1 mln IOPS и тут же что 10-кратное сжатие. Сами по себе цифры по отдельности - да, понятные, но вот что оказывается за кадром что вместе они не работают в Exadata и бессмысленны в реально жизни. 1 mln IOPS недостижим на сжатых данных в Exadata, только на несжатых. Если у тебя банковская система у тебя ну просто нет данных которые стоило бы сжимать в 50 раз ради хоть чего-нибудь. Partitioning решит все твои проблемы и так. А если у тебя хранилище то тебе кол-во IOPS на чтение по 8K бессмысленно, у тебя размер чтения 1 Mb минимум (в реальности на порядок больше), а это значит что у тебя на 2 порядка меньше IOPS.
    Не знаю, смог ли пояснить, Kevin по моему написал исчерпывающе ясно.

    ОтветитьУдалить
  7. >надевая маркетинговую маску
    Мы стараемся избавиться от булшита в комментариях ты его продолжаешь привносить. Обижаешь, да ?

    ОтветитьУдалить
  8. Анонимный25/7/11 12:04 AM

    Ну а на слайде нигде не говорится, что эти бенефиты должны достигаться все одновременно и в любых комбинациях :^)

    На слайде просто говорится что такaя-то метрика на Exadata может достигнуть такого значения, я на традиционном storage от IBM этой метрики нельзя достигнуть.

    Что там достижимо или не достижимо в реальной жизни -- читаем истории успеха :^)

    Мне это слайд реально начинает нравиться! Я его как-то раньше не замечал...

    ОтветитьУдалить
  9. >на традиционном storage от IBM
    storage от E-M-C, нe I-B-M, это разные компании, но ты все равно путаешь. Ужос. И эти люди продают Oracle...

    ОтветитьУдалить
  10. Анонимный25/7/11 12:15 AM

    Это единственная придирка к написанному?

    Для меня просто EMC, IBM, Hitachi, Netapp -- одна хрень :^)

    Искренне прошу прощения за перепутку.

    ОтветитьУдалить
  11. Анонимный25/7/11 12:16 AM

    "Ну а на слайде нигде не говорится, что эти бенефиты должны достигаться все одновременно и в любых комбинациях "
    Сильный аргумент. Детский сад.

    ОтветитьУдалить
  12. >Для меня просто EMC, IBM, Hitachi, Netapp -- одна хрень :^)

    О, теперь многое становится понятным. Видимо коллеги тоже не видят разницы -)))
    http://dsvolk.ru/oracle/oracle_uk_fr.jpg

    ОтветитьУдалить
  13. Анонимный25/7/11 12:26 AM

    Почему детский сад? Самое оно.

    Ну если бы у Вас был продукт, который бъет конкурирующий продукт по каким-то отдельным параметрам, но не по всем одновременно, то Вы бы какой слайд нарисовали?

    По-моему, суперский и весьма понятный слайд -- возьму слайд на вооружение. Буду показывать и говорить, что Exadata забивает традиционный storage по всем направлениям :^) При этом, естественно, скажу, что пожалуйста не думайте, что не все бенефиты можно достигнуть одновременно. И обязательно дам сслыку на блог Димы Волкова, где объясняется какие именно комбинации не возможны одновременно. Все будет по правде и честно. Как дима хотел :^)

    P.S. В Англии буду использовать ссылку на блог Кевина Клосоона -- они просто по-русски не бум-бум -- а так отличные ребята! :^)

    ОтветитьУдалить
  14. Анонимный25/7/11 12:40 AM

    >> О, теперь многое становится понятным.
    >> Видимо коллеги тоже не видят разницы -)))
    >> http://dsvolk.ru/oracle/oracle_uk_fr.jpg

    Кто-то клялся и божился что треша в комментариях больше не будет :^)

    Ну да, иногда путаю Словению и Словакию, иногда путаю Австрию с Австралией, иногда путаю IBM и EMC (оба слова из трех букв) :^)

    Искренние извинения за оскорбление корпоративных чувств.

    P.S. Картинка по ссылке хостится не на сайте Oracle и лекго получается из оригинальной картинки даже без использования фотошопа :^)

    ОтветитьУдалить
  15. Анонимный25/7/11 1:23 AM

    >> Какой он невоспитанный этот Кевин!
    >> Да как он смеет ловить Оракл на булшите...

    Apex,

    Кевин Клоссон и Дмитрий Волков -- это наше все. Не лапайте пожалуйста этих двух кристально честных сотрудников EMC и IBM своими грязными руками!

    В блогах Квина и Дмитрия содержатся ценнейшие знания о недостижимости некоторых бенефитов Exadata одновременно. Вы только подумайте, что может случиться, если заказчик купит Database Machine исключительно ради использования HCC под OLTP и т.п. Будет кошмар!

    А эти ребята все четко разложили по полочкам.

    Я в понедельник первым делом звоню в маркетинг Oracle, чтобы под русской версией слайдов мелким шрифтом шло объяснение Дмитрия... Нет, лучше даже не так. Мы поставим перед каждой презентацией по Exadata отдельный слайд, где будет скриншот всего поста, чтобы правда осталась в нетронутом, оригинальном виде.

    Все презентации теперь обязаны будут начинаться с этого ключевого для Oracle слайда. Ведь не дай Бог, чтобы кто-то из заказчиков с OLTP приложением вдруг включит HCC. Мне даже страшно подумать что случится... Наверное, значение IOPS станет таким маленьким, что провалится буквально через пол и уйдет под землю!

    P.S. Дим, чур комментерий нет стирать! Я не первым начал!!! :^)

    ОтветитьУдалить
  16. Дима, да все я прочитал. Только ты опять начинаешь с критики одного слайда (EMC vs Exadata), я тебе говорю, что мы эти слайды не используем, ты вытаскиваешь из чулана какой-то совершенно другой слайд (причем без комментария докладчика непонятно что он имел в виду) и начинаешь радостно мне в него тыкать.

    Мне кажется, что тебе все-таки надо определиться для себя, что ты в своих постах критикуешь?

    1. Технологии Oracle
    2. Глобальный маркетинг Oracle
    3. Локальный маркетинг Oracle
    4. Локальных консультантов Oracle

    Мне кажется, что ты думаешь, что бьешь по пунктам 1 или 2, а все время выходишь на 4.

    И еще раз, эти цифры у нас в стране никому не нужны, кроме тебя. Всех интересует будет ли их DWH на Экзадате работать быстрее и во сколько раз. И соответствует ли это запрашиваемым за нее деньгам. Все. Average Compression Factor - это от лукавого и все, кроме тебя, это понимают :)

    А про Клоссона я уже тоже говорил - ему никто не мешал критиковать маркетинговые слайды и раньше. Благо он про Экзадату знает больше, чем мы все вместе взятые. И слайдов он таких видел тонны, так как в штатах они постоянно используются. Однако же глаза у него открылись, только когда он в EMC работать перешел. Не люблю я таких людей.

    Лучше Монаша почитать, он хоть по делу критикует.

    ОтветитьУдалить
  17. >Мне кажется, что тебе все-таки надо определиться для себя, что ты в своих постах критикуешь?

    Это пост Kevin Closson, я сделал комментарии к нему, что-то вроде неавтоизованного перевода. Задай этот вопрос Kevin.


    >я тебе говорю, что мы эти слайды не используем, ты вытаскиваешь из чулана какой-то совершенно другой слайд

    Май 2011 года, автор прекрасно известен. на слайде тот же текст. Слайд, да другой. Текст - тот же. HCC в OLTP системах. Ты его смотрел ?

    >И еще раз, эти цифры у нас в стране никому не нужны,

    Зачем вы их показываете ?

    ОтветитьУдалить
  18. Анонимный25/7/11 5:35 PM

    > "У Oracle прекрасный продукт предназначенный для построения хранилищ"

    Exadata - прекрасный продукт для любых типов нагрузок, как OLAP, так и OLTP.

    Это не маркетинг, а практика.

    СУБД Oracle быстрее всего работает именно на Exadata. Существенно быстрее, чем на каких-нибудь, скажем IBM p-Series.

    ОтветитьУдалить
  19. >Это не маркетинг, а практика.
    Ссылка, описание этой практики ?

    >Существенно быстрее, чем на каких-нибудь, скажем IBM p-Series.
    Ссылки на тесты ? Нужны цифры, пожалуйста.

    Буду очень благодарен.

    ОтветитьУдалить
  20. Анонимный25/7/11 6:24 PM

    >СУБД Oracle быстрее всего работает именно на Exadata.
    За счет чего?

    ОтветитьУдалить
  21. Анонимный25/7/11 6:25 PM

    > Ссылка, описание этой практики ?

    Да в каждом тендерном тестировании IBM уступает по производительности.

    Превосходит только по цене.

    ОтветитьУдалить
  22. Анонимный25/7/11 6:50 PM

    А чем турецкий опыт не устраивает?

    http://dsvolk.blogspot.com/2010/11/turkcell-250tb-exadata.html

    Информации достаточно. Ну можно спорить во сколько раз реально сжалось -- в пять или в десять. Фундаментально, возможен такой результат на традиционном железе? Наверное нет.

    Можно ли добиться того же самого результата на Netezza и Teradata? Наверное можно, но все придется переписать с нуля.

    ОтветитьУдалить
  23. Анонимный25/7/11 7:00 PM

    >>СУБД Oracle быстрее всего работает именно на Exadata.

    > За счет чего?

    Exadata, это система, спроектированная для оптимальной работы СУБД Oracle.

    Добро пожаловать в представительство Oracle, там вам с удовольствием расскажут об устройстве Exadata.

    ОтветитьУдалить
  24. >Фундаментально, возможен такой результат на традиционном железе? Наверное нет.
    Как раз фундаментально и возможен. В сжатии нет ничего экзадатовского, то что Оракл по маркетинговым соображениям запретил использовать эту фичу везде кроме экзадаты, к фундаментальности отношения не имеет, в бете 11.2 оно без экзадаты работало.

    >Netezza и Teradata? Наверное можно, но все придется переписать с нуля.
    На счет Netezza не скажу, хотя склонен думать, что много переписывать не придется. На счет Терадаты - ничего там не придется переписывать с нуля, точно так же как и не пришлось что-то с нуля переписывать самому Ораклу, когда они в 9-й версии впервые сделали функционал компрессии - просто внесли изменения в слой работы с блоками данных.

    ОтветитьУдалить
  25. Анонимный25/7/11 7:17 PM

    >> За счет чего?

    >Exadata, это система, спроектированная для оптимальной работы СУБД Oracle.

    - Грузины лучше, чем армяне!
    - Чем лучше?!
    - Чем армяне!

    ОтветитьУдалить
  26. >Да в каждом тендерном тестировании IBM уступает по производительности.

    Четко, технически выверено, анонимно. Уважаю вашу позицию.

    >Добро пожаловать в представительство Oracle, там вам с удовольствием расскажут об устройстве Exadata.

    Спасибо, если вы не против, я зайду.

    ОтветитьУдалить
  27. Анонимный25/7/11 8:45 PM

    >> В сжатии нет ничего экзадатовского,
    >> то что Оракл по маркетинговым соображениям запретил использовать
    >> эту фичу везде кроме экзадаты

    Exadata это немного больше чем HCC, ну да ладно.

    Интересный момент: По приведенной Дмитрием ссылке Кевину сказали:

    “The unfairness is maybe in the fact, that we just offer HCC only on Exadata, although it would have been technically possible to do HCC on any storage.”

    И Кевин ответил:

    "HCC is an intrinsic database feature but Exadata happens to support decompression in storage".

    Он также пишет в другом посте: "Data compressed with Hybrid Columnar Compression (HCC) is decompressed in the Exadata Storage Servers when accessed via Smart Scan".

    То есть в реальной production версии Exadata технология HCC все-таки 'привязана' к железу.

    Или я не в контексте? :^)



    Почему при миграции хранилища с Oracle на Teradata Вы говорите что не надо переписывать приложение я честно говоря не понял.

    ОтветитьУдалить
  28. >Или я не в контексте? :^)
    А, понятно. Это я не в контексте:)
    Я вообще неправильно понял весь пост, извините:)
    Я думал речь идет именно о HCC и о том, что якобы такого рода сжатие можно получить только в Exadata. Отсюда и мои аргументы, в новом контексте абсолютно неподходящие. Про переписывание - я опять же совсем не то имел в виду, разумеется при миграции с Оракл на Teradata нужно вносить изменения, порой весьма серьезные, вплоть до полного переписывания с нуля. Хотя у меня и есть опыт перенеса отчетности, при этом почти вообще ничего не меняя, я все же не сторонник такого подохода.

    >То есть в реальной production версии Exadata технология HCC все-таки 'привязана' к железу.
    И все же ничего не мешало сделать реальную продакшн версию с распаковкой и упаковкой на обычном Оракле, повторяю, как это было в бета-версии. Ну... разве что нагрузка на процессоры бы возросла, но это фигня, нагрузку можно распределить.

    ОтветитьУдалить
  29. >То есть в реальной production версии Exadata технология HCC все-таки 'привязана' к железу.
    в 11.2 beta появилась возможность сжать данные колоночным методом. В 11.2 эту возможность оставили только если табличное пространство лежит на exadata. Exadata использует для чтения данных библиотеку из состава БД, чтобы понимать структуру блока. Все вышеперечисленное - это ПО и может работать на любом железе. Специально ограничено, чтобы работать только на Exadata. Привязка у железу -это у Netezza.

    ОтветитьУдалить
  30. Дима, ладно, не важно, что там Марк написал. Но я уверен, да и ты тоже, что Марк представляет чем OLTP от OLAP отличается. Так что если он написал про HCC в контексте OLTP, значит была какая-то задумка.

    У меня другой вопрос. Может я тебя неправильно понимаю в течение всех этих последних постов&

    Вот скажи мне, какова мораль конкретно этого поста? Что ты хотел сказать? Можно это выразить в двух-трех предложениях? Может проблема в том, что мы по разному понимаем, что ты хотел сказать?

    ОтветитьУдалить
  31. >про HCC в контексте OLTP, значит была какая-то задумка.

    Ни ты ни я ее не понимаем. Это интересно...

    >Можно это выразить в двух-трех предложениях?
    В двух не получится. в 10 получится.

    Многие заказчики Oracle понимают презентации буквально - если сказано что система умеет делать 1 mln операций ввода-вывода и сжимать данные в 10 раз, то значит так оно и есть. Заказчик ставят предлог "и", а не "или". Они ожидают что OLTP будет работать в 100 раз быстрее а данных будет в 50 раз меньше. Это явно следует из слайда.

    it is all about a customers. Много людей потеряет работу если им привезут Exadata и забудут рассказать про тонкости предлогов и что делать с RAC. Вы не чувствуете своей ответственности за это, я чувствую. Я, Мельников, Данилов 3 года учили людей работать с RAC, сейчас в презентациях об Exadata написано просто - support OLTP. Ответственность перед заказчиками. Это важно. За словом support стоит два дня обучения и возможно месяцы работы, что значит этот support. Что 1 mln IOPS только на чтение, но не на запись, на запись в 100 раз меньше(!?). Что сжимать HCC данные OLTP нельзя. Это был пример. Надеюсь понятный.

    ОтветитьУдалить
  32. >Многие заказчики Oracle понимают презентации буквально - если сказано что система умеет делать 1 mln операций ввода-вывода и сжимать данные в 10 раз, то значит так оно и есть.

    Знаешь, по своему опыту последнего года я наоборот наблюдаю, что заказчики не верят ни единому слову. И никто год назад послушав презу по Экзадате не говорил - "О, круто, хочу!"
    Сейчас стало полегче, потому что мы накопили кое-какой опыт работы с приложениями, плюс пошли первые продажи и заказчики стали немного с большим доверием относиться. И то они доверяют реальным примерам из жизни. И положительным и отрицательным.
    Цифры, которые ты критикуешь - не вызывали и не вызывают никаких эмоций.

    Так что спасибо за заботу о наивных заказчиках, но в случае Exadata - проблема совсем не в их доверчивости, а как раз в излишней недоверчивости.

    Ты ведь работал в Oracle, неужели ты не помнишь, как тяжело идет переход на новые версии базы, например? А по твоей логике, как только выпускается новый релиз, все на следующий день начинают на него мигрировать, как какие-нибудь маководы. Было такое?

    Наш заказчик - скептик.

    ОтветитьУдалить
  33. >Много людей потеряет работу если им привезут Exadata и забудут рассказать про тонкости предлогов и что делать с RAC. Вы не чувствуете своей ответственности за это, я чувствую.

    Как говорит ваш бывший с Даниловым начальник - "В России про RAC знает каждая собака" (Вольный перевод)
    И это действительно так. Спасибо вам за семинары, вы действительно просветили общественность на темы, что RAC это хорошо, и что RAC нужно использовать с осторожностью иногда. Так что никто не ожидает, что RAC это щелчок выключателя и приложение в нем заработает.

    Странно Дима, ты за год так оторвался от реальности. Заказчики-то не изменились, а ты их почему-то стал считать наивными. Может в IBM они такие, верят каждому слову?

    Другие вопросы возникают при продвижении Экзадаты, совсем не те, о которых ты говоришь.

    ОтветитьУдалить
  34. Привет,

    оба вендора - как ЕМС так и Оракл - не являются производителями этих плат, а покупают флеш-устройства у их реальных производителей, вероятно, у LSI, RICOH:

    http://www.ricoh.com/LSI/product_pcif/pcc/5c833/index.html.

    Затем, отобрав лучшее путем нагрузочных тестов используют эти устройства в своем оборудовании. Таким образом, с большой долей вероятности и у ЕМС и у Оракла будут стоять самые лучшие девайсы, показывающие примерно одинаковые характеристики производительности.



    Разница между ЕМС и Ораклом в том, что ЕМС не знает какие данные ему лучше кешировать, а какие - не кешировать. А Оракл - точно знает.

    В результате, ЕМС будет кешировать redo, которое составляет половину всего В/В в базе данных, а Оракл - нет. ЕМС будет кешировать сортировки (которые пишутся в ТЕМР), а Оракл - нет. ЕМС будет кешировать операции многоблочного чтения и записи, а Оракл - нет.
    ЕМС будет кешировать операции бэкапа, а Оракл - нет.
    В результате, кеш ЕМС будет минимум наполовину (redo), если не на 3/4 или 5/6 забит бесполезными данными, что понижает эффективность кеширования и увеличивает нагрузку на стородж-процессоры, которые тысячи раз в секунду должны решать какие блоки следует вытеснить из кеша, чтобы найти очередной свободный блок под интенсивно льющиеся данные (недостатки write-back).

    Я так думаю, что если бы оборудование ЕМС кешировало данные лучше, чем сам Оракл,
    то Оракл просто поставил бы это оборудование в Экзадату взамен своих серверов хранения.

    ОтветитьУдалить
  35. Анонимный26/7/11 3:17 AM

    Этот комментарий был удален администратором блога.

    ОтветитьУдалить
  36. Анонимный26/7/11 4:17 AM

    Этот комментарий был удален администратором блога.

    ОтветитьУдалить
  37. >Комментарий удален
    Я просил держаться темы поста.

    ОтветитьУдалить
  38. >ЕМС не знает какие данные ему лучше кешировать, а какие - не кешировать. А Оракл - точно знает.

    Верно

    >ЕМС будет кешировать redo а Оракл - нет
    Это значит что как только redo попадут в кэш массива массив ответит БД что записать прошла, а Oracle придется записать на диск который делает 200 IOPS, что на порядок медленнее. Я не прав ?

    ОтветитьУдалить
  39. Анонимный26/7/11 11:26 AM

    >> Oracle придется записать на диск который делает 200 IOPS, что на порядок медленнее. Я не прав?

    оригинальное архитектурное решение: всего один шпиндель под redo, и это в большом шкафу, плотно набитом дисками! :)

    ОтветитьУдалить
  40. > Это значит что как только redo попадут в кэш массива массив ответит БД что записать прошла, а Oracle придется записать на диск который делает 200 IOPS, что на порядок медленнее. Я не прав ?

    1) Дим, а зачем для redo-log большое кол-во IOPS?

    2) Зачем кэшировать то, что в большинстве случаев будет прочитано только 1 раз - архиватором?

    ОтветитьУдалить
  41. Анонимный26/7/11 12:16 PM

    >> >ЕМС будет кешировать redo а Оракл - нет
    >> Это значит что как только redo попадут в кэш массива массив ответит БД что записать прошла

    массив ответит, что запись прошла, только когда данные полностью отзеркалятся в кэш резервного storage-процессора. задержки, вероятно, будут меньше, чем при записи на диск, но, учитывая последовательную запись, и к тому же скромные размеры кэша (который надо к тому же ещё и уполовинить для принятия копии от соседнего SP) кэширование LUNов с redo приведет к совсем неоптимальному использованию кэша массива.

    ОтветитьУдалить
  42. >а зачем для redo-log большое кол-во IOPS?

    Если у нас OLTP система я ожидаю что она делает ~60/40 чтений/записей а также большое кол-во commit. По commit LGWR будет сбрасывать на диск redo logs entires из redo log buffer на диск. Производительность записи OLTP напрямую зависит от скорости commit, а именно как быстро сможет LGWR записать на диск. Если взять какой-нибудь TPC-C тест Oracle (например по super cluster) ты увидишь что под redo выделяют отдельные группы, иногда даже массивы. Так вот, массив отвечает Oracle что запись прошла когда она помещается в кэш массива, те в энергонезависимую память. REDO в Exadata храняться ...где-то среди прочих дисков, и на этих же дисках храняться и данные, которые могут интенсивно читаться в тот же момент времени. При записи в redo у Exadata нет кэша и придется записать на физический диск, что на порядок медленннее чем записать на диск массива.

    Если у нас DWH или Read Only OLTP система то у нас нет перечисленных ваше проблем.

    >Зачем кэшировать то,
    Кэш дискового массива выполняет 'отложенную' запись, что является ключевым фактором для производительности OLTP, которая много пишет данных.


    Имеет смысл все вышесказанное ?

    ОтветитьУдалить
  43. >когда данные полностью отзеркалятся в кэш резервного storage-процессора.

    Вам виднее, я таких слов не знаю

    >задержки, вероятно, будут меньше, чем при записи на диск,

    Я видел случай когда у массива закончилась батарейка в кэше, банковская система 'встала'. Поставили батарейку - все поехало дальше. Так что я думаю что задержки будут таки да, меньше.

    ОтветитьУдалить
  44. >Другие вопросы возникают при продвижении Экзадаты, совсем не те, о которых ты говоришь.

    Конечно, я говорю о заказчиках/решениях, ты о продвижении. В этом и разница.

    ОтветитьУдалить
  45. Exadata User26/7/11 6:03 PM

    2 Dmitry Volkov

    > а Oracle придется записать на диск который делает 200 IOPS, что на порядок медленнее. Я не прав ?

    Дмитрий, конечно, вы не правы.

    В Exadata storage cells есть кэш на запись (я не про Smart Flash Cache). Работает так же, как на упомянутых выше массивах.

    И под redo отводится не единственный шпиндель.

    А Вы этого не знали? Или сознательно написали дезу?

    ОтветитьУдалить
  46. >В Exadata storage cells есть кэш на запись. Работает так же, как на упомянутых выше массивах.

    Нет, нету. Вы не знаете разницы между контроллером SAS диска и кэшом дискового массива

    >И под redo отводится не единственный шпиндель.

    Где я написал единственный ? Конечно их несколько. Я написал что конкретная запись придется на 1 физический диск (200 IOPS) и это факт. Я также написал что этот диск может быть занят другим (помимо redo) вводом выводом.

    >Или сознательно написали дезу?
    Пожалуйста читайте внимательно что написано.

    Попробуем еще раз - где я не прав ?

    ОтветитьУдалить
  47. Exadata User26/7/11 6:45 PM

    2 Dmitry Volkov

    > Нет, нету. Вы не знаете разницы между контроллером SAS диска и кэшом дискового массива

    Нет, есть. Вы не знаете устройство Exadata Storage cells.

    Также, Вы не знаете, что кэш в контроллере, который на самом диске, на запись отключен - так делается в любом нормальном дисковом массиве, или сервере.

    Итого, у вас безграмотные теоретические рассуждения об Экзадате.

    ОтветитьУдалить
  48. >Нет, есть. Вы не знаете устройство Exadata Storage cells.

    Хорошо, давайте ссылку где про это прочитать

    >что кэш в контроллере, который на самом диске, на запись отключен - так делается в любом нормальном дисковом массиве

    Ссылку на best practice про массивы

    >Итого, у вас безграмотные теоретические рассуждения об Экзадате.

    Бывает, не без этого. Но сначала посмотрим на ваш ответ выше -)

    ОтветитьУдалить
  49. Exadata User26/7/11 7:25 PM

    2 Dmitry Volkov

    > Хорошо, давайте ссылку где про это прочитать

    www.oracle.com - для сотрудника IBM этого достаточно.

    А для партнеров и клиентов компании Оракл есть и дополнительные источники информации.

    >>что кэш в контроллере, который на самом диске, на запись отключен - так делается в любом нормальном дисковом массиве

    > Ссылку на best practice про массивы

    Best practice сами поищите. Это общепринятая практика. Контроллер современного диска имеет до 64Мбайт кэш-памяти. Кэш этот можно использовать в том числе и на запись. Но если так сделать по несиправность единстенного диска приведет к потере данных. Поэтому и отключают.

    ОтветитьУдалить
  50. Exadata User26/7/11 7:31 PM

    добавлю. Кэш на запись можно включать только, если он защишен батарейкой, и зазеркалирован.

    ОтветитьУдалить
  51. >www.oracle.com
    Аргументированно. Технически грамотно. Анонимно. Я уважаю вашу позицию. Спасибо.

    >кэш в контроллере, который на самом диске, на запись отключен - так делается в любом нормальном дисковом массиве, или сервере.
    >Best practice сами поищите

    Best Practices for Running an Oracle
    Database on an IBM Mid-Range Storage
    Subsystem

    http://www-03.ibm.com/support/techdocs/atsmastr.nsf/WebIndex/WP101294

    стр 6,
    Also set up write cache to let the controllers acknowledge writes as soon as the data
    hits the cache instead of waiting for the data to be written to the physical media. IBM
    storage subsystems are designed to store data on both controller caches before being
    acknowledged. Furthermore, both controllers have battery backups for this cache.


    Предлагаю закончить поток ваших милых глупостей. Спасибо еще раз.

    ОтветитьУдалить
  52. Exadata User26/7/11 7:58 PM

    2 Dmitry Volkov

    > Also set up write cache

    тут речь идет кэше контроллеров дискового массива. Там зеркало и батарейка.

    Вы же говорили о кэше на контроллере диска.

    > Предлагаю закончить поток ваших милых глупостей

    Мало того, что в СХД не разбираетесь, так еще и хамите.

    ОтветитьУдалить
  53. > Exadata user:
    > что кэш в контроллере, который на самом диске, на запись отключен
    >добавлю. Кэш на запись можно включать только, если он защишен батарейкой, и зазеркалирован.

    Из Exadata whitepaper c сайта oracle.com
    "Disk Controller HBA with 512MB Battery Backed Write Cache"

    Надеюсь сегодня от сотрудника IBM вы узнали кое что про Exadata и дисковые массивы -)

    ОтветитьУдалить
  54. Вот здесь то что я пишу про проблемы с redo logs пишет Tanel Podner
    http://forums.oracle.com/forums/thread.jspa?threadID=2195956&tstart=0

    Он же приводит и решение.

    ОтветитьУдалить
  55. Анонимный9/8/11 7:42 PM

    Кевин налажал - http://kevinclosson.wordpress.com/2011/08/05/exadata-its-the-worlds-fastest-database-machine-and-the-best-for-oracle-database-part-i-do-as-i-say-not-as-i-do/ - абсолютно непрофессиоанальный пост. Как там было отмечено, сам стал источником FUD, что впрочем, верно. Не знаешь четких технических причин событий или не можешь о них открыто говорить - не строй теорий заговора, не путай людей. И это "унылое" "I know". Знать бы что он действительно в Oracle делал, не верю что профессионал будет своих коллег так обсирать, напрямую и косвено. Советую неуподобляться.

    ОтветитьУдалить
  56. >абсолютно непрофессиоанальный пост
    В чем конкретно ?

    >Знать бы что он действительно в Oracle делал

    у него все написано в блоге

    >не верю
    Ваше святое анонимное право

    >Советую
    Спасибо. Это зависит только от вашего восприятия мира - можно называть когда вам указывают на вашу ошибку "обсирание", а можно исправить ошибку и поблагодарить.

    ОтветитьУдалить
  57. Интересно, а кто мешает диски под redo целиком разместить в кэше дискового массива или выделить для него отдельную партицию, если кэша например мало.

    В любом случае, если речь идет об интенсивной записи данных - "классические" энтерпрайз, да и среднего уровня системы хранения разорвут в клочья экзадату при одинаковой стоимости. Против многолетних нароботок вендоров работающих в этом направлении не попрешь придумав систему на коленке. Технологии обсуждать не хочу. Простите :) Кто разбирается в этом вопросе, тому и так все понятно. Смешно даже слушать аргуметы сторонников экзадаты пытающихся свою любимую систему защитить в данном направлении. Плюс только в выигрыше на чтение данных, подходит клиентам Oracle для которых это актуально, но много ли их? А если еще и принимать в рассчет, тот факт что у клиентов приложений может быть несколько, которые работают не только с Oralce БД, то придется плодить системы хранения, про функционал репликации вообще молчу. Будет полнейший зоопарк (консолидация, эффективность? не не слышал...), со сложным управлением и стоящий кучу денег. Оно это надо?

    ОтветитьУдалить