Dsvolk Oracle News

Марк Ривкин, бывший сотрудник IBM, а теперь сотрудник Oracle написал презентацию о сравнении конкурентов Exadata, цитата:
"В презентации рассказывается по мотивам презентаций IBM и MS на 16 конф Корпоративные БД об архитектуре и функциях конкурентшв Exadata - Data Allegro и Netezza, даются мои соображения об их недостатках по сравнению с Exadata"

Сама презентация

Давайте ее почитаем. Начиная со слайда 10 идет сравнение Exadata c IBM Netezza. Дело в том, что я ничего не понимал в Netezza, но на прошлой неделе я совершенно случайно столкнулся с командой IBM из штаб-квартиры которая отвечает за решения по аналитике, в том числе Netezza и просидел вместе с ними 3 дня. Теперь у меня знаний больше -) Для начала разговора (я же парень простой), я начал их "мочить" этой презентацией Марка. Они страшно смеялись, и вот что получилось (см таблицу ниже)

Марк Ривкин о Netezza	Как на самом деле
не OLTP	спасибо кэп, Netezza это специальный appliance для хранилищ данных и аналитики
плохое сжатие	мы много обсуждали это в блоге, 10-кратное (и выше) сжатие достигается за счет первоначальной сортировки данных. По информации разработчиков в Netezza каждый блок с диска после декомпрессии превращается в 4-8 блоков в памяти, что есть ровно то же самое что у Exadata (без сортировки). Netezza использует поколоночное сжатие данных, как и Exadata (я знаю про разницу в алгоритмах, но подход то один). Все данные в Netezza сжаты всегда по умолчанию. Там неоткуда взяться особенной разнице в сжатии, тем более некорректно писать 'плохое сжатие'.
нет процедурного языка, только SQL	Чисто формально есть JDBC и ODBC драйвера, но...мы вроде бы договорились обсуждать хранилища ? Что-то мне подсказывает что pl/sql не используется широко в хранилищах (за исключением возможно ETL), потому что это неэффективно. Ну представьте себе загрузку 1Tb таблицы в pl/sql таблицу...У Netezza есть возможность написать UDX code (the X stands for one of [Function \| Aggregate \| TableFunction \| AnalyticProcess ]). Но если все вышесказанное - это гнилые отмазки, то стоит открыть для себя nzPL/SQL.
спец. железо	IBM blade и Xeon стали спец железом ? Linux ? SAS диски ? В Netezza eсть FPGA, у Oracle Sun Flash, и тот и другой ящик нельзя открывать чтобы не потерять поддержку. О чем речь то ?
не учитывает специфику данных	не понял проблемы
Host 24 ядра против 128 Exadata	128 Core это Exadata X2-8 (+ 168 Cell Core). Тут Марк не разобрался где проводится основная работа с данными. А она ведется на стороне S-Blade, где 192 ядра Xeon + 192 ядра в FPGA + 24 на стороне Host. Именно S-Blade производит скажем операцию sum. Host в понятиях Netezza не выполняет большой работы над данными. Ну и у кого ядер больше ? Мое мнение, сравнивать по кол-ву ядер вообще не стоило.
Данные с неск дисков должны Join на 1 HOST	Это совсем странное заявление. Очевидно стоит прочитать как работает Parallel Execution в RAC - а именно, точно также, parallel slave вынуждены передавать всю прочитанные данные координатору на 1 хост. Дальше, если вчитаться в то какую оптимизацию предлагает Netezza для того чтобы снизить этот эффект, то..точно такие же методы появились в 11g. Я имею в виду например broadcast меньшей таблицы между узлами при join. Т.е. тут явно видно не понимание работы собственного продукта, Oracle RAC.

Итак, играл но не угадал ни одной буквы -). Стоит познакомится вот с этой книжкой. Но и стоит огорчаться, те же ребята из штаб-квартиры попытались рассказать мне как работает Exadata и RAC. У них это не вышло. Они думают, что у Oracle RAC все еще на уровне 9i. Кончилось тем, что они попросили все-таки выступить меня (!) и им был преподнесен DD4D в сокращенной версии, для занятых. На память от них я получил специальную кепку, как символ уважения и признания технической экспертизы -) Просто интересно, у Марка есть такая же после работы в IBM ? -)

Но вот что действительно интересно, так это схема лицензирования. Netezza лицензируется по объему ...пользовательских данных (только данных, никаких индексов ) после сжатия. Как вы знаете, Exadata - требуется лицензировать все диски на cell, даже те которые содержат SYSTEM_DG, а уж сколько там будет данных - дело ваше -)

Что же получается, Netezza идеальна ? Нет, у нее есть несколько архитектурных проблем, которые сейчас решают, даже вроде анонсы уже есть. Но их требовалось заметить -)))

Обо мне

Twitter

Рассылка новостей по email

Подпишитесь на dsvolk.blogspot.com

Архив блога

Полезные ссылки

Метки