something about cloud, part 2

Чтобы понять разницу между тем что делает IBM и конкуренты  достаточно посмотреть телевизор на Wimbledon.com:

Цитата: Инфраструктура которая обслуживает web сайт  wimbledon.com построена по принципу cloud. IBM обеспечивает cloud инфраструктуру мирового уровня для обеспечения максимальной масштабируемости. IBM обладает возможностью быстрого развертывания сервисов в общей инфраструктуре - эти сервисы являются критичными для теннисного турнира. 

IBM определяет Cloud как новую  модель IT для потребления  и доставки IT сервисов:

Чуть не забыл, почему был выбран в качестве примера именно  Wimbledon  - конечно же,  чтобы было понятно нашему английскому джентльмену -) Он же может поехать, проверить  все на месте, так сказать-). Если Вам не терпится, про продукты можете найти здесь.

Сходите на сайт, почитайте.  Огромная разница между решением, которое можно увидеть даже по телевизору и рассказами  про какие-то небесные технологии, без всякой демонстрации, что с ними делать. Надо отдать должное IBM - технологии сначала отрабатываются в сумасшедших по сложности проектах и только потом запускаются для общего пользования.

PS на фотографии (с официального сайта)  Мария Шарапова, которая вчера вышла в полуфинал Wimbledon и   я искренне желаю ей его выиграть.

Update 1. Маша в финале ! 

Update 2. Маша прекрасно выглядела, было собранной, показывала великий теннис, но к сожалению проиграла. Ее победы хотели все, ей специально аплодировали - но соперница была сильнее.  Все равно наша Маша лучшая !


Читать дальше...

something about cloud

Update 1. Это очень показательно, что никто из экспертов не смог прокомментировать простой вопрос про Cloud и продукты Oracle.  Прочитать переведенную презентацию и ответить на вопросы - это большая разница...

Про cloud в этом блоге писалось неоднократно,  но чтобы не утомлять читателя подробностями сразу приведу картинку (слева) которая на мой взгляд сразу описывает что же такое cloud.
Итак, наше приложение работает поверх системного ПО, которые обеспечивает полную вирутализацию нашей инфраструктуры.

Простыми словами, я как бизнес- пользователь хочу выдавать  в IT запросы типа: "мне пожалуйста 16 быстрых ядер, 0.5 Tb быстрых дисков и 1 Tb памяти" или "мне все равно каких 8 ядер, 2 TB средних по скорости дисков и памяти 1 Tb к ним". Ну а теперь, небольшой обзор как решают эту проблему Oracle ( в этом сообщении) и IBM ( в следующем).

Итак, я заказчик, у которого немного HP Linux машинок, Sun T3, M5000, Hitachi Storage, HP Storage, начинаю строить Cloud.  Сервера приложений на Windows под управлением VMware. А что, таких заказчиков навалом.  Следите пожалуйста за руками.


Читать дальше...

weekend movie, part 2

В 2007  IBM Research  начала делать Watson, компьютерную систему которая умеет анализировать голосовые запросы и выдавать ответы на них. Ключевое слово здесь - ответы. Можно долго распространяться на тему отличия с Google/Yandex, но коротко - представьте себе что поисковик дает вам единственно правильный ответ на ваш вопрос, а не сообщает издевательски что есть мол еще 200,000 документов, которые он рекомендует просмотреть -) Чтобы протестировать что у них получилось, IBM Research решили участвовать в игре под названием Jeopardy (наш аналог 'Своя Игра') и в этом году  им удалось победить. Не пожалейте 6 минут времени посмотрите на успехи и неудачи команды которая делала Watson. Это действительно классное видео о техническом проекте, в котором бывают и удачи и ошибки. Там показывается график как у них медленно рос процент попаданий в правильные ответы, как вся команда ухохатывается над неправильными ответами...





Я не знаю, смогут ли они переиграть скажем Александра Друзя, но идея применения такого компьютера в медицине для постановки диагноза мне кажется уже вполне реальной.
Watson использует стандартные сервера  Power 750, Linux в качестве ОС, и насколько я знаю собственную БД.  И я, честно говоря, преклоняюсь перед людьми, которые решают такие задачи.
PS Теперь если вы сравните это видео и предыдущее, вы поймете разницу в менталитете и подходах. 


Читать дальше...

"СНГшным САПерам в мире равных нету"

Какой IBM, о чем Вы? Приз за лучший отжиг недели получает SAP, старый бизнес-партнер компании Oracle.



Я больше чем уверен, что недавняя сертификация SAP под Exadata является ключевой частью корпоративной стратегии SAP СНГ по достижению 150.000.000 :^)

SAP прекрасно понимает, что без Exadata таких амбициозных целей достигнуть просто не-воз-мож-но. Эти ребята конструктивны -- они не стали платить нечистым на руку аналитикам за написание крамольных статей про Exadata -- они ее просто сер-ти-фи-ци-ро-ва-ли :^)

Ни что не может быть лучше лояльного и замотивированного бизнес-партнера, играющего по правилам :^)

Обсуждение на Cnews. Текст новости на Cnews. Ждем ответного ролика от IBM !

UPDATE 1: YouTube удалил ролик, сославшись на жалобу SAP СНГ по нарушению авторского права. Забегали. Засуетились. Замельтешили. Стыдно стало :^)

Но ролик еще лежит локально на Сnews.

UPDATE 2: Cnews снял со своего сайта ролик "по требованию правообладателя - SAP CIS". Наслаждайтесь последней возможностью посмотреть шедевр :^)


Читать дальше...

другие мнения..

Агенство Bloor Research выпустило несколько статей,  сравнивающих Exadata и решения IBM. 

Первая из них (также  доступная для скачивания с этой страницы) мне кажется наиболее взвешенной, содержит описание как Exadata так и различных моделей систем IBM Smart Analitics и откуда вы можете получить отдельное удовольствие от например, просмотра модели 5600 with SSD Option, которая совершенно случайно содержит от 2-х до 8-ми узлов, 5 Tb flash, извините SSD, 100 TB raw пространства, что совершенно случайно совпадает с Exadata Full Rack. Еще раз, все совпадения совершенно случайны -)

Вторая, замечательна тем, что есть ее перевод на русский язык. Ее можно положить на стол вашему руководителю. Конечно, она  содержит несколько милых глупостей заблуждений,  но по крайне мере они точно подметили то,  про что я пишу давно:

"Обратите внимание, что масштабирование [Exadata] невозможно без добавления дополнительных дисков: это означает, что вы не сможете просто добавить новую вычислительную мощность, если у вас имеется «бутылочное горлышко» на процессоре: вам придется приобретать дополнительные мощности для хранения данных, даже если они вам не нужны" стр 6.

Если коротко - поставить сейчас flash или ssd диски - это не проблема. Сделать так чтобы 'горячие данные' туда заползали сами - также (Exadata flash cache, IBM Storwise easy tier). Единственное, что действительно сейчас недостижимо с помощью аппаратных средств  - это сжатие больше чем в 2-3 раза. Exadata действительно здорово сжимает данные в хранилищах. Правда, есть и другие мнения...

Update 1. В комментариях написали, что я забыл про Smart Scan.  Если говорить про Oracle Database, да, технологий кроме Exadata, которые могут сделать что-то подобное нет, и надо быть честным вряд ли будут.
 Ecли рассматривать не только  Oracle,  то  ниже вы видете картинку как работает Netezza - специальный модуль FPGA, установленный внутри S-Blade (это аналог Storage Node), занимается фильтрацией данных.  FPGA который (я честно не понял до конца) является комбинацией hardware и  software (?), но крайне низкого уровня, занимается тем же самым smart scan. Т.е. идеи витают в воздухе....


Читать дальше...

Itanuim again (to whom it may concern)

IBM открыла специальный web сайт  www.itaniumtopower.com  на котором пользователи Itanium должны узнать почему они "should act now". Tам можно слушать webcast на английском или скачать презентацию. Кстати обратите, что на слайде 31 обещают массу бесплатных вкусностей  (не путать с сыром -), например построение  плана миграции.

Кстати, если вы пользователь Itanium, вы возможно услышите страшилки про 2013 год (действительно число так себе).  Однако, если пойти по ссылке, откуда  найти Oracle's Technical Support Policies и наконец перейти к Lifetime Support Policy, то вы увидете что для Oracle Database 11.2  Premier support закончится в 2015 году,  а extended  в 2018 (отличия смотри в Oracle Tech Support Policy). Так что 2013 год для тех,  кто на 10.2.

Поднятый  в декабре 2010 года коэффициент на Itanium 93XX на мой взгляд делает даже обновление hardware систем на Itanium весьма дорогостоящим. Так же дата окончания support на Oracle тут уже не так уже и важна. Так что начинаем потихоньку медитировать, и в частности, на Oracle Database Cross Platform Migration to AIX  -)). Не нравится статья IBM ? Ну пожалуйста, вот блог  Oracle -).  Даже там уже поняли, куда надо мигрировать -)

Update 1. Wow, согласно ID 1079563.1 413484.1, начиная 11.2.0.2 можно строить Standby Solaris SPARC (64-bit) -> AIX (64-bit).  Неожиданно -))

Update 2. From Intel:  'We made a strategic flaw in artificially protecting Itanium and not making Xeon 64-bit'. Дальше там также интересно написано про E7, сравнения произвожительности и тд 


Читать дальше...

COOPERTITION 2: Oracle Exadata Now Certified by SAP

Забудем на секундочку про IBM. Есть еще один замечательный пример COOPERTITION. На этот раз между SAP и Oracle: 10 июня 2011г. SAP совместно с Oracle сертифицировали Database Machine под SAP (включая SAP BI/BW).

Новость на сайте SAP
. FAQ на сайте Oracle.

Мне лично сразу вспомнилась рекламная компания под лозунгом CLEAR, которую SAP запустил в мае 2009 года, и которую разработало крутое американское рекламное агентство Ogilvy & Mather Worldwide. Как ни старайся -- без Oracle не получится :^)

Теперь если на SAP есть проблемы с инфраструктурой может и не обязательно мигрировать на OeBS. Достаточно переехать на Exadata, а SAP пусть поживет пока.

So let's make it clear: "The best-run businesses run SAP on Oracle Exadata" :^)


Читать дальше...

something stupid

Документация на Oracle Database 11.1 обещала  нам:

ASM has the following limits:
  • 4 PB maximum storage for each ASM disk 

Что было грубо разрушено: Bug 6453944: ORA-15196 WITH ASM DISKS LARGER THAN 2TB
Выпущенные патчи всего лишь перестали давать создавать такие диски и предотвращали потерю данных. Ладно, с кем не бывает.

Теперь документация 11.2 говорит нам:


Without any Oracle Exadata Storage, Oracle ASM has these storage limits:
  • 2 terabytes (TB) maximum storage for each Oracle ASM disk

Ну это уже  за гранью добра и зла. Я понимаю, что HCC compression специально для Exadata, я понимаю, что Database Flash Cache только для Linux и Solaris, но оставить дурацкое ограничения в 2 Tb для всех кроме Exadata понять не могу. Почему это важно - хотелось бы иметь возможность устанавливать ASM поверх LVM томов без таких дурацких ограничений, хотя бы на некоторых операционных системах, например AIX. Тут есть тонкость - не всякие LVM тома одинаково полезны,  подходят только raw logical volume, сами volume group не подходят, поскольку ASM хранит свои метки в самом начале диска. Описание как собрать ASM поверх именно raw logical volume вы найдете здесь. Почему LVM ? Потом, что у нее есть масса своих достоинств (и даже больше, в AIX 7  includes enhanced support in the AIX Logical Volume Manager (LVM) for SSD)  включая и нормальный мониторинг I/O (iostat из asmcmd также пока за гранью разумного). Ограничение в 2 Tb оставляет нам возможность использовать только hdisks, на которые  ASM еще накрутит свой strip'инг - если бы такого ограничения не было бы просто сделали бы для каждой группы ASM один большой raw logical volume, все были бы счастливы.  Смысла накручивать поверх hdisks  LVM, а затем еще и ASM я пока не вижу. Тут поневоле задумаешься о том, что 'подавить' кэш файловой системы уж не такая и дурацкая задача даже для больших баз данных...


Читать дальше...

как я провел лето

Коллеги для тестирования выбрали распоследний AIX 7.1, Oracle 11.2.0.2, установили PSU (стало 11.2.0.2.2).  Хранение данных на ASM.  Немедленно после попытки старта ~3000 сессией kernel time взлетел в потолок, а диски наоборот. Разработчики AIX думали недолго, и исправленный код будет включен в 7.1.0 SP2

Особенно доставил комментарий к  патчу  "the changes are complicated and involve legacy code that has not been touched in 20 years". Проблема оказалась в том, что нагрузочный тул запускал работу всех сессий одновременно, а не давал им работать сразу после входа. Понятно, что ситуация нежизненная, а искусственная. Надо сказать, что почти одновременно был поставлен и патч  Bug 11800170 - ASM IN KSV WAIT AFTER APPLICATION OF 11.2.0.2 GRID PSU, и возможно он также помог.

Немедленно после того как удалось справиться с kernel time, почта доставила вот такой AWR:



с исконно русским вопросом - кто виноват и что делать ?  Тема mutex X беспокоит народ очень давно, и кажется что каждый новый пачтсет привносит свои изменения. В нашем случае у меня сложилось убеждение что новый PSU не исключение. Поиск по My Oracle Support навел на Bug 12431716 - Mutex waits may cause higher CPU usage in 11.2.0.2.2 PSU / GI PSU [ID 12431716.8]  и рекомендацией to apply Patch:12431716 on top of the 11.2.0.2.2 PSU. В нашем случае применение патча  - никаких изменений к лучшему.  Внимательное чтение вышеприведенного привело к обнаружению Bug 10411618 - Enhancement to add different "Mutex" wait schemes [ID 10411618.8] и понимаю наличия параметра _mutex_wait_scheme. Проводились эксперименты с установкой этого параметра в 0, и надо отметить, что поведение системы меняется. Поэтому если мы поставили уже PSU, и mutex вдруг появились - можно это попробовать. По молчанию _mutex_wait_scheme = 2, так мы и решили продолжать.

Продолжать кстати оказалось удобно с помощью весьма известного скрипта snapper by Tanel Poder:

SQL> @snapper ash=sql_id+event+wait_class+blocking_session+p2+p3 5 1 all
Sampling SID all with interval 5 seconds, taking 1 snapshots...

-- Session Snapper v3.52 by Tanel Poder @ E2SN ( http://tech.e2sn.com )


------------------------------------------------------------------------------------------------------------------------------------
Active% | SQL_ID          | EVENT                     | WAIT_CLASS      | BLOCKING_SES | P2                   | P3
------------------------------------------------------------------------------------------------------------------------------------
  5175% | 5xqa6qnbagf2b   | ON CPU                    | ON CPU          |              |                      |
  3200% |                 | db file parallel write    | System I/O      |              | 0                    | 2147483647
  2725% | ampvmj3gx3n16   | ON CPU                    | ON CPU          |              |                      |
  1475% | 06bfg06g97f27   | ON CPU                    | ON CPU          |              |                      |
  1050% | gvzx29hj54zfm   | library cache: mutex X    | Concurrency     | 7374         | 60073707569152       | 82
   900% | gvzx29hj54zfm   | library cache: mutex X    | Concurrency     |              | 60073707569152       | 82
   850% | gvzx29hj54zfm   | library cache: mutex X    | Concurrency     | 15371        | 54885387075584       | 82
   700% | gvzx29hj54zfm   | library cache: mutex X    | Concurrency     |              | 54885387075584       | 82
   625% | gvzx29hj54zfm   | library cache: mutex X    | Concurrency     |              | 29781303230464       | 82
   600% |                 | ON CPU                    | ON CPU          |              |                      |



SQL> @snapper ash 5 1 12062
Sampling SID 12062 with interval 5 seconds, taking 1 snapshots...

-- Session Snapper v3.52 by Tanel Poder @ E2SN ( http://tech.e2sn.com )


-----------------------------------------------------------------------
Active% | SQL_ID          | EVENT                     | WAIT_CLASS
-----------------------------------------------------------------------
    68% | gvzx29hj54zfm   | library cache lock        | Concurrency
    32% | gvzx29hj54zfm   | library cache: mutex X    | Concurrency



Wow.  Найден проблемный sql_id ! Не тут то было. Обнаружить этот sql_id в v$sql  не удалось. Это интересный момент кстати, и что это было не очень понятно. Чуть позже разработчик признался, что был ошибочный запрос (в котором была указана несуществующая таблица) и возможно это и было причиной всех бед и это и был наш 'непойманный' sql_id.

А пока я провел несколько  дней  на замечательном блоге Андрея Николаева (РДТЕХ), который  описал возможность  пометить некоторые объекты как горячие в библиотечном  кэше. Обязательно прочитайте, крайне рекомендую. Описанная в блоге Андрея технология была приведена в действие.

Поскольку паника нарастала, делалось несколько изменений сразу, и сказать однозначно, что привело к результату, который вы видите ниже, сложно.


Это была если не победа, то по крайне мере серьезный прогресс. Конечно, это не окончание истории, еще не ответили за свое "kokc descriptor allocation latch",  требуется разбираться с ORA-00600: internal error code, arguments: [pesld02: nlui] (которая признается на metalink как следствие использования Edition Based Redefinition, которые не использовались) но это другая история. 

Вместо заключения: установка PSU на 11.2.0.2 - дело не такое простое как может показаться. Вернее не сама установка, а ее возможные последствия. Если вы решитесь, то сразу вместе с PSU ставьте и указанные тут патчи и все что выйдут к тому времени. Удачи !

Update 1: Убедитесь в том то у вас стоит Patch 10190759: PROCESSES CONSUMING ADDITIONAL MEMORY DUE TO 'USLA HEAP'

Update 2: Коллеги предложили немного другой AWR, за другой диапазон времени, в которой история представляется не такой счастливой как показалось мне:

Так что to be continued по полной программе -(


Читать дальше...