Oracle tech Day Minsk (cluster reconfiguration)


Во время Oracle Tech Day в Минске я выступал с презентацией "Архитектура максимальной доступности" и показывал мультфильм, демонстрирующий балансировку нагрузки и поведение кластера во время неожиданной перегрузки одного из узлов (прочитать про все мультфильмы).

Во время демонстрации фильма, кто-то из зала, воспользовавшись темнотой :), задал коварный вопрос - "а почему падает в 0 кол-во транзакций ? " и я пытался объяснить этот факт не вдаваясь в архитектуру, что оказалось очень не просто. Сейчас я восполню этот пробел, насколько я смогу. Во первых детально различные сбои в кластере и необходимые настройки, чтобы уменьшить продолжительность сбоев собраны в замечательной whitepaper (внимание, она про 10g у меня в мультфильмах 11g)
Для удобства я привожу картинку оттуда: действительно на какое-то время транзакции в системе останавливаются. Но, это время ~ 2 сек.

Так что же происходит, когда один из узлов вдруг пропадает ?
(дальше мои предположения, возможно они не абсолютно точные)


1) Clusterware обнаруживает, что узел перестает голосовать в voting диске и (скорее всего) хочет выбросить этот узел из кластера, но сети тоже нет. Скорее это происходит быстро, несколько секунд.

2) Далее блокируется глобальная база блокировок (IDLM)
Начиная с этого момента кол-во транзакций падает. потому что продолжаются только транзакции, которым нужны данные на локальном узле.

3)Далее необходимо выполнить переконфигурацию ASM. Опрации ввода-вывода замедляются.

4)Далее идет переконфигурация экземпляров для переделки "прав собственности" владельцев объектов в глобальном кеше.

Я думаю на этапе 3-4 транзакции в кластере прекращаются полностью.

5) Далее выполняется оставшиеся узлы кластера выполняют instance recovery

6) Число транзакций в системе нарастает, но если транзакциии встречается блок, который необходимо восстановить - он восстанавливается, только потом транзакция продолжается.

7) Все блоки восстановлены - достигнут максимальный уровень производительности.

Для увлекающихся могу порекомендовать еще вот эту ссылку:
Oracle RAC: Cluster reconfiguration steps
К сожалению сама книга в бумажном варианте мне сейчас недоступна, как только я ее получу возможно что-то и изменю в тексте выше.


Давайте обсудим результат: ~2 сек простоя системы. Как видно из рисунка слева - это четыре 9 ! Давайте решим что у нас 4 узла, что каждый из них раз в год перегрузиться неожиданно - все равно укладываемся.

Попробуйте найти у вендоров оборудование, которое сертифицировано по такому же классу (9999) - есть, на надо еще поискать и посмотреть на его стоимость.

Итак: Я надеюсь, все понимают, что мы рассмотрели самый тяжелый случай - перегрузку узла. Что в случае планового обслуживания у Вас не будет простоя сервиса, если Вы все сделаете аккуратно.

Итого, при соответсвующем оборудовании мы может строить на Oracle RAC системы с уровнем доступности четыре 9999. Сравните это с HA решением (cold failover) - там с трудом можно попасть в две 9.


Читать дальше...

RMAN-04014: startup failed: ORA-00439

Если Вы захотите сделать single standby node для своего замечательного RAC кластера, как вы поступите ? Конечно же установите Oracle binaries на standby, а затем скопируете БД без промежуточного backup'а
с помощью rman (11g feature) :

duplicate target database for standby from active database


И вот тут может случиться:

RMAN-04014: startup failed: ORA-00439: Real Application Clusters


Оно и понятно - ведь у Вас не кластерный standby. Логики этого сообщения я не понял, но вышел из положения с помощью

make -f ins_rdbms.mk rac_on
make -f ins_rdbms.mk ioracle

На standby node.


Читать дальше...

Oracle Validated Configurations

Если начальство требует от Вас выбора "железа" под Oracle на Linux - эта ссылка для Вас !

Oracle Published Validated Configurations


PS
А если начальство склоняет Вас к Windows - скажите, что validated сconfiguration есть только для Linux :)


Читать дальше...

Опять про clusterware

Я уже писал, что с помощью Oracle Clusterware можно организовать HA кластер, и что лицензия это позволят сделать. Но столкнулся с ситуацией когда гениальные продавцы все-таки продают нашим клиентам hacmp для переключения с ноды на ноду. Наверно если за деньги, то он умеет больше ? Спрашиваю, если повиснет БД, не диски или сетевые платы, а именно БД, что произойдет с кластером, будет переключаться ? Ответа нет. Я точно знаю, что для Veritas Cluster Server'а было нужно покупать расширенного агента, который умел ходить в БД, и если у него это не получалось, как вариант, вызывать переключение кластера. Т.е. нужно было покупать два продукта.
А что же наше, родное clsuterware будет делать, если повиснет БД ?
По умолчанию - ничего, удовлетвориться наличием процесса pmon. Но если написать всего несколько строчек в act_db.pl - сможет и ходить в БД и запросы давать. Гибко все очень. Здорово. И бесплатно, что в нашей действительности должно было быть главным двигателем прогресса, если бы не исскуство продаж :)


Читать дальше...

Установка Oracle RAC 10g на Linux on POWER

Хочу поделиться ощущениями от установки Oracle 10g RAC на платформу Linux on Power

Ставили все коллеги, я осуществлял всего лишь поддержку по телефону. Прошло все на удивление гладко. Оказалось, что у IBM существует очень приличная статья на эту тему:
IBM Wikis - Linux on POWER - Installing Oracle Real Application Cluster RAC

Вслед за статьей хочу обратить Ваше внимание, что какую бы вы хорошую статью не нашли, крайне рекомендуется прочитать и документацию.

Ставилось все на Red Hat 4 for Power Update 4.
Узлы представляли собой LPAR выделенные с p570 машины.

Насколько я понял, "наехали" на следующие вещи:

1. Забыли поставить The IBM XL C/C++ Advanced Edition V7.0.1 for Linux Runtime Environment Component
2. glibc-devel должен быть и 64-bit и 32-bit версиях (? этого нигде нет, но без него не работает )
3. Были еще проблемы с правами при установке 10.0.3 patchset. Почему-то на удаленных узлах потребовалось сменить права на clusterware. Ясности тут ни у кого не осталось.


Перед установкой крайне рекомендую Metalink Note:341507.1
В частности узнаете про patch 4767801.



PS
Коллеги также поделились интересной ссылкой:
http://www.idevelopment.info/


Читать дальше...

Опрос "Планируете ли Вы миграцию на 11g ?"



Несмотря на небольшое кол-во проголосовавших тенденция, мне кажется, понятна и совпадает с тем, что наблюдалось при выходе 10g.

Тут есть только вот какая опасность. Мне удается сейчас встречаться с разными людьми, в том числе и серьезными разработчиками и администраторами. Так вот, не в обиду будет сказано, возможностей 10g R2 знают далеко не все. И вроде как идти на курсы сейчас странно - уже 11 выпустили...Получается такой круг - с одной стороны при выходе новой версии большая часть пользователей ждет R2, и поэтому не получает с этой новой версией практического опыта, а как решается мигрировать, так выходит уже следующая версия.

Наверно каждый решает для себя, как быть. Я лично считаю, что следует использовать любую возможность, чтобы поработать сейчас с 11g, чтобы просто оказаться готовым в тот момент, когда нужно будет на нее переходить.

А пока хочу предложить Вам новый опрос - "Используете ли Вы виртуализацию ?"


Читать дальше...

Larry Ellison about Oracle VM

Очень рекомендую Вам посмотреть первые 10 минут выступления Larry Ellison на Oracle Open World.

За эти 10 минут он очень ясно объясняет, почему он решил выпустить Oracle VM и как это должно работать. "One call to support" - мне это понравилось !

Мне кажется очень важно понимать идею, независимо от того как Вы к ней относитесь. И конечно вопрос, когда это будет стабильно работать. Но сомнений, что это будет работать у меня нет.

PS
Кстати на слайдах уже более корректная формулировка насчет "3 times" - "3-x less overhead"


Читать дальше...

Новости виртуализации и не только

Вы уже можете Скачать Oracle VM
После прочтения документации у меня смешанные ощущения - много вопросов остались без ответа, наверно нужно пробовать ставить.

Ну а пока, появился успешный пример использования моего образа 11g rac под Vmware. Для этого пришлось добавить инструкцию по настройке Vm network и небольшой faq.

PS
Как кстати настраивать виртуальные сети под Oracle VM я не понял.


PS2
В описании нового Vmware Server 2.0 уже встречаются слова "Enable a single operating system instance to run natively or in paravirtualized mode"


Читать дальше...

Читая OLSA

Знаете ли Вы, что согласно Oracle license and services agreement (OLSA)

Вы не имеете права
"разглашать результаты каких-либо стендовых испытаний без предварительного разрешения Oracle" ?


Читать дальше...

New Oracle sites

2 ссылки на сайты Oracle, которые могут Вам понравиться:

  1. OTN Semantic Web (Beta)
  2. The Official Oracle Wiki
OTN semantic Web мне очень понравился, потому что можно достаточно легко "переключиться" на интересную тебе тему.

В Wiki как мне кажется, надо вчитываться, фильтровать шум..


Читать дальше...

11g is available for most platforms

11g стала доступна для скачивания для платформ Solaris, AIX, HP-UX. Теперь полный список платформ выглядит так:

Download Microsoft Windows (32-bit) (1.7 GB)
Download Microsoft Windows (x64) (1.7 GB)
Download Linux x86 (1.7 GB)
Download Linux x86-64 (1.8 GB)
Download Solaris (SPARC) (64-bit) (1.9 GB)
Download AIX (PPC64) Disk 1, Disk 2 (2.3 GB)
Download HP-UX Itanium Disk 1, Disk 2 (2.3 GB)


Читать дальше...

Oracle VM

Андрей Пивоваров первым заметил, что oracle собирается открыть 14 ноября для скачивания Oracle VM.

Из интересного - разработчики обещаю сертифицировать RAC под Oracle VM.
Как Вы конечно знаете, RAC на Vmware не поддерживается :(
Официальная страница Oracle VM

Update 1 (14.11.2007):
Вот из этой ссылки становится больше понятно про Xen:
A Performance Comparison of
Commercial Hypervisors

(via Alexander)

Update 2 (15.11.2007):

Оказывается Xen уже в Enterprise Linux 5:

ls -l /boot/ | grep -i xen
-rw-r--r-- 1 root root 61053 Jun 6 08:13 config-2.6.18-8.el5xen
-rw------- 1 root root 1520866 Aug 31 16:37 initrd-2.6.18-8.el5xen.img
-rw-r--r-- 1 root root 84906 Jun 6 08:14 symvers-2.6.18-8.el5xen.gz
-rw-r--r-- 1 root root 868062 Jun 6 08:13 System.map-2.6.18-8.el5xen
-rw-r--r-- 1 root root 2076322 Jun 6 08:13 vmlinuz-2.6.18-8.el5xen
-rw-r--r-- 1 root root 274721 Jun 6 07:05 xen.gz-2.6.18-8.el5
-rwxr-xr-x 1 root root 608564 Jun 6 08:40 xen-syms-2.6.18-8.el5


Читать дальше...

OTF 2007

Появились презентации с Oracle Tech Forum 2007
http://www.oracle.com/global/ru/events/techforum/2007/report.html


Читать дальше...

Oracle Options


Хочу представить вам свою презентацию Oracle Database 10g & 11g. Она рассчитана на представление технологий Oracle слушателям, которые не имеют существенных знаний о компании Oracle и ее СУБД. Если Вам приходится представлять слушателям технологии Oracle надеюсь эта презентация будет Вам полезна.

Для продвинутых пользователей, надеюсь, будет интересным следующие цифры:


  1. У Oracle 11 различных баз данных
  2. И "всего" 16 опций Oracle Database


Читать дальше...

DataGuard and password file

Я думаю, что очень многие наступят на это. Даже если Вы при установке 11g отключили все новые фичи по управлению паролем, при работе с DataGuard у вас может случиться

"ORA-16191 and ORA-1017 when you change or create the password file using orapwd"

И накат логов прекратится.

Я наступил на это просто пересоздав password file на стороне DataGuard. Причем, конечно же, использовал тот же самый пароль, что и на primary side. Ничего не помогало, пока не был скопирован password file c primary side.

Решения данной проблемы описаны на metalink в note 462219.1
Одно из решений - совпадает с моим, второе требует установить SEC_CASE_SENSITIVE_LOGON=FALSE и пересоздать password file c ignorecase=Y

Но почему этот параметр не был false, я же при установке 11g указал, что не хочу использовать новую модель безопасности ?


Читать дальше...

Oracle Critical Patch Update - October 2007

Если Вы не обратили внимание, в октябрьском CPU появились слова CVSS VERSION 2.0 RISK
и колонка BASE Score - т.е. оценка серьезности обнаруженной дыры.
Если Вы хотите узнать как это рассчитывается, или почему максимальный Base Score может быть в Oracle только 7.5 срочно читайте Understanding the Common Vulnerability Scoring System (CVSS): Part 1

Ссылки по теме:

Oracle Critical Patch Update - October 2007


Читать дальше...

Архитектура максимальной доступности

Хочу представить Вам свою презентацию Архитектура максимальной доступности с использованием 11g. Я постарался с одной стороны осветить эту тему как можно шире, с другой стороны уложиться в приемлемое время (~ 1 час). Демонстрационный ролик, упомянутый в презентации вы можете найти в этом блоге чуть ниже.

Данная презентация может быть полезна как тем, кто не сталкивался с этой темой, так и тем, кто активно использует 10g - новые возможности 11g специально отмечаются.






Очень кстати нашлась и аналитическая статья про Disaster Recovery и Data Protection
New Database Technologies Usher in New Approaches to
Data Protection and Disaster Recovery
(by TANEJA Group)

Мне особенно понравился абзац про не слишком впечатляющие возможности в этой области Microsoft SQL Server и IBM DB2 :)))))

PS
Погоды в Казахстане, где я участвовал в Oracle Tech Day стоят весьма разные.
Как видно из фотографии - повалил снег...


Читать дальше...

Семинар Игоря Мельникова 11g для разработчиков

Темы семинара:

• Новые возможности в PL/SQL
• Прочие новые возможности (Datapump,
Scheduler и т.д.)
• Новое в Partitioning Option
• Advanced Compression Option
• Flashback Archive
• SecureFiles
• Real Application Testing

Архив презентаций


Читать дальше...

Oracle Tech Forum (11g launch)

Ну вот и закончилось одно из самых громких событий этого года - Oracle Tech Forum.

Остается только вспоминать как это было.
И кажется это я долго не забуду. Дело в том, что после перевозки наш дисковый массив "забыл" конфигурацию дисков :)

Но все по порядку:

Главным спонсором мероприятия был HP и поэтому дальше будет много рекламы HP.

Прежде всего это 4-узловой кластер на основе HP Blade Server c7000. Очень компактная, удобно упраляемая стойка с блейдами. Мне она очень понравилась. Пару фотографий Вы найдете ниже по ссылке. Огромное спасибо коллегам, что выделили ее нам и помогли с конфигурацией.

Показывали мы (это я и Андрей Блажнов, R-Style) конечно 11g RAC на Oracle EL 5 и конечно swingbech.

Некоторые мультфильмы по swingbech вы найдете здесь (ссылка поскипана)

(качество не лучшее, и наверно можно повырезать кое-что. Смотреть можно с помощью Divx или Windows Media Player)

scalability.wmv - пример масштабирование приложения на основе схемы СС

balance_and_failover.wmv - пример балансировки нагрузки, затем failover одного узла, затем повторная балансировка

interface_down.wmv - при опускании интерфейса с интерконнектом узел в течении 30 сек уходит в перезагрузку (это начиная с 10.2.0.3)

blade_overview.wmv - реклама HP (Ilo и прочее)


А также предлагаю посмотреть Вам настоящее кино: (ссылка поскипана)
(Смотреть можно Divx или VCL player, или Real Player. Windows MP у меня не берет)


HP_disaster_proof.wmv - прекрасный, с чувством юмора фильм про datacenter'ы HP. Он же и полезный - вы найдете там несколько важных цифр !

oracle_grid_computing.mpg - глубоко-филосовский фильм про технологии Grid.

Enjoy and welcome to the next Oracle Tech Forum !

PS
А что же массив ?
Приехал инженер HP, за 5 минут разбил его заново и мы поставили кластер, еще до обеда :) На фотографиях есть timing.

PS2
Автор фотографий и режиссер клипа по scalability.wmv - Сергей Данилов (Sergey.Danilov)


Читать дальше...

Oracle Whitepapers

Интересный сайт со статьями про Oracle - Oracle Whitepapers
В первую очередь мне кажется интересен тем, что там выложены статьи партнеров Oracle.
И следовательно там изложен реальный опыт работы с продуктами.


Читать дальше...

New Data Masking Pack for EM

Вместе с EM 10.2.0.4 вышел и очень интересный новый pack - Data Masking Pack
Он решает задачу "порчи" важных данных перед тем как передать БД на тестирование или разработчиками.

White Paper:
ds_datamasking.pdf (application/pdf Object)


Читать дальше...

Обзор Oracle Scheduler

Игорь Мельников (Igor.Melnikov) подготовил еще одну презентацию по 11g - "Обзор Oracle Scheduler"

Для меня в ней остался загадкой только один момент - как же выполняются удаленные задания (external job ) ? По документации на удаленном хосте может не быть oracle database.

Удалось найти только ссылку GUIDE TO RUNNING EXTERNAL JOBS WITH DBMS_SCHEDULER

В документации есть туманная таблица 26-1 по которой можно догадаться, что по крайне мере в Windows
без специального сервиса ничего не получится. Конечно в Unix зная ip адрес и логин пароль ничего не мешает выполять задание на удаленной машине. Хотелось бы конечно намека на протокол (ssh , rexec или ?) ..


White papers на корпоративном сайте: scheduler.pdf (application/pdf Object)

Update 1:
Для выполнения удаленных заданий на хосте должен быть OEM агент ?


Читать дальше...

Clean up failed crs install

Бывают ситуации, когда необходимо очистить предыдущую установку CRS

Подробно и для всех ОС изложено в Note:239998.1


Для Linux:

# Remove ocr.loc
rm -rf /etc/ora*

# Remove oracle base
rm -rf /u01

# Remove all voiting and ocr disk's. Repeat for all disks !
dd if=/dev/zero of=/dev/sda2 bs=1024 count=100

# Clean up all ASM disks. Repeat for all ASM disks !
dd if=/dev/zero of=/dev/sda4 bs=1024 count=100

PS
Скорее всего совершенно непонятные ошибки на установке могут быть вызваны
остатками предыдущего crs. У меня не стартовал ONS с сообщением segmentation fault :))

Он просто находил предыдущее расположением ocr и пытался туда записать. А диска уже не было :)


Читать дальше...