RAC для разработчиков, 14-15 февраля 2008 года

Хочу дать обновленную информацию о нашем семинаре "RAC для разработчиков" который будет проходить 14-15 февраля 2008 года в Москве. Я уже писал о нем. Теперь Вы должны были получить приглашение по email на данный семинар. Если Вы его не получили, это не страшно, можете его прочитать сейчас. Если Вы уже получили приглашение, то чуть позже Вам придет и ссылка на регистрацию. Если приглашения нет, обращайте пожалуйста к Сергею Данилову (sergey.danilov), не забудьте представить свою компанию :)


Мне хочется также рассказать небольшую историю, почему вообще мы сделали этот семинар:



"- Христианская религия основана не неверном толковании: ...При переводе с иврита на греческий, слово, которое значит молодая женщина перевели как девственница. Ошибиться было легко - там отличается только одна буква. Из этой ошибки выросло пророчество...Внимание людей привлекло слово девственница. Не каждый день девственница беременеет и рожает детей. Но дайте этому пророчеству настояться...
- И что ты уже хочешь этим сказать ?
- Я таки хочу сказать, что если что-то и написано, это не значит что это так на самом деле и есть. Люди верят. Это их надежда, и какая разница правда это или вымысел."
Фильм "Snatch", в переводе Гоблина.


С выходом 9i и Real Application Cluster в 2001 году появился маркетинговый лозунг, повторенный неоднократно и на самом высоком уровне:


"With competitors IBM and Microsoft ..a main distinction of Oracle's grid technology is its ability to run applications more efficiently..and you don't have to change a single line of code within the applications"


В технических статьях в районе 2004 года появляются фразы:

Oracle RAC requires no changes to existing database applications...Oracle RAC also requires no changes to existing database schemas. Data does not have to be partitioned or distributed across nodes in a RAC database..


И окончательно, начинают говорить с разных трибун только:

"you don't have to change a single line of code"


Из документации по 9i R2 "Real Application Clusters Deployment and Performance Guide" пропадают разделы про необходимость партиционирования. Очевидно, для того чтобы не вводить в заблуждение людей - ведь обещали, что не надо ничего менять.

Как мы видим, в этом случае внимание людей привлекла часть "change а single line of code", и все забыли контекст, в котором это было сказано первый раз.

Однако, мне очень нравиться вот эта фраза:

" There is a difference between an application working without changes in a cluster and actually scaling without changes !
"

И действительно, из собственного опыта видно, что можно перенести приложение в кластер, ничего не поменяв в приложении и оно заработает. И это правда. И это здорово ! Реальное огромное достижение !

Но такое приложение скорее всего не будет масштабироваться так, как Вам этого бы хотелось. Конечно это вызывает недоумение, разочарование.

Так вот, если Вы хотите узнать как сделать так, чтобы Ваше приложение в кластере было масштабируемым, умело использовать возможности кластера, когда и как нужно партиционировать схему приходите на наш семинар !

PS

Для тех кто все таки не понял, зачем нужно что-то знать про кластер, небольшой анонс:

- я постараюсь показать вам ситуацию, когда план запроса меняется в приложении которое работает в кластере (при всех прочих равных параметрах с single instance, включая статистику, параметры экземпляра и прочее прочее) .


Читать дальше...

oprocd mystic

Согласно документации на 10gR2, oprocd - A UNIX-based process monitor for a cluster. Note that this process will only appear on platforms that do not use vendor clusterware with Oracle Clusterware.

Process Monitor Daemon (OPROCD)—This process is locked in memory to monitor the cluster and provide I/O fencing. OPROCD performs its check, stops running, and if the wake up is beyond the expected time, then OPROCD resets the processor and reboots the node.


Так вот он есть только в 11g на Linux. В 10g он упоминается только в init скриптах. Кто нибудь знает почему это так случилось ?


Linux rac1.ru.oracle.com 2.6.18-8.el5PAE
Oracle Release 11.1.0.6.0
file $ORACLE_HOME/bin/oracle ELF 32-bit


ls -l /u01/app/oracle/product/11.1.0/crs_1/bin/oprocd
-rwxr-x--x 1 oracle oinstall 87641 Jul 27 03:06 /u01/app/oracle/product/11.1.0/crs_1/bin/oprocd



Linux rac1.ru.oracle.com 2.6.18-53.el5
Oracle Release 10.2.0.3
file $ORACLE_HOME/bin/oracle - ELF 64-bit


нет файла oprocd !


Linux rac1.us.oracle.com 2.6.9-55.0.0.0.2
Oracle Release 10.2.0.3.0
$file /u01/app/oracle/product/10.2.0/db_1/bin/oracle ELF 32-bit LSB executable

нет файла oprocd !


Читать дальше...

Clusterware, Linux 5 and raw devices

Хочу вернуться к теме конфигурирования в Oracle EL 5 и RHEL 5 raw устройств.
Конечно, в первую очередь рекомендуется размещать на raw ocr и voting файлы. Для файлов БД у нас есть asmlib.

Почему raw - потому, что обращение к этим файлам не идет через filesystem cache, что надежнее и быстрее (для этого типа файлов).

Есть правда другой вариант - можно открывать файлы с флагом O_DIRECT - что, кажется также позволяет избежать доступа через filesystem cache.

Мне не удалось понять, зачем в 5 версии Linux Red Hat убрал поддержку raw. Но это и не важно. Важно что судя по многочисленным источникам в интернете в clusterware 10gR2 существует баг (см. также Note:401132.1), из-за которого файлы на блочных устройствах не открываются с флагом O_DIRECT.

Предлагаемый workaround такой:

Как пользователь root на всех узлах
mkdir /dev/raw

Для VOTING файла (/dev/sdd1)

добавьте строчки в файл (создайте файл) /etc/udev/rules.d/61-local-raw.rules
ACTION=="add", KERNEL=="sdd1", RUN+="/bin/raw /dev/raw/raw1 %N"
KERNEL=="raw1", OWNER=”oracle”, GROUP="oinstall", MODE="660"


Для OCR файла (/dev/sde1)

добавьте строчки в файл /etc/udev/rules.d/61-local-raw.rules
ACTION=="add", KERNEL=="sde1", RUN+="/bin/raw /dev/raw/raw2 %N" KERNEL=="raw2", GROUP="oinstall", MODE="640"


Конечно, хотелось бы проверить информацию о вышеупомянутом баге. Но я не нашел простого способа :( Решил посмотреть как отрываются raw устройства:

uname -a
Linux rac1.ru.oracle.com 2.6.18-53.el5 #1 SMP


lsof /dev/raw/raw2

COMMAND PID USER FD TYPE DEVICE SIZE NODE NAME
evmd.bin 3737 oracle 5r CHR 162,2 7078 /dev/raw/raw2
evmd.bin 3737 oracle 7r CHR 162,2 7078 /dev/raw/raw2
crsd.bin 3875 root 6r CHR 162,2 7078 /dev/raw/raw2
crsd.bin 3875 root 10r CHR 162,2 7078 /dev/raw/raw2
crsd.bin 3875 root 12u CHR 162,2 7078 /dev/raw/raw2
oclsomon. 4112 oracle 4r CHR 162,2 7078 /dev/raw/raw2
ocssd.bin 4229 oracle 4r CHR 162,2 7078 /dev/raw/raw2

Вот дальше оказалось сложнее - процессы мы увидели, теперь хотелось бы посмотреть на флаги, с которым открыты файлы.

Интересную информацию поставляет /proc//fd/ но флагов нет и там.

И вот тут надо либо использовать strace, либо аналог команды Solaris pfiles. С помощью strace можно что-то понять только если процесс открывает и закрывает файл. А если он держит его открытым - то фиг. С помощью

strace -e trace=open,read,write -p

ничего выяснить мне не удалось. pfiles под Linux нет. Оказалось правда, что Eugene Teo написал утилиту pfiles, но на systemtap. Но справиться с ее установкой мне , увы не удалось.




Читать дальше...

Oracle Upgrade companion

Metalink Note:466181.1 ведет на прекрасную страничку посвещенную миграции с 9i на 10gR2.
Огромное кол-во информации, которую надо собирать по документации собрано вместе, в удобном интерфейсе.
Мгновенно, можно например получить информацию, что при сборе статистике теперь для method_opt вместо FOR ALL COLUMNS SIZE 1 в 9i теперь FOR ALL COLUMNS SIZE AUTO.

Есть даже пошаговое описание процесса миграции !

Наставиваю, чтобы Вы просмотрели эту информацию если Вы мигрируете на 10gR2.
Экономия времени для Вас будет огромная.


Читать дальше...

Itanium Servers With Montecito Processors

Спустя год (если я не ошибаюсь) после выпуска процессоров Montecito публика обнаружила старую историю - Oracle Universal Installer падает. То же самое было когда вышел Pentium 4 - слишком старая идет java с OUI.

Формальный ответ что делать Note:400227.1
Как догадаться что у Вас Montecito: Note:401332.1

Но я бы сначала попробовал бы просто:

- install SUN SDK1.4.2_11 JVM (or higher ex: 1.5.x)
- now invoke the OUI using following command
./runInstaller -–jreLoc /jre


Читать дальше...

Семинар Oracle RAC для разработчиков

14-15 февраля уже 2008 года в Москве будет проводится двухдневный семинар для крупных заказчиков (Large Customers) и системных интеграторов (SI). Семинар будет интересен администраторам, разработчикам, системным архитекторам. Будут (я надеюсь) приглашенные RAC гуру. Мы постараемся сделать как можно больше демонстраций.

Чуть позже я выложу агенду семинара, но безусловно это событие должно быть Вам интересно, если Вы планируете перевод своей системы в RAC. Контент разрабатывается с тем, чтобы было интересно всем участникам команды.

Если Вы хотите участвовать, но ваша компания не проходит по категории (ISV, SI) можно попробовать обратится к Сергею Данилову (sergey.danilov)

Чуть не забыл, это будет полностью бесплатный семинар, включая полноценные обеды.

Update1: Сергей попросил уточнить, что это мероприятия для крупных заказчиков и системных интеграторов. Для ISV будет отдельное мероприятие, чуть позже.

Так как иногда сложно решить, чем является Ваша компания в большей степени, я рекомендую связываться с Сергеем.


Читать дальше...

ISV migration center

В Москве прошло офицальное открытие ISV migration center. Это значит, что ISV партнеры получили возможность протестировать свои приложения на настоящем железе: 5 узловой RAC кластер + 5 узловой IAS кластер. Операционную систему (Linux, Windows) Вы сможете выбрать сами.

Семинары в ISV MC будет читать Игорь Мельников (igor.melnikov).

You are welcome !

Чтобы получить возможность тестирования Вы (если Вы ISV партнер конечно) должны обращаться в Московское представительство Oracle к Константину Новикову и Дмитрию Никитову.


Читать дальше...

Export is desupported in 11g

Оригинальнальная утилиты exp не будет поддерживаться в 11g. Официальная информация в Note:345187.1
Также из документации по 11g : "Original export is desupported for general use as of Oracle Database 11g".


Читать дальше...

Политика лицензирования SE

Оказалось, что политика лицензирования семейства (Standard Edition , SE*) не очень простая.

В частности, продолжают задавать вопросы, а можно ли использовать SE, если в сервер можно поставить 8 сокетов,
но поставлено то сейчас всего 4 ?

Ответ: нет, нельзя. В Software Investment Guide явно упоминается термин maximum capacity of.
Мне кажется, что лучше запомнить эту логику можно, если процесс лицензирования представить себе как двухступенчатый.

1. Убеждаемся, что на данный сервер мы может поставить SE, т.е. число сокетов <= 4 и если можно, то
2. Оплачиваем только установленные процессоры в выше приведенном примере, необходимо оплатить 4 сокета для Enterprise Edition. Если у Вас сервер с 4 сокетами, а установлено всего 2, то необходимо оплатить 2 сокета или (о ужас !) купить минимум 5 пользовательских лицензий. То же самое верно и для RAC для SE - кол-во сокетов в кластере не должно превышать 4, и минимум (ужас, ужас) - все те же минимум 5 пользователей, на весь
кластер. И конечно же не мечтайте разбить Ваш большой SUN на домены и наставить в них SE - это явно запрещено в SIG. Возможно путаница идет из-за того, что публичный прайс-лист перестал содержать дополнительные сноски, теперь необходимо читать SIG, что конечно не все делают.

А если внимательно прочитать SIG, то Вы еще обнаружите, что для RAC на SE Вы обязаны использовать ASM и только Oracle Clusterware (вендорское кластерное ПО не поддерживается)

PS.
Может быть Вам будет интересен и Oracle VM Support Price List ?




Читать дальше...

Oracle RAC 10gR2 for IBM AIX

Теперь в Москве, в IBM Innovation Center'е есть стенд с 10gRAC on IBM AIX 5L.
4 ноды (являющиеся партициями p570), по 2 CPU, по 8 Gb памяти, дискового пространства очень много :)

Если необходимо, этот стенд можно превратить в 11gRAC.

Вы можете обращаться в IBM или в Oracle с целью заказать тестирование своего приложения в данной конфигурации. Надеюсь дальнейший текст убедит Вас что для тестирования лучше взять готовый стенд, а не собирать самим.


Установка 10gR2 на IBM AIX показалось мне достаточно сложной. Серьезное время занимает подготовка, а точнее выбор метода установки:

- over HCMP
- over GPFS
- use only ASM

Для выбранного метода нужно аккуратно перерыть metalink, чтобы осознать текущую ситуацию с сертификацией.

В результате я выбрал самый простой (и надежный путь) - Clusterware размещается на hdisk'ах, данные на ASM (и GPFS по желанию).

В установке мне очень помогли два документа:

- COOKBOOK-V2.0-10gRACR2-ASM-AIX5L-SAN_Storage.pdf
- COOKBOOK-V2.0-10gRACR2-GPFS-AIX5L-SAN_Storage.pdf

Оба содержат слова Quick Installation Guide и по 240 страниц текста :) Написаны сотрудниками Oracle IBM Joint Solution Center в Монпелье. Крайне рекомендую к прочтению при подготовке.

Но следовать им слепо также нельзя - каждый шаг я проверял по:

Oracle® Database
Oracle Clusterware and Oracle Real Application Clusters
Installation Guide
10g Release 2 (10.2) for AIX
B14201-04

В результате, обнаружил пока непонятную для меня вещь:

Если удалить PVID с диска (как настаивают вышеприведенные COOKBOOK), Clusterware не хочет работать с таким диском. Т.е. не проходит root.sh который должен разместить OCR диск. Чтение truss погрузило в мысли о бренности существования, но ничего не дало.

После чтения документации было выполнено

chdev -l hdisk… -a pv=yes


и сlusterware установилось. А вот для ASM дисков PVID не нужны, их действительно рекомендуется снести, тем более что ASM их потом переписывает сама.

К сожалению ни runInstaller, ни cluvfy не проверяют окружение так подробно, как бы хотелось. Так они не смогли проверить версии XlC пакетов

xlC.aix50.rte 7.0.0.4 <---- Ensure versions are not lower
xlC.rte 7.0.0.1 <--- Ensure versions are not lower


что привело к результате к

0509-136 Symbol _Getnumpunct__FPCc (number 105) is not exported from
dependent module /usr/lib/libC.a[ansi_64.o].

Конечно после установки более новой версии все закончилось благополучно.

Моя версия руководства по установке будет чуть позже, но она конечно не такая серьезная как вышеприведенные cookbook.


Читать дальше...

FCF versus TAF

В данной заметке речь идет про Fast Connection Fail-over (FCF) и Transparent Application Failover (TAF), а конкретно чем различаются эти два механизма и какой предпочесть, если есть такая возможность.

Ниже авторский перевод из замечательной книги Oracle Database Programming using Java and Web Services. Курсив мой.

Application-Level Connection Retries. FCF предоставляет приложению возможность решения о повторе попытки соединения в случае сбоя (т.е. можно, получив сообщение, решить, стоит ли выполнять автоматическое переподключение или нет. Например если нельзя восстановить контекст сессии, то стоит сразу выдать ошибку). TAF выполняет переподключение автоматически на уровне OCI/NET без контроля со стороны приложения.

Integration with Connection Cache
. FCF интегрирован с Implicit Connection Cache. Разорванные соединения автоматически инвалидируются (и таким образом не используются, а создаются новые соединения). TAF работает на уровне отдельных соединений и не уведомляет cache о произошедшем сбое.

Event Based. FCF работает поверх ONS, таким образом произошедшие в кластере события быстрее получают как активные, так и неактивные сессии. С другой стороны, TAF базируется на сетевых вызовах (таки образом неактивные соединения не получают сообщения об ошибке пока не сделают вызов). TAF не интегрирован с JDBC connection cache и не обеспечивает балансировку нагрузки во время выполнения.

Load Balancing. FCF и балансировка нагрузки времени выполнения поддерживают событие UP для сервиса, распределяя нагрузку на вновь введеные узлы для и обеспечивая балансировку нагрузки во время выполнения.

Transaction management. FCF автоматически откатывает необходимые транзакции. TAF же требует от приложения явной операции rollback.


Настройка. Для корректной работы TAF следует произвести специфические настройки в ОС, настроить TCP timeout (см. например здесь). FCF одинаково работает в любой среде.



Важно знать, что не следует одновременно конфигурировать оба механизма

"
Note: Do not configure Transparent Application Failover (TAF) with
Fast Connection Failover for JDBC thick clients as TAF processing will
interfere with FAN ONS processing
"

Для дальнейшего чтения всем рекомендую metalink Note:334471.1
и естественно пост автора рекомендуемой книжки.


И только для "настоящих пацанов" рекомендую раздел HA event notification из OCI Programming Advanced Topics, которая рассказыват, как в OCI, работая через TAF получить таки доступ к событиям кластера с помощью подписки на Advanced Queue в отдельном соединении


Читать дальше...

Опрос - Используете ли Вы виртуализацию ?

Хочу Выразить свою признательность всем проголосовавшим.
Из-за небольшого кол-ва голосовавших стоит наверно оченивать результаты не как "используется ли виртуализация или нет ?" а как "если используется то какая"
С большим отрывом победила Vmware - что вполне справедливо. на мой взгляд.

Небольшой анонс: я собираюсь в декабре месяце исследовать возможности Oracle VM и выложить здесь результаты. Насколько я понимаю, первое что будет всех интересовать - это сравнение с Vmware.


Читать дальше...

Oracle tech Day Minsk (cluster reconfiguration)


Во время Oracle Tech Day в Минске я выступал с презентацией "Архитектура максимальной доступности" и показывал мультфильм, демонстрирующий балансировку нагрузки и поведение кластера во время неожиданной перегрузки одного из узлов (прочитать про все мультфильмы).

Во время демонстрации фильма, кто-то из зала, воспользовавшись темнотой :), задал коварный вопрос - "а почему падает в 0 кол-во транзакций ? " и я пытался объяснить этот факт не вдаваясь в архитектуру, что оказалось очень не просто. Сейчас я восполню этот пробел, насколько я смогу. Во первых детально различные сбои в кластере и необходимые настройки, чтобы уменьшить продолжительность сбоев собраны в замечательной whitepaper (внимание, она про 10g у меня в мультфильмах 11g)
Для удобства я привожу картинку оттуда: действительно на какое-то время транзакции в системе останавливаются. Но, это время ~ 2 сек.

Так что же происходит, когда один из узлов вдруг пропадает ?
(дальше мои предположения, возможно они не абсолютно точные)


1) Clusterware обнаруживает, что узел перестает голосовать в voting диске и (скорее всего) хочет выбросить этот узел из кластера, но сети тоже нет. Скорее это происходит быстро, несколько секунд.

2) Далее блокируется глобальная база блокировок (IDLM)
Начиная с этого момента кол-во транзакций падает. потому что продолжаются только транзакции, которым нужны данные на локальном узле.

3)Далее необходимо выполнить переконфигурацию ASM. Опрации ввода-вывода замедляются.

4)Далее идет переконфигурация экземпляров для переделки "прав собственности" владельцев объектов в глобальном кеше.

Я думаю на этапе 3-4 транзакции в кластере прекращаются полностью.

5) Далее выполняется оставшиеся узлы кластера выполняют instance recovery

6) Число транзакций в системе нарастает, но если транзакциии встречается блок, который необходимо восстановить - он восстанавливается, только потом транзакция продолжается.

7) Все блоки восстановлены - достигнут максимальный уровень производительности.

Для увлекающихся могу порекомендовать еще вот эту ссылку:
Oracle RAC: Cluster reconfiguration steps
К сожалению сама книга в бумажном варианте мне сейчас недоступна, как только я ее получу возможно что-то и изменю в тексте выше.


Давайте обсудим результат: ~2 сек простоя системы. Как видно из рисунка слева - это четыре 9 ! Давайте решим что у нас 4 узла, что каждый из них раз в год перегрузиться неожиданно - все равно укладываемся.

Попробуйте найти у вендоров оборудование, которое сертифицировано по такому же классу (9999) - есть, на надо еще поискать и посмотреть на его стоимость.

Итак: Я надеюсь, все понимают, что мы рассмотрели самый тяжелый случай - перегрузку узла. Что в случае планового обслуживания у Вас не будет простоя сервиса, если Вы все сделаете аккуратно.

Итого, при соответсвующем оборудовании мы может строить на Oracle RAC системы с уровнем доступности четыре 9999. Сравните это с HA решением (cold failover) - там с трудом можно попасть в две 9.


Читать дальше...

RMAN-04014: startup failed: ORA-00439

Если Вы захотите сделать single standby node для своего замечательного RAC кластера, как вы поступите ? Конечно же установите Oracle binaries на standby, а затем скопируете БД без промежуточного backup'а
с помощью rman (11g feature) :

duplicate target database for standby from active database


И вот тут может случиться:

RMAN-04014: startup failed: ORA-00439: Real Application Clusters


Оно и понятно - ведь у Вас не кластерный standby. Логики этого сообщения я не понял, но вышел из положения с помощью

make -f ins_rdbms.mk rac_on
make -f ins_rdbms.mk ioracle

На standby node.


Читать дальше...

Oracle Validated Configurations

Если начальство требует от Вас выбора "железа" под Oracle на Linux - эта ссылка для Вас !

Oracle Published Validated Configurations


PS
А если начальство склоняет Вас к Windows - скажите, что validated сconfiguration есть только для Linux :)


Читать дальше...

Опять про clusterware

Я уже писал, что с помощью Oracle Clusterware можно организовать HA кластер, и что лицензия это позволят сделать. Но столкнулся с ситуацией когда гениальные продавцы все-таки продают нашим клиентам hacmp для переключения с ноды на ноду. Наверно если за деньги, то он умеет больше ? Спрашиваю, если повиснет БД, не диски или сетевые платы, а именно БД, что произойдет с кластером, будет переключаться ? Ответа нет. Я точно знаю, что для Veritas Cluster Server'а было нужно покупать расширенного агента, который умел ходить в БД, и если у него это не получалось, как вариант, вызывать переключение кластера. Т.е. нужно было покупать два продукта.
А что же наше, родное clsuterware будет делать, если повиснет БД ?
По умолчанию - ничего, удовлетвориться наличием процесса pmon. Но если написать всего несколько строчек в act_db.pl - сможет и ходить в БД и запросы давать. Гибко все очень. Здорово. И бесплатно, что в нашей действительности должно было быть главным двигателем прогресса, если бы не исскуство продаж :)


Читать дальше...

Установка Oracle RAC 10g на Linux on POWER

Хочу поделиться ощущениями от установки Oracle 10g RAC на платформу Linux on Power

Ставили все коллеги, я осуществлял всего лишь поддержку по телефону. Прошло все на удивление гладко. Оказалось, что у IBM существует очень приличная статья на эту тему:
IBM Wikis - Linux on POWER - Installing Oracle Real Application Cluster RAC

Вслед за статьей хочу обратить Ваше внимание, что какую бы вы хорошую статью не нашли, крайне рекомендуется прочитать и документацию.

Ставилось все на Red Hat 4 for Power Update 4.
Узлы представляли собой LPAR выделенные с p570 машины.

Насколько я понял, "наехали" на следующие вещи:

1. Забыли поставить The IBM XL C/C++ Advanced Edition V7.0.1 for Linux Runtime Environment Component
2. glibc-devel должен быть и 64-bit и 32-bit версиях (? этого нигде нет, но без него не работает )
3. Были еще проблемы с правами при установке 10.0.3 patchset. Почему-то на удаленных узлах потребовалось сменить права на clusterware. Ясности тут ни у кого не осталось.


Перед установкой крайне рекомендую Metalink Note:341507.1
В частности узнаете про patch 4767801.



PS
Коллеги также поделились интересной ссылкой:
http://www.idevelopment.info/


Читать дальше...

Опрос "Планируете ли Вы миграцию на 11g ?"



Несмотря на небольшое кол-во проголосовавших тенденция, мне кажется, понятна и совпадает с тем, что наблюдалось при выходе 10g.

Тут есть только вот какая опасность. Мне удается сейчас встречаться с разными людьми, в том числе и серьезными разработчиками и администраторами. Так вот, не в обиду будет сказано, возможностей 10g R2 знают далеко не все. И вроде как идти на курсы сейчас странно - уже 11 выпустили...Получается такой круг - с одной стороны при выходе новой версии большая часть пользователей ждет R2, и поэтому не получает с этой новой версией практического опыта, а как решается мигрировать, так выходит уже следующая версия.

Наверно каждый решает для себя, как быть. Я лично считаю, что следует использовать любую возможность, чтобы поработать сейчас с 11g, чтобы просто оказаться готовым в тот момент, когда нужно будет на нее переходить.

А пока хочу предложить Вам новый опрос - "Используете ли Вы виртуализацию ?"


Читать дальше...

Larry Ellison about Oracle VM

Очень рекомендую Вам посмотреть первые 10 минут выступления Larry Ellison на Oracle Open World.

За эти 10 минут он очень ясно объясняет, почему он решил выпустить Oracle VM и как это должно работать. "One call to support" - мне это понравилось !

Мне кажется очень важно понимать идею, независимо от того как Вы к ней относитесь. И конечно вопрос, когда это будет стабильно работать. Но сомнений, что это будет работать у меня нет.

PS
Кстати на слайдах уже более корректная формулировка насчет "3 times" - "3-x less overhead"


Читать дальше...

Новости виртуализации и не только

Вы уже можете Скачать Oracle VM
После прочтения документации у меня смешанные ощущения - много вопросов остались без ответа, наверно нужно пробовать ставить.

Ну а пока, появился успешный пример использования моего образа 11g rac под Vmware. Для этого пришлось добавить инструкцию по настройке Vm network и небольшой faq.

PS
Как кстати настраивать виртуальные сети под Oracle VM я не понял.


PS2
В описании нового Vmware Server 2.0 уже встречаются слова "Enable a single operating system instance to run natively or in paravirtualized mode"


Читать дальше...

Читая OLSA

Знаете ли Вы, что согласно Oracle license and services agreement (OLSA)

Вы не имеете права
"разглашать результаты каких-либо стендовых испытаний без предварительного разрешения Oracle" ?


Читать дальше...

New Oracle sites

2 ссылки на сайты Oracle, которые могут Вам понравиться:

  1. OTN Semantic Web (Beta)
  2. The Official Oracle Wiki
OTN semantic Web мне очень понравился, потому что можно достаточно легко "переключиться" на интересную тебе тему.

В Wiki как мне кажется, надо вчитываться, фильтровать шум..


Читать дальше...

11g is available for most platforms

11g стала доступна для скачивания для платформ Solaris, AIX, HP-UX. Теперь полный список платформ выглядит так:

Download Microsoft Windows (32-bit) (1.7 GB)
Download Microsoft Windows (x64) (1.7 GB)
Download Linux x86 (1.7 GB)
Download Linux x86-64 (1.8 GB)
Download Solaris (SPARC) (64-bit) (1.9 GB)
Download AIX (PPC64) Disk 1, Disk 2 (2.3 GB)
Download HP-UX Itanium Disk 1, Disk 2 (2.3 GB)


Читать дальше...

Oracle VM

Андрей Пивоваров первым заметил, что oracle собирается открыть 14 ноября для скачивания Oracle VM.

Из интересного - разработчики обещаю сертифицировать RAC под Oracle VM.
Как Вы конечно знаете, RAC на Vmware не поддерживается :(
Официальная страница Oracle VM

Update 1 (14.11.2007):
Вот из этой ссылки становится больше понятно про Xen:
A Performance Comparison of
Commercial Hypervisors

(via Alexander)

Update 2 (15.11.2007):

Оказывается Xen уже в Enterprise Linux 5:

ls -l /boot/ | grep -i xen
-rw-r--r-- 1 root root 61053 Jun 6 08:13 config-2.6.18-8.el5xen
-rw------- 1 root root 1520866 Aug 31 16:37 initrd-2.6.18-8.el5xen.img
-rw-r--r-- 1 root root 84906 Jun 6 08:14 symvers-2.6.18-8.el5xen.gz
-rw-r--r-- 1 root root 868062 Jun 6 08:13 System.map-2.6.18-8.el5xen
-rw-r--r-- 1 root root 2076322 Jun 6 08:13 vmlinuz-2.6.18-8.el5xen
-rw-r--r-- 1 root root 274721 Jun 6 07:05 xen.gz-2.6.18-8.el5
-rwxr-xr-x 1 root root 608564 Jun 6 08:40 xen-syms-2.6.18-8.el5


Читать дальше...

OTF 2007

Появились презентации с Oracle Tech Forum 2007
http://www.oracle.com/global/ru/events/techforum/2007/report.html


Читать дальше...

Oracle Options


Хочу представить вам свою презентацию Oracle Database 10g & 11g. Она рассчитана на представление технологий Oracle слушателям, которые не имеют существенных знаний о компании Oracle и ее СУБД. Если Вам приходится представлять слушателям технологии Oracle надеюсь эта презентация будет Вам полезна.

Для продвинутых пользователей, надеюсь, будет интересным следующие цифры:


  1. У Oracle 11 различных баз данных
  2. И "всего" 16 опций Oracle Database


Читать дальше...

DataGuard and password file

Я думаю, что очень многие наступят на это. Даже если Вы при установке 11g отключили все новые фичи по управлению паролем, при работе с DataGuard у вас может случиться

"ORA-16191 and ORA-1017 when you change or create the password file using orapwd"

И накат логов прекратится.

Я наступил на это просто пересоздав password file на стороне DataGuard. Причем, конечно же, использовал тот же самый пароль, что и на primary side. Ничего не помогало, пока не был скопирован password file c primary side.

Решения данной проблемы описаны на metalink в note 462219.1
Одно из решений - совпадает с моим, второе требует установить SEC_CASE_SENSITIVE_LOGON=FALSE и пересоздать password file c ignorecase=Y

Но почему этот параметр не был false, я же при установке 11g указал, что не хочу использовать новую модель безопасности ?


Читать дальше...

Oracle Critical Patch Update - October 2007

Если Вы не обратили внимание, в октябрьском CPU появились слова CVSS VERSION 2.0 RISK
и колонка BASE Score - т.е. оценка серьезности обнаруженной дыры.
Если Вы хотите узнать как это рассчитывается, или почему максимальный Base Score может быть в Oracle только 7.5 срочно читайте Understanding the Common Vulnerability Scoring System (CVSS): Part 1

Ссылки по теме:

Oracle Critical Patch Update - October 2007


Читать дальше...

Архитектура максимальной доступности

Хочу представить Вам свою презентацию Архитектура максимальной доступности с использованием 11g. Я постарался с одной стороны осветить эту тему как можно шире, с другой стороны уложиться в приемлемое время (~ 1 час). Демонстрационный ролик, упомянутый в презентации вы можете найти в этом блоге чуть ниже.

Данная презентация может быть полезна как тем, кто не сталкивался с этой темой, так и тем, кто активно использует 10g - новые возможности 11g специально отмечаются.






Очень кстати нашлась и аналитическая статья про Disaster Recovery и Data Protection
New Database Technologies Usher in New Approaches to
Data Protection and Disaster Recovery
(by TANEJA Group)

Мне особенно понравился абзац про не слишком впечатляющие возможности в этой области Microsoft SQL Server и IBM DB2 :)))))

PS
Погоды в Казахстане, где я участвовал в Oracle Tech Day стоят весьма разные.
Как видно из фотографии - повалил снег...


Читать дальше...

Семинар Игоря Мельникова 11g для разработчиков

Темы семинара:

• Новые возможности в PL/SQL
• Прочие новые возможности (Datapump,
Scheduler и т.д.)
• Новое в Partitioning Option
• Advanced Compression Option
• Flashback Archive
• SecureFiles
• Real Application Testing

Архив презентаций


Читать дальше...

Oracle Tech Forum (11g launch)

Ну вот и закончилось одно из самых громких событий этого года - Oracle Tech Forum.

Остается только вспоминать как это было.
И кажется это я долго не забуду. Дело в том, что после перевозки наш дисковый массив "забыл" конфигурацию дисков :)

Но все по порядку:

Главным спонсором мероприятия был HP и поэтому дальше будет много рекламы HP.

Прежде всего это 4-узловой кластер на основе HP Blade Server c7000. Очень компактная, удобно упраляемая стойка с блейдами. Мне она очень понравилась. Пару фотографий Вы найдете ниже по ссылке. Огромное спасибо коллегам, что выделили ее нам и помогли с конфигурацией.

Показывали мы (это я и Андрей Блажнов, R-Style) конечно 11g RAC на Oracle EL 5 и конечно swingbech.

Некоторые мультфильмы по swingbech вы найдете здесь (ссылка поскипана)

(качество не лучшее, и наверно можно повырезать кое-что. Смотреть можно с помощью Divx или Windows Media Player)

scalability.wmv - пример масштабирование приложения на основе схемы СС

balance_and_failover.wmv - пример балансировки нагрузки, затем failover одного узла, затем повторная балансировка

interface_down.wmv - при опускании интерфейса с интерконнектом узел в течении 30 сек уходит в перезагрузку (это начиная с 10.2.0.3)

blade_overview.wmv - реклама HP (Ilo и прочее)


А также предлагаю посмотреть Вам настоящее кино: (ссылка поскипана)
(Смотреть можно Divx или VCL player, или Real Player. Windows MP у меня не берет)


HP_disaster_proof.wmv - прекрасный, с чувством юмора фильм про datacenter'ы HP. Он же и полезный - вы найдете там несколько важных цифр !

oracle_grid_computing.mpg - глубоко-филосовский фильм про технологии Grid.

Enjoy and welcome to the next Oracle Tech Forum !

PS
А что же массив ?
Приехал инженер HP, за 5 минут разбил его заново и мы поставили кластер, еще до обеда :) На фотографиях есть timing.

PS2
Автор фотографий и режиссер клипа по scalability.wmv - Сергей Данилов (Sergey.Danilov)


Читать дальше...

Oracle Whitepapers

Интересный сайт со статьями про Oracle - Oracle Whitepapers
В первую очередь мне кажется интересен тем, что там выложены статьи партнеров Oracle.
И следовательно там изложен реальный опыт работы с продуктами.


Читать дальше...

New Data Masking Pack for EM

Вместе с EM 10.2.0.4 вышел и очень интересный новый pack - Data Masking Pack
Он решает задачу "порчи" важных данных перед тем как передать БД на тестирование или разработчиками.

White Paper:
ds_datamasking.pdf (application/pdf Object)


Читать дальше...

Обзор Oracle Scheduler

Игорь Мельников (Igor.Melnikov) подготовил еще одну презентацию по 11g - "Обзор Oracle Scheduler"

Для меня в ней остался загадкой только один момент - как же выполняются удаленные задания (external job ) ? По документации на удаленном хосте может не быть oracle database.

Удалось найти только ссылку GUIDE TO RUNNING EXTERNAL JOBS WITH DBMS_SCHEDULER

В документации есть туманная таблица 26-1 по которой можно догадаться, что по крайне мере в Windows
без специального сервиса ничего не получится. Конечно в Unix зная ip адрес и логин пароль ничего не мешает выполять задание на удаленной машине. Хотелось бы конечно намека на протокол (ssh , rexec или ?) ..


White papers на корпоративном сайте: scheduler.pdf (application/pdf Object)

Update 1:
Для выполнения удаленных заданий на хосте должен быть OEM агент ?


Читать дальше...

Clean up failed crs install

Бывают ситуации, когда необходимо очистить предыдущую установку CRS

Подробно и для всех ОС изложено в Note:239998.1


Для Linux:

# Remove ocr.loc
rm -rf /etc/ora*

# Remove oracle base
rm -rf /u01

# Remove all voiting and ocr disk's. Repeat for all disks !
dd if=/dev/zero of=/dev/sda2 bs=1024 count=100

# Clean up all ASM disks. Repeat for all ASM disks !
dd if=/dev/zero of=/dev/sda4 bs=1024 count=100

PS
Скорее всего совершенно непонятные ошибки на установке могут быть вызваны
остатками предыдущего crs. У меня не стартовал ONS с сообщением segmentation fault :))

Он просто находил предыдущее расположением ocr и пытался туда записать. А диска уже не было :)


Читать дальше...

DataPump

Игорь Мельников (igor.melnikov) предоставил еще одну презентацию для разработчиков - на этот раз про DataPump. В презентации также приводятся и новые возможности (шифрование, сжатие, преобразование данных и т.д.) которые получил datapump в 11g


Читать дальше...

EMGC and 11g

11g Database уже есть, а вот Grid Control 11g еще нет.
Разработчики GC сказали, что их 11 версия появится только когда выйдет 11g database на всех основных платформах.

А что же сейчас делать ?
Оказывается можно попробовать EMGC 10.2

"
Oracle® Data Guard
Broker
11g Release 1 (11.1)
B28295-01

Scenarios Using Oracle Enterprise Manager
This chapter describes the Data Guard Broker graphical user interface (GUI) provided
in Oracle Enterprise Manager Grid Control 10.2. This is the latest currently available
broker interface in Enterprise Manager. You can use it to create, manage, and monitor
an Oracle Database 11g release 1 (11.1) Data Guard configuration.
"

Кстати, только что появился EMGC 10.2.0.4 для Windows и Linux.
Правда, судя по readme, по сравнению с 10.2.0.3 в него просто добавили все вышедшие за последние время агентов.


Качать здесь.
Будьте осторожны, там патч больше 1gb, но это всего лишь патч. Для патча еще требуется 10.2.0.1 (Linux) или 10.2.0.2 (Windows)


Завтра узнаю как он работает с 11g :)


Читать дальше...

TAF or not TAF

Поставили мы с коллегой 4-х узловой кластер 11g, Linux x32 (EL5) на вот таком железе HP Blade System c3000.

Настроили TAF и конечно же его попробовали.
На одном из узлов останавливаем instance с помощью shutdown abort - сессии немедленно переезжают на другие узлы.

Все замечательно ?

"Неет, сказали суровые сибирские мужики" (C)

И остановили публичный интерфейс (ifconfig eth0 down)
На этой ноде остановился listener, в течении ~30 сек VIP адрес переехал на другой узел.
БД и ASM остались без изменений, все как надо (если кто не знает, так работает начиная с 10.2.0.3)

А что-же TAF ? А ничего. Сессии намертво "залипают" и висят. Ждали 15 минут потом надоело.

Мы догадались, что сессии не перезжают потому, что получают никакой ошибки. В первом случае (с shutdown abort) ошибка приходит немедленно, а в этом - не приходит и все.

Metalink нашел массу багов, когда в такой ситуации даже VIP не перезжает. Но у нас с VIP все хорошо.

Отгадка была не очень сложной. Но, как-то не слишком известной что-ли.
Называется она tcp_keepalive.
Т.е. сессий oracle не получает ошибки потому, что по умолчанию нижележащий tcp/ip стек пытается восстановить соединение.

Решение пришло в виде добавления ENABLE=BROKEN в tnsnames - это обозначает доверять настройкам ОС - и изменению параметров tcp в Linux:

Добавил в /etc/sysctl.conf

# tcp tuning
net.ipv4.tcp_keepalive_time=10
net.ipv4.tcp_keepalive_intvl=5
net.ipv4.tcp_keepalive_probes=5
net.ipv4.tcp_syn_retries=1
net.ipv4.tcp_retries2=3

и выполнил sysctl -p
Сесси стали получать ошибку в течении ~30 сек.

Прекрасные ссылки:

Как работает TAF и какие ошибки бывают на каких платформах
http://www.oracle.com/technology/tech/oci/pdf/taf_10.2.pdf

Кстати в описанной ситуации, клиент на MS Windows Server 2003 получает
ORA-12571: TNS:packet writer failure и достаточно быстро без доп. тюнинга


Как с подобной проблемой разобрались ребята из Церна:
https://twiki.cern.ch/twiki/bin/view/PSSGroup/OCIClientHangProtection

Они кстати приводят простой но очень правильный пример приложения на С c собственным таймером (!)



Окончательный вид конфигурации

TAF =
(DESCRIPTION =
(ENABLE = BROKEN)
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(host = rac1-vip)(PORT = 1521))
(ADDRESS = (PROTOCOL = TCP)(host = rac2-vip)(PORT = 1521))
(LOAD_BALANCE = yes)
(FAILOVER = true)
)
(CONNECT_DATA =
(failover_mode=
(type=session)
(method=basic)
(retries=2)
)
(SERVICE_NAME = racdb.ru.oracle.com)
)

)


PS

Кстати, если опустить интерфейс с интерконнектом, в течении 30 секунд узел идет в перезагрузку и это
правильное, документированное поведение.

Умиляет только, что же он перед перезагрузкой не попробует поднять интерфейс-то :)
Буду это изучать.


Читать дальше...

Database Change Notification

Игорь Мельников (igor.melnikov) подготовил презентацию Oracle Database Change Notification
Но и прочие коллеги тоже не дремят - появилась статья из серии OBE - Using Database Change Notification With ODP.NET and 11g

Кто сделает следующий ход ? :)


Читать дальше...

APEX и 11g

В свое время я был страшно разочарован качеством примеров поставляемых с APEX. Ну хоть оформление-то можно было подобрать приличное, чтобы можно было сразу пользоваться ?

Но сегодня разочарование прошло. Я почти случайно увидел какие примеры для генерации web галерей предлагает фирма Adobe. Рекламируя новый, современный движок для создания web галерей они сподобились создать 4 примера на уровне, которым пользоваться, как мне кажется, никто не будет.
И это Adobe - дизайн их прямая специализация, сколько они продуктов выпустили по web дизайну..

Увы, логика понятна - в обоих случаях упор делается на движок. Вся обвязка к нему - удел счастливых разработчиков :)

К чему это я все ?

Ах, да ! APEX ставится теперь по умолчанию с 11g.


Читать дальше...

Learning Oracle RAC with the Filer Simulator

Я лично знаю 2 способа получить разделяемую файловую систему для своих вирутальных машин с Oracle RAC 11g:

NetApp simulator (Learning Oracle RAC with the NetApp Simulator)
и OpenFiler (http://www.openfiler.com/).

Не до конца понятно зачем они нужны, ведь с разделяемой директорией (3-ий способ :)) все также работает как из пушки.

Мы на курсах по HA использовали OpenFiler через iSCSI (произносится на йоркширском "aйскузи", кто бы мог подумать !).

Вроде ничего, работал. Но после перезагрузки постоянно одна из нод в fdisk не видела партиций в устройствах /dev/sd*
Но это вовсе не мешало работать через /dev/iscsi/***

В общем - ощущения смешанные. А вот говорят есть отдельные коробочки с дисками, внутри которых уже есть Linux, и которые прикидываются вот такими filer'ами - вот это тема !


Читать дальше...

Installing CRS on EL5

Наконец хоть какие-то идеи как изменять права на устройства в EL5
Пока сам это не не проверял

"
Udev syntax has nominally changed between EL4 and EL5.
You've not explicitly stated it, but as you're installing RAC, I'm assuming you're intention for /dev/sda5(?) is for raw clusterware files?
If so, be aware of 1.) raw deprecation in EL5, 2.) the potential for non-persistency of kernel assigned device naming.

Having said that, based on the following rule examples, you might some permutation of the following (verified to work), then restart udev:

-- /etc/udev/rules.d/20-names.rules
KERNEL=="sd*",OPTIONS+="last_rule",NAME="sdd%n",NAME="sde%n", OWNER="crs", GROUP="oinstall", MODE="660"
#eof
Factoring the potential for non-persistent udev device naming, you can configure/use scsi_id to query for a named device, then have your rule match for that value eg.
-- /etc/udev/rules.d/20-names.rules
KERNEL=="sd*",PROGRAM="/sbin/scsi_id",RESULT=="149455400000000000000000005000000761000000d000000",OPTIONS+="last_rule",NAME="ora/sdora%n",OWNER="root",GROUP="oinstall",MODE="660"
# ls -l /dev/ora/sdora*
brw-rw---- 1 root oinstall 8, 48 Sep 6 18:30 /dev/ora/sdora
brw-rw---- 1 root oinstall 8, 49 Sep 6 18:30 /dev/ora/sdora1
brw-rw---- 1 root oinstall 8, 50 Sep 6 18:30 /dev/ora/sdora2
"





Читать дальше...

Изменения в прайс-листе

На самом описываемые изменения произошли с 1 октября 2007 года.

1) New Licensing and Naming for Oracle Lite

Теперь разделили Oracle Lite на Lite Mobile Server и Lite Client - каждый стоит отдельных денег

2) У нас появился Enterprise manager plug-in для VMware ESX Server. Что отражает общую тенденцию к использованию технологий VMware. Напомню что VMware поддерживается только для Database, RAC в VMware не поддерживается

3) Изменились коэффициенты для SUN T2000 - теперь он 0.5 вместо 0.25 http://www.oracle.com/corporate/contracts/library/sun_server_table.pdf
Но это только для 8 ядерного процессора - читайте очень внимательно !

4) Появился отдельный Business Intelligence Applications Price List

5) Теперь определение Named User Plus и Processor находятся прямо в прайс-листе и сопровождаются примерами.

6) Я помню, но не могу найти ссылку что мы стали распозновать 4-ядерные процессоры и считать их одноим сокетом для Standart Edition* продуктов

7) С другой стороны, если ядра 4 но процеесор состоит двух других чипов ситуация меняется

When licensing Oracle programs with Standard Edition One or Standard Edition in the
product name, a processor is counted equivalent to an occupied socket; however, in the case of multi-chip modules, each chip in the multi-chip module is counted as one occupied socket.

About multi-chip:
http://en.wikipedia.org/wiki/Multi-Chip_Module

(этот последний пункт я не очень хорошо понимаю сам, если кто-то может его прокомментировать - you are welcome !)


Читать дальше...

IOUC : International Oracle Users Group Community

IOUC : International Oracle Users Group Community


Читать дальше...

Runtime connection load balancing for OCI

Cудя по документации ( Enabling Oracle Call Interface Clients for Runtime Connection Load Balancing )

в 11g балансировка нагрузки на уровне транзакций (а не соединений) возможно и для OCI клиентов (а не только для JDBC как в 10g), и все благодаря новому механизму OCI connection poll. Балансировка нагрузки производится при помощи Load Balance Advisor, который в свою очередь требует установленного AWR, а следовательно Tuning and Diagnostic Pack. К тому же Вам необходимо переходить на новую версию OCI.

C другой стороны, есть еще один новый механиз пула соединений, уже со стороны БД:
Database Resident Connection Pooling. И вот тут я не понимаю, работает ли та же самая балансировка для него или нет. Стоит ли использовать оба механизма вместе или нет.
С одной стороны для подсоединения с DRCP используется имя сервиса, что точно даст балансировку на уровне соединения. C другой стороны, в DBMS_CONNECTION_POOL.CONFIGURE_POOL нет параметров в которых можно было бы указать tns, а значит соединения делаются напрямую с локальной БД.
Да, для DRCP придется также поставить клиента 11g


Читать дальше...

RAC 11g Cache Fusion

"
The cache fusion technology in RAC has been improved. Workloads that will benefit from these changes are those where most or all of the activity is query (read). These types of applications should see 95% scalability as nodes are added to the cluster
"

Возможно вы уже видели презентации в которых упоминается улучшение Cache Fusion и даже называются цифры
(от 70% до 95%) улучшений для приложений, которые преимущественно читают. Но, ответ разработчиков, что же все-таки изменилось, в моем вольном переводе звучит коротко как : "мы не скажем, код патентованный" .

К тому же (сюрприз !) проценты улучшения приводятся не по сравнению с 10g, а в 11g c включенной фичей и выключенной.

Enjoy !


Читать дальше...

11g Windows & Linux x86-64

Появилась 11g для Windows & Linux x86-64
Oracle Database Software Downloads

(если Вы замечали, что Linux x86-64 появлялся раньше, то мне кажется что лучше скачать заново. Правильная версия появилась 18 октября 2007 года)


Читать дальше...

Upgrading to Oracle RAC 11g on Oracle Enterprise Linux

Хорошая ссылка, к сожалению (насколько я понял) не показывает как сделать rolling upgrade, или скажем обновить только clusterware и ASM

Upgrading to Oracle RAC 11g on Oracle Enterprise Linux


Читать дальше...

Читаем Wikipedia

Скорее просто интересно походить по ссылкам с этой странички знаменитой энциклопедии Wikipedia
Oracle RAC - Wikipedia, the free encyclopedia


Читать дальше...

DataCenter Automation and Configuration Management :

Мне кажется интересный блог, посвещенный управлению кластером с помощью
EMGC:
DataCenter Automation and Configuration Management :

Также попались ссылки по теме:

Video:
http://download.oracle.com/enterprise_manager/extend_cluster/extend_cluster.html

PDF
http://www.oracle.com/technology/products/database/clustering/pdf/emgcdeployproc.pdf
http://www.oracle.com/technology/products/oem/pdf/grid-automation-deployment-procedures.pdf


Читать дальше...

Разные новости

Версии 11g на Windows еще нет, но она уже занимает 1 место в тестах TPC.
Top Ten TPC-C by Price/Performance

Вышел очередной Critical Patch Updates

На корпоративном сайте появилась единая ссылка для различных статей на русском.


Читать дальше...

ASM or raw devices ?


Услышал очень емкую фразу про сравнение производительности ASM и сырых (raw) устройств:

"ASM не производит никаких операций ввода-вывода - поэтому сохраняет производительность сырых устройств"

Действительно (хотя я не смог явно найти этого в документации) регулярный ввод-вывод (т.е. то что делает DBWR или LGWR) как производился этим процессами так и производится. Другое дело, что ASM обеспечивает карту - т.е. куда именно следует записать. Картинка из презентации справа иллюсстрирует тоже самое.

Хорошее описание с правильным (я надеюсь) описанием также можно взять здесь:

AcingASM.pdf (application/pdf Object)

Из картинки мне кажется ясно следует, что только первоначальную разметку и создание/увеличение файлов делает ASM.

Раз так, то мне кажется нет смысла держать БД на raw устройствах.
Естественно, поскольку mirrroring & striping делается на прикладном уровне - это не очень быстро.
Так что если есть возможность - конечно лучше отдавать mirrroring & striping дисковому массиву. Опять таки статистики с массива по вводу выводу можно получить более разумные. Тут есть еще один не однозначный для меня ход :)

ASM всегда делает страйпинг. Таким образом если вы используете возможности массива в ваших дисковых группах должен быть всегда только 1 диск. В противном случае, если появится другой - начнется ребалансинг а затем и страйпинг. Добавление места должно осуществляться только путем расширения этого одного диска.

Опять таки, из-за того что ASM всегда делает страйпинг кажется, что если в дисковой группе будет два разных по объему диска, то будет использоваться только меньший объем. И даже больше - отличное замечание про размер дисков.


Другое дело - сравнение ASM с Volume Manager'ами.
Да, конечно в 11g появилось preferred mirror read, мы потихонечку догоняем функциональность VM, но пока только догоняем.
Мне также обещают прислать сравнение по скорости, где ASM выигрывает у Veritas VM.
Но по гибкости управления ASM все еще проигрывает. Опять таки в 11g в asmcmd появилась возможность копировать файлы данных между ASM и файловой системой.
Но те кто занимаются storage'ами конечно знают, что необходимо гораздо больше возможностей.

Но ASM бесплатно - а промышленные Volume Manager стоят существенные деньги.
Так что у каждого продукта свой круг пользователей.


Читать дальше...

Oracle and InfiniBand

Из внутреннего mail-list'a, мне понравилась краткость изложения и приведенные ссылки.

Если кто-нибудь использует данную технологию на платформе HP-UX напишите мне пожалуйста.

"
Below is some Oracle and InfiniBand information from last year's Oracle World. GigE is sufficient for most of RAC customers today, and InfiniBand is good for customers with interconnect intensive (or latency sensitive) applications or a grid environment with many nodes. See the customer case study in the RDS presentation below.

If the customer's application does not stress the existing interconnect (e.g. GigE), then they won't see the benefits of InfiniBand. We also have customers who are interested in InfiniBand for unified fabric or consolidating public, private, and storage networks into one network. That can bring significant infrastructure cost savings by eliminating expensive components like FC switches, etc.

-----------------------------------------------------------------------

At Oracle World 2006, we made two Reliable Datagram Sockets (RDS) over InfiniBand (IB) related announcements. See the press releases below:

1. The general availability of RDS over IB support on Linux
http://www.oracle.com/corporate/press/2006_oct/openworldsf06 -15.html

2. Oracle sets world record TPC-H one terabyte clustered benchmark result (with RDS)
http://www.oracle.com/corporate/press/2006_oct/openworldsf06- 18.html?rssid=rss_ocom_pr

Oracle World RDS presentation
http://www.oracle.com/technology/deploy/availability/pdf/oow06/S281216_Tsien.pdf


RDS installation documents

http://www.oracle.com/technology/products/database/clustering/pdf/rds_installation_on_oracle_rac_10g_release_2_linux_clusters.pdf
"


Читать дальше...

CREATE EDITION in 11g

Q. Where can I find information about the functionality of CREATE EDITION in 11g?
A.
The answer is simple, if sad: nowhere*!

It was initially intended to expose edition-based redefinition in 11.1. Sadly, Release Management decided to delay the exposure.

Ждем 11R2 ?

PS
Create edition DDL был обещанный механизм борьбы с проблемой перекомпиляции в 11g. Обещали, что будет возможно держать одновременно несколько версий одного и того же пакета.


Читать дальше...

Global FS and voiting file

Ниже идет теоритическое рассуждение, пока не подкрепленное практикой. Буду благодарен любым комментариям.

"
Казалось, что нет никаких проблем в том, чтобы положить скажем voiting file на разделяемую файловую систему. Это поддерживается в многочисленных статьях по совместимости. Однако, при близжайшем рассмотрении, оказалось что это не совсем так. Так. например в Note: 444136.1 уже совсем не рекомендуется делать это для AIX GPFS.
Наскольк я понял, пока файловая система будет решать свои проблемы реконфигурации, voliting file становится недоступным и кластер может "развалиться".

Так ли уж специфична эта проблема для GPFS ? Мне кажется нет.
Опять таки догадка, что важно здесь, работает ли конкретная GPFS поверх понятного для Oracle кластерного софта или нет. Пример - Veritas Global VxFS работает поверх Veritas Cluster'а, а вот похоже GPFS использует свой протокол (не HACMP).

Итак, если у нас есть такая "самостоятельная" глобальная файловая система и у нас, скажем, отъезжает одна из нод, то если реконфигурация файловой системы будет идти долше чем timeout Oracle clusterware - то велик риск, что кластер развалится полностью, чтобы не повредить данные.
Timeout. Ага. Из Note:294430.1 можно видеть, что для Unix таймаут (misscount) стоит по умолчанию в 30 сек. И ноды перегружаются, если не могут внутри таймаута провзаимодействовать или по сети, или через диск.
Не могу привести сейчас источник, но читал, что если Oracle clusterware "садится" поверх стороннего кластерного ПО, то timeout становится 600 сек.

Исходя из последних нескольких предложений: Если у нас "самостоятельная" файловая система то timeout у Oracle clusterware стоит в 30 сек, в момент реконфигурации файловой системы ноды будут перегружаться. Если файловая система стоит поверх кластерного ПО, таймауты у Oracle Clusterware большие, реконфигурация успеет пройти.
Но все равно, мне кажется что voiting стоит размещать только на shared raw устройствах.

Возможно спасает использование копии voiting файла на общем NFS ?

"


Читать дальше...

What's New in Oracle Real Application Clusters Administration and Deployment?


Вот об этом можно будет поговорить 1 ноября на специальном стенде посвещенном RAC на Oracle TechForum. Чтобы Вы не ошиблись привожу общий вид стенда слева :)))


Читать дальше...

RAC on Extended Distance Clsuters

Отличная статья про построение extended distance clusters.
Дейстивтельно, очень интересная, написанная очень простым языком, но содержащая огромное кол-во деталей, которое надо уметь читать между строк.

Даны очень полезные ссылки, приведен список известных customer'ов, использующих это решение.

Крайне рекомендую, мне по крайне мере очень понравилась, и я далеко не все понимаю.
Кто-нибудь может вот это объяснить ?
"
Quorum implementation in HP-UX require that there is an equal number of nodes at each site"
"

Как один человек смог это все написать, легко перескакивая между различными стеками вендорского clusterware ?

ExtendedRAC10gR2.pdf (application/pdf Object)


Читать дальше...

ASM: to be or not to be

Замечательный пример, того, как вендор, в данном случае NetApp, показывает свое решение по управлению данными, не противопоставляет его ASM, а дополняя.

Так например, комбинируя ASM и FlexClone действительно удобно делать мгновенные снимки системы, используя их
как backup, или источник данных для тестовых баз. Идея в том, что такие мгновенные снимки занимаю гораздо меньше места чем традиционный backup. Или использовать SnapValidator для проверки битых блоков на аппаратном уровне (т.е. железо умеет считать контрольную сумму блока данных СУБД). Или использовать NetApp RAID-DP для double disk parity protection, чего ASM делать в принципе не умеет.

Важно следующее - NetApp спокойно излагает аргументы, почему необходимо заплатить еще и за его решение.
Наверно, другой вопрос, сколько заплатить :)

wp-7009-oracle-asm.pdf (application/pdf Object)


Да, ASM становится все умнее, быстрее и лучше, но аппратный вендор всегда сможет предложить нечто свое, уникальное.

Зачем тогда вообще нужен ASM спросите Вы ?
Мне кажется, что как минимум из-за унификации работы с БД. Вы захотите использовать другую ОС, дисковый массив, но с ASM вам не придется переделывать ланшафт БД, срипты или переучиваться.

PS
Я кстати работал с Data ONTAP® правда еще 6 версии. Мне лично очень понравилось это решение.


Читать дальше...

Пример проектной документации по установке RAC, ASM и пр.

Отличный пример проектный документации по созданию Maximum Availability Architecture (MAA),
т.е. установке RAC, ASM, DataGuard на IBM AIX. Показываются скрипты для резервного копирования, какие-то специальные скрипты, учитывающие особенности приложения.
Всего 100 страниц.

Очень рекомендую прочитать, если Вам предстоит подобный проект.

FIS_FNF_OracleMAA_CaseStudy_OpenWorld 2006.pdf (application/pdf Object)

Почему-то у нас очень стесняются положить подобные документы в сеть. Возможно я чего-то не знаю ?


Читать дальше...

11g on Windows Platform

Нет -нет, пока 11g скачать для Windows пока нельзя. Но можно прочитать о ее результатах на tpc.org !

Oracle(R) Database 11g Running on HP with Windows Sets New World Record for Price/Performance with TPC-C Benchmark: Financial News - Yahoo! Finance

Вот так, версии нет, а результаты есть :)


PS
Что касается выпуская 11g под Windows, то наша Penny написала "be ready next week".
Но я Вам ничего не говорил.....


Читать дальше...

Oracle Clusterware license

Updated 11.09
Пропустил такое важное слово any :(. Оказалось это все меняет :)
В комментариях ниже это заметили и указали ссылку на еще одну дисскуссию по этому поводу.


Изменения в политике лицензирования для Clusterware обнаружил Владимир Демкин (Vladimir.Demkin) в Правилах лицензирования 11g:

"Oracle Clusterware can be installed and used to protect any Oracle or third-party software provided any of the following conditions are met:

  1. The software being protected is from Oracle.

  2. The software being protected uses an Oracle Database.

  3. The software being protected is running on Oracle Unbreakable Linux.

  4. The software being protected is running in a cluster where at least one machine involved in the cluster is licensed using the appropriate metric for either Oracle Database Enterprise Edition or Oracle Database Standard Edition. "


Итого, если понимать буквально:
- Теперь для использования clusterware не обязательно, чтобы вы использовали Oracle Database (п1).
- Вы вообще можете делать что хотите на Unbreakable Linux (наверно и Red Hat если купите поддержку у Oracle ?) (п3)

п2 и п4 в некотором виде уже существовали на уровне 10g.

Вопрос: распространяется ли это только на 11g clusterware или принимимо к 10g clusterware ? Пока не знаю :(

Но кажется это неважно, поскольку можно будет поставить 11g clusterware для защиты 10g DB. Во внутреннем mail list'е на основании Note: 337737.1
Уважаемый человек из нашего support пишет:
"
Other than the restriction of 10.1.0.3 that is documented in the note, all other versions are supported. So it is supported to have a 11.1.0.X CRS with 11.1.0.X ASM with 10.2.0.X.
"

Официально такой информации я не нашел.
Но по идее, так и задумывалось, чтобы версия clusterware не зависела от версии БД, т.е. я согласен с вышеприведенной формулировкой.


Читать дальше...

Unicode

Если Вы хотите узнать ответ на загадку скриншота (можно нажать на картинку - станет лучше видно) рекомендую Вам посмотреть презентацию Игоря Мельникова (Igor.Melnikov)
"Поддержка многоязычных приложений в Oracle Database"


Читать дальше...

Установка 11g RAC


Мне удалось поставить 11g RAC на Oracle Enterprise Linux 5.

Я постараюсь выложить инструкцию, в целом она не слишком отличается от установки 10g RAC. Стоит иметь в виду только, что


a) в El5 (и в Hat Enterprise Linux 5) отказались от raw

man raw
"Although Linux includes support for rawio, it is now a deprecated interface"

Я лично в шоке и понять зачем и почему это было сделано не в состоянии. Помимо этого теперь /sbin/servcies не знает rawdevices. Рекомендуется размещать данные на блочных устройствах. Права на них после перезагрузки также сбрасываются.

б) Также в документации описаны новые требования с OCR и Voiting disks (280 mb).

Инсталляция стала горадо чище, у меня успешно все поставилось и БД зарегистрировалась в EM несмотря на другой часовой пояс (в 10g был с эти баг).

С другой стороны, инсталляция требует внимательности - ошибка может дорого стоить.
Мне так и не удалось кооректно вычистить clusterware с машины (встало криво по моей ошибке).

Крайне рекомендую потренироваться на устнавке именно с VmWare.
Дело в том, что сейчас документация рекомендует ставить clusterware в отдельного пользователя, рекомендуется заводить доп. группу ASM dba и пр. Т.е. именно проектирование установки усложнилось. И я рекомендую отточить его на VmWare.

VmWare image - могу выложить, но ~6Gb.


Читать дальше...

Лицензирование SE and SE1

Знаете ли Вы, что при лицензировании SE1 и SE по метрике Named User Plus конечный пользователь
должен приобрести минимум 5 пользовательских лицензий ... вне зависимости от кол-во установленных экземпляров. Естественно, что при этом, все инсталляции должны удовлетворять требованиям по максимальному кол-ву процессоров (2 для SE1 и 4 для SE)

database-11g-standard-edition-one-datasheet.pdf (application/pdf Object)


Читать дальше...

GARTNER analisys on Oracle Database 11g

Oracle Database 11g Could See Early Adoption

via Sergey.Danilov, RAC Director, Oracle Cis


Читать дальше...

Project Guide for Oracle RAC Implementation

Достаточно интересная ссылка, как организовать проект по переходу на Oracle RAC:
Project Guide for Oracle RAC Implementation

И более конкретный документ, с конкретными тестами, которые могут/должны быть выполнены перед переводом системы в промышленную эксплуатацию.

"This document only provides some guidelines and examples to be used as input to a test plan"

И еще. IO Throughput Verification Before RAC Implementation: ORION


Читать дальше...

11g Clusterware details

Мне попалось два любопытных документа о Clusterware 11g:

  1. Clusterware 11g installation (есть отличия от установки 10g)
  2. How to ADD/REMOVE/REPLACE/MOVE Oracle
    Cluster Registry (OCR) and Voting Disk (for 11g and 10g )

В 11g installation есть интересная деталь - увеличились требования к размерам OCR и Voiting disk. C чего-бы это, если явно особенно новых возможностей в 11g clusterware не просматривается ?


Читать дальше...

Устанавливаем EMGC на платформе SUN Solaris

Алексей Струченко (struchenko@jet.msk.su) любезно прислал мне свою инструкцию по установке EMGC на solaris. Рекомендую.

Пользуясь случаем хочу напомнить про разницу между Database Control и Grid Control.


Читать дальше...

Каким образом применяли Oracle до появления Windows ?

Реальный вопрос с sql.ru:
"
Всем известно что компания Oracle была организована в 1977 году,
повсеместно Windows стали использовать 90-х годах
никак не могу понять, а каким образом применяли Oracle до 90-х ?
"
Можете почитать оригинальный пост, только осторожнее, там вообще можно животик надорвать....


Читать дальше...

Using the workload capture and replay (WCR) in 11G

Отличная (и очень короткая) Note: 445116.1 посвещенная Real Application Testing. Хочется процитировать те операции, которые не захватываются в процессе capture:

o Direct path load of external files
o Shared Server requests
o Streams
o Advanced Replication streams
o Non PL/SQL AQ
o Flashback queries
o OCI based object navigations
o Non SQL based object access
o Distributed transactions
o Remote describe/commit operations

Некоторые возможности по установке фильтров за capture, скорости replay и т.д. описаны в

Oracle® Database Performance Tuning Guide
11g Release 1 (11.1)
Part Number B28274-01
PART V

Важно помнить, что рекомедуется перед началом захвата рестартовать БД, а тестовую (на которой все будет проигрываться) восстановить из backup производственной именно на момент этого последнего останова.

С картинками EM как настроить WCR можно посмотреть здесь.

Формальную презентацию (включая SQL Perfomance Analyzer) можно скачать здесь.

Хочется повторить, что особенно полезно использовать WCR при

- тестировании новой платформы
- переводе в кластер

Ограничение также понятно: поскольку все запросы захвачены в binary виде, то вы не можете поменять часть из них, таким образом не можете оценить как улучшится общая производительность системы при изменении отдельных запросов или изменении структуры данных.

С другой стороны, если Вы используете процедуры, кто мешает прямо перед стартом replay подменить ее на тестовой систем ? (ушел думать...)


PS
У меня еще сомнения в полноте приведенного списка ограничений. В частности не уверен насчет захвата операций с CLOB...

PS.2

Сергею Томину на его замечательном семинаре задали массу вопросов по поводу wrc клиентов. Так вот, режим calibrate пытается подсказать Вам сколько следует запустить клиентов, одновременно читающих файл с захваченными данными. Однако каждый клиент может открыть несколько соединений с БД

"
Since one replay client can initiate multiple sessions with the database, it is not necessary to start a replay client for each session that was captured. The number of replay clients that need to be started depends on the number of workload streams, the number of hosts, and the number of replay clients for each host.
"
Однако, я не могу найти параметра, отвечающего за кол-во соединений с БД, кроме как
threads_per_process. Поэтому мне кажется, что число соединений будет число wrc процессов*threads_per_process.

Насколько я понял, Сергей предложил запускать wrc с нескольких хостов сразу, разместив данные для replay на разделяемой файловой системе. Это очень разумно, если это заработает :)


Читать дальше...

9i Support policie

Для ясности, для 9i, cогласно документу (стр. 12 ) Premier Support закончился в июле 2007 года, Extended закончится в июле 2010 года и все. Т.е. дальше нельзя будет даже читать metalink, не говоря уже о каких-то исправлениях.

При этом, согласно документу, за 1 год (до 2008 года) стоимость поддержки будет считаться как стоимость поддержки предыдущего года + inflation rate (~3%), а вот за 2009-2010 года к этому алгоритму прибавиться еще дополнительно 20% от стоимости поддержки.

Т.е. очень грубо, те кто не будет мигрировать, рискуют увеличить стоимость тех. поддержки более чем на 40% !


Читать дальше...

Physical standby on different operating system

Наверно уже все знают, что начиная с 11g появилась возможность поддерживать physical standby не обязательно на той же платформе что и production ?

Пример: можно в любой комбинации использовать связку Windows 32 bit - Linux 32 bit

Целый "паук" прочих комбинаций, включая варианты с различным word size и типом процессора описаны в Note:413484.1

Увы и ах, для Solaris, HP-UX, AIX возможности гораздо скромнее.


Читать дальше...

11g PL/SQL New Features

Игорь Мельников (Igor.Melnikov) подготовил великолепную презентацию "Oracle Database 11g: Новые возможности в PL/SQL". Обратите внимание, что описываются новвоведения только в pl/sql, прочие новые возможности сервера (новые методы и способы партиционирования, новое в триггерах, client result cache etc) пока не рассматриваются.

После проведения в Москве Oracle Tech Forum 1 ноября, ориентировочно в середине ноября, мы планируем провести специальный однодневный семинар для разработчиков, посвещенный новым возможностям 11g. Конечно же постараемся сделать демонстрации и дать возможность Вам самим что-то попробовать в среде VmWare.

Если Вы не можете приехать в Москву на Tech Forum (хотя я очень рекомендую), то сессии посвященные 11g также будут читаться в в конце октября - начале ноября в Баку, Минске и Тбилиси, где Вы можете послушать меня, Марка Ривкина или Сергея Томина.


Читать дальше...

К сожалению

К сожалению, все хорошее заканчивается, даже отпуск.

Пройден Китой (все препятствия кроме первой ступени водопада в верхних щеках и порога-водопада), что соответсвует то ли 5 то ли 6 категории сложности в зависимости от доброты МКК, произведен незабываемый джип-тур по Ольхону, снято почти 1500 фотографий. Отчет будет обязательно.

А тут я гляжу, все продвигает:

Oracle Announces General Availability of Oracle(r) Database 11g

и уже можно официально скачать 11g для Linux x86.

PS
А молодая пара из US Tom и Kelly находятся в путешествии уже 1 год и 1 месяц, направляются после России в Монголию и Китай... Tom кстати работает в Intel. Вот такие бывают у людей отпуска :)


Читать дальше...

please standby

По счастию до 16 августа здесь постов не будет. А я постраюсь увидеть и сфотографировать эту красоту. А там глядишь и 11g выпустят :)


Читать дальше...

Using Oracle Clusterware to Protect Single Instance Database 11g

Пошаговая инструкция как построить HA кластер при помощи Oracle Clusterware.
Как я уже писал, такая конструкция не требует дополнительного лицензирования.

SI_DB_Failover_11g.pdf (application/pdf Object)

Я почти уверен, что эта инструкция будет очень востребована.

Кстати, тоже самое уже можно сделать 10g. Я почти уверен :)


Читать дальше...

11g: Product Editions & Features

А мне очень понравилась ссылка :

Oracle Database 11g: Product Editions & Features

Просто, но со вкусом, с массой дополнительных ссылок на описание features.
Единственное, что там не хватает - ссылки на pricing


Читать дальше...

Oracle RAC SIG

Я обнаружил, что по недоразумению еще не написал о
Oracle RAC SIG web site

На мой взгляд, один из самых лучших технических открытых сайтов посвещенных Oracle RAC.


Читать дальше...

Direct NFS client (11g NF)

Наконец, появилась первая более техническая статья про NFS клиента в ядре 11g

directnfsclient_11gr1_twp.pdf (application/pdf Object)

Если я правильно понял, то теперь будут сняты ограничения на использование только сертифицированных устройств для хранение БД под NFS. Хотя явно, это и не сказано..



PS
Обратите внимание на файл $ORACLE_HOME/dbs/oranfstab :)


Читать дальше...

10.2.0.4 Patch Set

Уже можно "подсмотреть", что собираются исправить в 10.2.0.4
Metalink Note:401436.1

Однако по прежнему неизвестно, когда выпустят патч:
"
Please note that 10.2.0.4 has not been released on any platform , and does not have release dates available
"

Как только появиться определенность с датами - сообщу :)


Кстати, обратите внимание на
Bug 5667023 - Linux: CRS does not start after applying 10.2.0.3

там же есть workaround, действительно на RHEL 4 U4 нет таких проблем.

(меня уже кто-то спрашивал стоит ли переходить на 10.2.0.3 и приводил информацию, что
после обновления не стартует crs)


Читать дальше...

Linux GFS certify for RAC

Пока только обещана сертификация
GFS и 10gR2 RAC на RHEL5 ( вернее на Oracle Enterprise Linux 5, конечно же :)

С другой стороны Note:329530.1 содержит таки казуистические выражение насчет существующей поддержки GFS в RHEL 4 и 3.
Не могу это цитировать, это надо читать :)

И вообще, ASM наш выбор !


Читать дальше...

СУБД Oracle Database 10g – новые возможности для разработчиков

Судя по анкетам, одной из самых популярных презентаций на нашем семинаре
Oracle RAC: Deep Dive for Developers является презентация "СУБД Oracle Database 10g – новые возможности для разработчиков" которую Игорь Мельников (Igor.Melnikov) делает в рамках нашего семинара. Она неизменно вызывает большой интерес у слушателей.

Почему же в канун выхода 11g я выкладываю презентацию для 10g ?
Если коротко, то сейчас многие озабочены переходом на 10g, чтобы затем перейти на 11g. Подробнее о причинах можно читать ранее.


Читать дальше...

New Critical Patch Updates

Critical Patch Updates and Security Alerts


Читать дальше...

T2000 and Oracle RAC

"Generally speaking Oracle will scale well on Sun Fire CoolThreads servers" пишет нам Sun Microsystems и дает несколько советов по настройке.

Могу только согласиться. У меня была возможность сразу после появления T2000 ее протестировать. Ее 8 ядер немного проиграли 8 ядрам Ultra Sparc IV+ да и то, в пиковой нагрузке. При весьма ощутимой разнице в цене.

Единственное, что рекомендую проверить - это как сейчас дело обстоит с внутренней дисковой подсистемой. В момент выхода T2000 поставлялась с ужасающей дисковой подсистемой, размещать на ней БД я бы не рекомендовал. Также были проблемы с SAN карточками под эту модель. Сейчас я верю, ситуация изменилась.

Собственно совершенно не вижу причин почему бы не собрать RAC на 4-х таких машинках - по лицензионной политике проходит Standard Edition ( 4 socket), а значит RAC бесплатен. 32 ядра - это знаете ли сила. При цене железа ~ $45,000 (по Sun US price list). Вот здесь можно найти примерные цены на серверы SUN с UltraSparc IV+ и почувствовать разницу. При всем моем глубочайшем уважении к UltraSparc. Ничего нового я здесь не открываю, как всегда существует парадигма price/perfomance - каждый ее решает для себя

UPDATE 1.

Оказалось, что коллеги во внутренем mail-list'e недовольным T2000 на основании тестов у реальных заказчиков. Не буду приводить примеры тестирований, поскольку очень уж результат зависит от теста.

Приведу лишь короткое и очень мне понравившиеся сравнение технологий SF 890 и T2000

> A current V890 uses UltraSPARC-IV/IV+ dual core processors.
> The processor has a clock speed in the range of 1.2 GHz (low-end
> UltraSPARC-IV) to 1.8 GHz (high-end UltraSPARC-IV+). Each
> processor has 2 MByte L2 and 32 MByte L3 cache.
>
> A T2000 uses an UltraSPARC T1 processor with up to 8 cores.
> The processor has a clock speed in the range of 1.0 GHz to 1.2
> GHz. The processor has 3 MByte L2 cache but no L3 cache. The
> core is derived from the earlier UltraSPARC-II microarchitecture,
> so as a rule of thumb the core performs less work than a later
> generation core with the same clock speed, and potentially
> much less work than a later generation core with a faster clock
> speed and large L3 cache.
>
> This doesn't mean a T2000 can't be used successfully as a
> database server but it does mean that a T2000 can't be expected
> to match a V890 for a single threaded task.
>
> Maybe the following questions might help:
>
> 1) is the single threaded task on the critical path for the
> application, and if not, who cares?
> 2) a V890 is a single box which presents a SPoF, so what about
> HA requirements?
> 3) a V890 is potentially far more expensive in terms of both
> hardware and Oracle software than a pair of T2000's with
> equivalent throughput, so what about price/performance?
>
> I can't give you a magic solution if 1) goes against you but
> if straight line speed isn't the only factor then 2) and 3)
> might help. You will probably find that the software cost is
> the dominant factor in 3), especially when considering T2000
> servers.
>
> BTW the statement about FPU is not entirely correct and is
> unlikely to be relevant for most Oracle database workloads in
> any case:
>
> http://en.wikipedia.org/wiki/UltraSPARC_T1





Читать дальше...

RAC ЧАВО

Ниже я постараюсь ответить на несколько вопросов по технологии Oracle RAC, которые задаются на мой взгляд наиболее часто - RAC ЧАВО (Часто задаваемые Вопросы и Ответы). Хочу также поблагодарить Игоря Мельникова (Igor.Melnikov) за участие в сборе материалов. Данный пост обновлен 18.07 2007

Прежде всего мне хочется упомянуть малоизвестный факт об истории технологии RAC. Эта технологий появилась еще в версии Oracle 6, в 1985 году, до появления в СУБД Oracle pl/sql и знаменитого row locking механизма http://www.oracle.com/corporate/home2.html). Работала она правда только под VAX машинами. Уже в следующей версии, 7-ой Oracle Parallel Server работал на нескольких платформах.

Мне кажется, в IT очень важно понимать, сколько лет развивается та или иная технология. Потому что, часто они быстро появляются, и также быстро пропадают. В последние несколько лет тема Grid является заглавной для новых выпусков БД Oracle. Так 9i была выпущена со слоганом Unbreakable, подразумевая что ее "неубиваемость" основвывается на технологии Oracle RAC, версии 10g и 11g просто несут в себе индекс [G]rid. Итак, мы говорим о технологии, которой более 20 (!) лет.

Итак, вопросы которые часто задают:

1. Назовите где эта технология используется в России ?

Очень хороший вопрос. Примерно такой же хороший, как спросить "а имеют ли Ваши электроны Российское гражданство ?".
RAC - прежде всего технология, не зависящая от установленного в стране законодательства. Когда спрашивают про примеры использования бухгалтерской программы, то хотят уточнить, поддерживает ли она Росссийское законодательство. Это понятно, без этого использовать бухгалтерскую программу невозможно.
Но RAC - это технология. И законы физики работают, извините, вне границ государств.

Более правильный вопрос - "приведите пожалуйста примеры индустрий, которые используют данную технологию ?". OK, пожалуйста, познакомьтесь со специальным N страничным документом RAC customers book. Мне кажется там можно найти примеры по всем индустриям.

И все-таки почему так мало именно российских примеров внедрения RAС ?

a) Одна их причин в том, что ORACLE CIS работает только через партнеров. Т.е. все проекты проходят только через парнеров. Вот почему они не собирают/не публикуют references (а они есть, и очень большие ) - не могу сказать.

б) Наверно работает и наш Россиский менталитет - лучше ничего не говорить соседу, чтобы он не дай бог не позавидовал (?). Недаром есть даже анекдоты на эту тему. У нас вообще крайне неохотно говорят об используемых технологиях. Думаю, что увы, это наша Российская специфика. Вот Ваша организация готова выступить как reference использования технологий ?


2. Но ведь приложения в RAC не масштабируются и на одной большой машине работают лучше ? ( http://blogs.sun.com/dcb/entry/oracle_rac_s_secret)

Ответ очень прост: - если приложение не масштабируется, оно будет работать плохо даже на очень большой "железке". С примерами, я думаю, встречались очень многие.

Однако, действительно, до некоторой степени, RAC обнажает "узкие" места приложения. Думаю, что именно это и вызывает массовые слухи, о приложениях, которые не работают под RAC.

Я думаю, что лучшим ответом о масштабировании является, тот факт, что в RAC конфигурации работают SAP R/3 и Oracle E-Business Suite (последний в том числе в Россси :) ) Если приложение написано хорошо (а невозможно написать такого монстра плохо) - оно работает в RAC.

Из моего опыта следует, что приложения не всегда написаны хорошо. При переносе в RAC это становится видно. Но в этом случае, как правило, удается партиционировать приложение (т.е. разделить части приложения по узлам), что оставляет производительность как минимум на том же уровне, давай запас по процессорной мощности. Появляется время, для спокойного исправления ошибок.

Также в России (!) уже есть примеры, когда приложения "сжирало" самые большие имеющиеся на данный момент компьютеры (HP Superdom, SUN Fire 25K). Реальность таких IT - это непрерывно выспрашивать у вендора, когда будет более мощная машина. Я знаю примеры, когда откладывали внедрения новой бизнес функциональности из-за ожидания поставки очередного монстра.


3. Но ведь RAC это очень дорого ?

OK, давайте посчитаем. Прайс-лист Oracle доступен по адресу http://www.oracle.com/corporate/pricing/pricelists.html


Я выделяю 3 сегмента серверного оборудования:

- серверы начального уровня (2-4 процессора)
- серверы уровня предприятия (8 процессоров)
- high-end серверы (12 и более процессоров)


Серверы начального уровня

В большей своей массе в этом сегменте лидируют серверы с Intel архитектурой

Возьмем открытый прайс-лист компании Kraftway (www.kraftway.ru) от 09.07.2007

Увидим, что

Express 400 EM11 (4CPU Xeon 3Gz, 4Gb RAM) стоит 425,331 р

Express ISP ES24 (2CPU Xeon 3,2Gz, 2Gb RAM) стоит 94, 547 р

Для построения кластера нам понадобится 2 сервера Express ISP ES24 с общей стоимостью 189, 094 р

По лицензионным ограничениям на 2 2-х процессорных сервера можно установить Standard Edition, куда опция RAC уже включена бесплатно.

Итак, мы имеет разницу в цене между одним Express 400 EM11 и кластерным вариантом

425,331 - 189, 094 = 236,237 р ~ $9,000

( процессорные лицензии oracle стоят одинаково для обоих вариантов: 4 Socket * $15,000 )



Сервера уровня предприятия и high-end сервера


Я попробую посчитать на примере железа Sun Microsystems.
Нет, это не месть за пост Sun'овского инженера :) из предыдущего ответа. Я выбрал SUN, в первую очередь потому, что имеют многолетний опыт работы с техникой SUN, очень ее уважаю. Считаю, что Solaris - вообще одна из лучших ОС для Oracle (прошу это не обсуждать - это аксиома :)). Тот факт, что SUN испытывает (ывал) затруднения никак не связан с высочайшим уровнем ее технических разработок. Насколько я знаю, только в Sun Fire можно одновременно использовать процессоры нескольких поколений (!). Даже IBM не смогли (или не посчитали нужным) это реализовать.


Итак, я буду использовать открытый прайс-листы SUN по адресу
http://ru.sun.com/products/configurations/index.html


Давайте также учтем, что несмотря на размеры основного сервера, во всех серьезных организация принято устанавливать Standby DB или HA Cluster. С целью упрощения расчета стоимости я рассматриваю вариант Standby DB (см. также комментарии к посту ниже). Для варианта 1 сервера она нам нужна для отказоустойчивости и средства восстановления от логических ошибок, для варианта кластера - отказоустойчивость у нас уже есть, нужно только средство восстановления от логических ошибок.

Также в варианте 1 сервера бессмысленно ставить Standby DB на машину не равную основной - в противном случае она не сможет нести всю нагрузку промышленной системы.

Итак, Я взял несколько машин, все с процессорами UltraSPARC IV+, в каждой машине на процессор приходится 4Gb памяти.


Sun Fire V490 Server (4 CPU) - $65,000
Sun Fire V890 Server (8 CPU) - $131,000
Sun Fire E4900 (12 CPU) - $701,000
Sun Fire E6900 Server (24 CPU) - $1,409,000

Более полные спецификации с ценами


Серверы уровня предприятия
-------------
В качестве сервера уровня предприятия будем используется SF 890, в качестве равного ему кластерного варианта 2 сервера 2 SF490

Рассчитаем стоимость для SF 890

$131,000 (железо) + 8*$40,000 (процессорные лицензии Oracle) = $451,000

Рассчитаем стоимость для 2-х SF 490:

2*$65,000 (железо) + 8*$40,000 (процессорные лицензии Oracle) + 8*$20,000 (RAC option) = $610,000

$451,000 < $610,000 Как мы видим вариант RAC проигрывает на ~$160,000. Но давайте вспомним про Standby. Получим для SF 890 удвоение суммы, поскольку у нас две машины и Standby DB нужно полностью лицензировать. В кластерном варианте в качестве Standby достаточно поставить еще один SF 490 $902,000 ~ $610,000 + $65,0000 (железо) + 8*$40,000 (лицензия на standby) $902,000 < $995,000 Итак, мы видим, что RAC вариант проиграл грубо говоря ~$100,000 при общей стоимости системы ~$1,000,000. Теперь продумаем, что делать, когда нам потребуются еще скажем 2 CPU ? В случае SF 890 нам придется купить новое "железо", потратив $700,000 а в случае кластера - всего лишь докупить SF 490 - 65,000 (железо) + 4*$40,000 (Oracle) + 4*$20,000 (RAC options) = $305,000

High-end серверы
--------------------

В качестве high-end сервера будем использовать E4900 (12 CPU) , в качестве равного ему кластерного варианта 3 сервера SF490

Рассчитаем стоимость для E4900 (12 CPU)

$700,000 (железо) + 12*$40,000 (лицензии Oracle EE ) = $1,180,000

Рассчитаем стоимость для 3-х SF490:

3 * ( $65,000 (железо) + 4*$40,000 (Oracle) + 4*$20,000 (RAC options) ) = $915, 000

$1,180,000 > $915, 000

С RAC мы выиграли почти $280,000 !

Рассмотрим добавление standby. Для E4900 это удвоит стоимость системы, для кластерного варианта добавит еще один SF 490.

$2,360,000 ~ $915, 000 + $65,000 (железо) + 4*40,000 (Oracle)

$2,360,000 > $1,140,00

теперь разрыв увеличился до $1,120,000 (!)


При больших серверах разрыв еще больше увеличивается.



Выводы:

Удивительно, но в некоторых весьма реальных случаях экономия в случае использования RAC может составить порядка 1млн $. Вот так :).
Разрыв совершенно очевиден начиная с примерно 12 процессоров. На уровне 8 процессоров, следует учеть развитие ИС, standby систему - и выгода также будет очевидна. На уровне 4-х процессоров в игру вступает Standard Edition, куда опция RAC включена бесплатно.


Понятно, что я взял цены price лист без учета скидок, локальных налогов, технической поддержки. Что у разных вендоров картина может быть разной. Но я прошу Вас об одном - посчитайте. Это не очень сложно, а выводы могут быть весьма удивительными.


4. Если Все так здорово, то почему все-таки используют эту технологию не очень многие ?

Есть как минимум несколько причин:

a) "Железные" вендоры проводят вполне успешную политику. Очень часто, когда приглашают Oracle железо уже куплено и говорить о выборе технологии поздно. Можно лишь посоветовать начинать модернизацию IT с выбора технологии, а не большой железки.

б) Бюджетные организации страдают от необходимости продемонстрировать, куда именно вложили деньги. Если потратили $1 милллион на большой красивый шкаф - это понятно. А если на несколько маленьких машинок - то не очень. Я думаю, что все кто работал с бюджетными организациями понимает, о чем я пишу.

в) Мало кто хочет посчитать убытки от простоев. Страна большая. Подумаешь, уйдут одни клиенты, придут другие. В Европе совсем не так. Там автоматизированная бесперибойная система - основа бизнеса. За нее очень держатся. Она помогает зарабатывать деньги, а значит надо в нее вкладывыть.

PS
Если Вы все же остались недовольны моей идей использовать при подсчете standby - в следующем посте смотрите информацию про Sun T2000 :)


Читать дальше...