Dsvolk Oracle News: 01.10.2007 - 01.11.2007

DataPump

Игорь Мельников (igor.melnikov) предоставил еще одну презентацию для разработчиков - на этот раз про DataPump. В презентации также приводятся и новые возможности (шифрование, сжатие, преобразование данных и т.д.) которые получил datapump в 11g

Читать дальше...

EMGC and 11g

11g Database уже есть, а вот Grid Control 11g еще нет.
Разработчики GC сказали, что их 11 версия появится только когда выйдет 11g database на всех основных платформах.

А что же сейчас делать ?
Оказывается можно попробовать EMGC 10.2

"
Oracle® Data Guard
Broker
11g Release 1 (11.1)
B28295-01

Scenarios Using Oracle Enterprise Manager
This chapter describes the Data Guard Broker graphical user interface (GUI) provided
in Oracle Enterprise Manager Grid Control 10.2. This is the latest currently available
broker interface in Enterprise Manager. You can use it to create, manage, and monitor
an Oracle Database 11g release 1 (11.1) Data Guard configuration.
"

Кстати, только что появился EMGC 10.2.0.4 для Windows и Linux.
Правда, судя по readme, по сравнению с 10.2.0.3 в него просто добавили все вышедшие за последние время агентов.

Качать здесь.
Будьте осторожны, там патч больше 1gb, но это всего лишь патч. Для патча еще требуется 10.2.0.1 (Linux) или 10.2.0.2 (Windows)

Завтра узнаю как он работает с 11g :)

Читать дальше...

TAF or not TAF

Поставили мы с коллегой 4-х узловой кластер 11g, Linux x32 (EL5) на вот таком железе HP Blade System c3000.

Настроили TAF и конечно же его попробовали.
На одном из узлов останавливаем instance с помощью shutdown abort - сессии немедленно переезжают на другие узлы.

Все замечательно ?

"Неет, сказали суровые сибирские мужики" (C)

И остановили публичный интерфейс (ifconfig eth0 down)
На этой ноде остановился listener, в течении ~30 сек VIP адрес переехал на другой узел.
БД и ASM остались без изменений, все как надо (если кто не знает, так работает начиная с 10.2.0.3)

А что-же TAF ? А ничего. Сессии намертво "залипают" и висят. Ждали 15 минут потом надоело.

Мы догадались, что сессии не перезжают потому, что получают никакой ошибки. В первом случае (с shutdown abort) ошибка приходит немедленно, а в этом - не приходит и все.

Metalink нашел массу багов, когда в такой ситуации даже VIP не перезжает. Но у нас с VIP все хорошо.

Отгадка была не очень сложной. Но, как-то не слишком известной что-ли.
Называется она tcp_keepalive.
Т.е. сессий oracle не получает ошибки потому, что по умолчанию нижележащий tcp/ip стек пытается восстановить соединение.

Решение пришло в виде добавления ENABLE=BROKEN в tnsnames - это обозначает доверять настройкам ОС - и изменению параметров tcp в Linux:

Добавил в /etc/sysctl.conf

# tcp tuning
net.ipv4.tcp_keepalive_time=10
net.ipv4.tcp_keepalive_intvl=5
net.ipv4.tcp_keepalive_probes=5
net.ipv4.tcp_syn_retries=1
net.ipv4.tcp_retries2=3

и выполнил sysctl -p
Сесси стали получать ошибку в течении ~30 сек.

Прекрасные ссылки:

Как работает TAF и какие ошибки бывают на каких платформах
http://www.oracle.com/technology/tech/oci/pdf/taf_10.2.pdf

Кстати в описанной ситуации, клиент на MS Windows Server 2003 получает
ORA-12571: TNS:packet writer failure и достаточно быстро без доп. тюнинга

Как с подобной проблемой разобрались ребята из Церна:
https://twiki.cern.ch/twiki/bin/view/PSSGroup/OCIClientHangProtection

Они кстати приводят простой но очень правильный пример приложения на С c собственным таймером (!)

Окончательный вид конфигурации

TAF =
(DESCRIPTION =
(ENABLE = BROKEN)
(ADDRESS_LIST =
(ADDRESS = (PROTOCOL = TCP)(host = rac1-vip)(PORT = 1521))
(ADDRESS = (PROTOCOL = TCP)(host = rac2-vip)(PORT = 1521))
(LOAD_BALANCE = yes)
(FAILOVER = true)
)
(CONNECT_DATA =
(failover_mode=
(type=session)
(method=basic)
(retries=2)
)
(SERVICE_NAME = racdb.ru.oracle.com)
)

)

PS

Кстати, если опустить интерфейс с интерконнектом, в течении 30 секунд узел идет в перезагрузку и это
правильное, документированное поведение.

Умиляет только, что же он перед перезагрузкой не попробует поднять интерфейс-то :)
Буду это изучать.

Читать дальше...

Database Change Notification

Игорь Мельников (igor.melnikov) подготовил презентацию Oracle Database Change Notification
Но и прочие коллеги тоже не дремят - появилась статья из серии OBE - Using Database Change Notification With ODP.NET and 11g

Кто сделает следующий ход ? :)

Читать дальше...

APEX и 11g

В свое время я был страшно разочарован качеством примеров поставляемых с APEX. Ну хоть оформление-то можно было подобрать приличное, чтобы можно было сразу пользоваться ?

Но сегодня разочарование прошло. Я почти случайно увидел какие примеры для генерации web галерей предлагает фирма Adobe. Рекламируя новый, современный движок для создания web галерей они сподобились создать 4 примера на уровне, которым пользоваться, как мне кажется, никто не будет.
И это Adobe - дизайн их прямая специализация, сколько они продуктов выпустили по web дизайну..

Увы, логика понятна - в обоих случаях упор делается на движок. Вся обвязка к нему - удел счастливых разработчиков :)

К чему это я все ?

Ах, да ! APEX ставится теперь по умолчанию с 11g.

Читать дальше...

Learning Oracle RAC with the Filer Simulator

Я лично знаю 2 способа получить разделяемую файловую систему для своих вирутальных машин с Oracle RAC 11g:

NetApp simulator (Learning Oracle RAC with the NetApp Simulator)
и OpenFiler (http://www.openfiler.com/).

Не до конца понятно зачем они нужны, ведь с разделяемой директорией (3-ий способ :)) все также работает как из пушки.

Мы на курсах по HA использовали OpenFiler через iSCSI (произносится на йоркширском "aйскузи", кто бы мог подумать !).

Вроде ничего, работал. Но после перезагрузки постоянно одна из нод в fdisk не видела партиций в устройствах /dev/sd*
Но это вовсе не мешало работать через /dev/iscsi/***

В общем - ощущения смешанные. А вот говорят есть отдельные коробочки с дисками, внутри которых уже есть Linux, и которые прикидываются вот такими filer'ами - вот это тема !

Читать дальше...

Installing CRS on EL5

Наконец хоть какие-то идеи как изменять права на устройства в EL5
Пока сам это не не проверял

"
Udev syntax has nominally changed between EL4 and EL5.
You've not explicitly stated it, but as you're installing RAC, I'm assuming you're intention for /dev/sda5(?) is for raw clusterware files?
If so, be aware of 1.) raw deprecation in EL5, 2.) the potential for non-persistency of kernel assigned device naming.

Having said that, based on the following rule examples, you might some permutation of the following (verified to work), then restart udev:

-- /etc/udev/rules.d/20-names.rules
KERNEL=="sd*",OPTIONS+="last_rule",NAME="sdd%n",NAME="sde%n",  OWNER="crs", GROUP="oinstall", MODE="660"
#eof

Factoring the potential for non-persistent udev device naming, you can configure/use scsi_id to query for a named device, then have your rule match for that value eg.

-- /etc/udev/rules.d/20-names.rules

KERNEL=="sd*",PROGRAM="/sbin/scsi_id",RESULT=="149455400000000000000000005000000761000000d000000",OPTIONS+="last_rule",NAME="ora/sdora%n",OWNER="root",GROUP="oinstall",MODE="660"

# ls -l /dev/ora/sdora*
brw-rw---- 1 root oinstall 8, 48 Sep  6 18:30 /dev/ora/sdora
brw-rw---- 1 root oinstall 8, 49 Sep  6 18:30 /dev/ora/sdora1
brw-rw---- 1 root oinstall 8, 50 Sep  6 18:30 /dev/ora/sdora2

"

Читать дальше...

Изменения в прайс-листе

На самом описываемые изменения произошли с 1 октября 2007 года.

1) New Licensing and Naming for Oracle Lite

Теперь разделили Oracle Lite на Lite Mobile Server и Lite Client - каждый стоит отдельных денег

2) У нас появился Enterprise manager plug-in для VMware ESX Server. Что отражает общую тенденцию к использованию технологий VMware. Напомню что VMware поддерживается только для Database, RAC в VMware не поддерживается

3) Изменились коэффициенты для SUN T2000 - теперь он 0.5 вместо 0.25 http://www.oracle.com/corporate/contracts/library/sun_server_table.pdf
Но это только для 8 ядерного процессора - читайте очень внимательно !

4) Появился отдельный Business Intelligence Applications Price List

5) Теперь определение Named User Plus и Processor находятся прямо в прайс-листе и сопровождаются примерами.

6) Я помню, но не могу найти ссылку что мы стали распозновать 4-ядерные процессоры и считать их одноим сокетом для Standart Edition* продуктов

7) С другой стороны, если ядра 4 но процеесор состоит двух других чипов ситуация меняется

When licensing Oracle programs with Standard Edition One or Standard Edition in the
product name, a processor is counted equivalent to an occupied socket; however, in the case of multi-chip modules, each chip in the multi-chip module is counted as one occupied socket.

About multi-chip:
http://en.wikipedia.org/wiki/Multi-Chip_Module

(этот последний пункт я не очень хорошо понимаю сам, если кто-то может его прокомментировать - you are welcome !)

Читать дальше...

IOUC : International Oracle Users Group Community

IOUC : International Oracle Users Group Community

Читать дальше...

Runtime connection load balancing for OCI

Cудя по документации ( Enabling Oracle Call Interface Clients for Runtime Connection Load Balancing )

в 11g балансировка нагрузки на уровне транзакций (а не соединений) возможно и для OCI клиентов (а не только для JDBC как в 10g), и все благодаря новому механизму OCI connection poll. Балансировка нагрузки производится при помощи Load Balance Advisor, который в свою очередь требует установленного AWR, а следовательно Tuning and Diagnostic Pack. К тому же Вам необходимо переходить на новую версию OCI.

C другой стороны, есть еще один новый механиз пула соединений, уже со стороны БД:
Database Resident Connection Pooling. И вот тут я не понимаю, работает ли та же самая балансировка для него или нет. Стоит ли использовать оба механизма вместе или нет.
С одной стороны для подсоединения с DRCP используется имя сервиса, что точно даст балансировку на уровне соединения. C другой стороны, в DBMS_CONNECTION_POOL.CONFIGURE_POOL нет параметров в которых можно было бы указать tns, а значит соединения делаются напрямую с локальной БД.
Да, для DRCP придется также поставить клиента 11g

Читать дальше...

RAC 11g Cache Fusion

"
The cache fusion technology in RAC has been improved. Workloads that will benefit from these changes are those where most or all of the activity is query (read). These types of applications should see 95% scalability as nodes are added to the cluster
"

Возможно вы уже видели презентации в которых упоминается улучшение Cache Fusion и даже называются цифры
(от 70% до 95%) улучшений для приложений, которые преимущественно читают. Но, ответ разработчиков, что же все-таки изменилось, в моем вольном переводе звучит коротко как : "мы не скажем, код патентованный" .

К тому же (сюрприз !) проценты улучшения приводятся не по сравнению с 10g, а в 11g c включенной фичей и выключенной.

Enjoy !

Читать дальше...

11g Windows & Linux x86-64

Появилась 11g для Windows & Linux x86-64
Oracle Database Software Downloads

(если Вы замечали, что Linux x86-64 появлялся раньше, то мне кажется что лучше скачать заново. Правильная версия появилась 18 октября 2007 года)

Читать дальше...

Upgrading to Oracle RAC 11g on Oracle Enterprise Linux

Хорошая ссылка, к сожалению (насколько я понял) не показывает как сделать rolling upgrade, или скажем обновить только clusterware и ASM

Upgrading to Oracle RAC 11g on Oracle Enterprise Linux

Читать дальше...

Читаем Wikipedia

Скорее просто интересно походить по ссылкам с этой странички знаменитой энциклопедии Wikipedia
Oracle RAC - Wikipedia, the free encyclopedia

Читать дальше...

DataCenter Automation and Configuration Management :

Мне кажется интересный блог, посвещенный управлению кластером с помощью
EMGC:
DataCenter Automation and Configuration Management :

Также попались ссылки по теме:

Video:
http://download.oracle.com/enterprise_manager/extend_cluster/extend_cluster.html

PDF
http://www.oracle.com/technology/products/database/clustering/pdf/emgcdeployproc.pdf
http://www.oracle.com/technology/products/oem/pdf/grid-automation-deployment-procedures.pdf

Читать дальше...

Using Deplyment Procedure to Scale-Up Oracle RAC

emgcdeployproc.pdf (application/pdf Object)

Читать дальше...

Разные новости

Версии 11g на Windows еще нет, но она уже занимает 1 место в тестах TPC.
Top Ten TPC-C by Price/Performance

Вышел очередной Critical Patch Updates

На корпоративном сайте появилась единая ссылка для различных статей на русском.

Читать дальше...

ASM or raw devices ?

Услышал очень емкую фразу про сравнение производительности ASM и сырых (raw) устройств:

"ASM не производит никаких операций ввода-вывода - поэтому сохраняет производительность сырых устройств"

Действительно (хотя я не смог явно найти этого в документации) регулярный ввод-вывод (т.е. то что делает DBWR или LGWR) как производился этим процессами так и производится. Другое дело, что ASM обеспечивает карту - т.е. куда именно следует записать. Картинка из презентации справа иллюсстрирует тоже самое.

Хорошее описание с правильным (я надеюсь) описанием также можно взять здесь:

AcingASM.pdf (application/pdf Object)

Из картинки мне кажется ясно следует, что только первоначальную разметку и создание/увеличение файлов делает ASM.

Раз так, то мне кажется нет смысла держать БД на raw устройствах.
Естественно, поскольку mirrroring & striping делается на прикладном уровне - это не очень быстро.
Так что если есть возможность - конечно лучше отдавать mirrroring & striping дисковому массиву. Опять таки статистики с массива по вводу выводу можно получить более разумные. Тут есть еще один не однозначный для меня ход :)

ASM всегда делает страйпинг. Таким образом если вы используете возможности массива в ваших дисковых группах должен быть всегда только 1 диск. В противном случае, если появится другой - начнется ребалансинг а затем и страйпинг. Добавление места должно осуществляться только путем расширения этого одного диска.

Опять таки, из-за того что ASM всегда делает страйпинг кажется, что если в дисковой группе будет два разных по объему диска, то будет использоваться только меньший объем. И даже больше - отличное замечание про размер дисков.

Другое дело - сравнение ASM с Volume Manager'ами.
Да, конечно в 11g появилось preferred mirror read, мы потихонечку догоняем функциональность VM, но пока только догоняем.
Мне также обещают прислать сравнение по скорости, где ASM выигрывает у Veritas VM.
Но по гибкости управления ASM все еще проигрывает. Опять таки в 11g в asmcmd появилась возможность копировать файлы данных между ASM и файловой системой.
Но те кто занимаются storage'ами конечно знают, что необходимо гораздо больше возможностей.

Но ASM бесплатно - а промышленные Volume Manager стоят существенные деньги.
Так что у каждого продукта свой круг пользователей.

Читать дальше...

Oracle and InfiniBand

Из внутреннего mail-list'a, мне понравилась краткость изложения и приведенные ссылки.

Если кто-нибудь использует данную технологию на платформе HP-UX напишите мне пожалуйста.

"
Below is some Oracle and InfiniBand information from last year's Oracle World. GigE is sufficient for most of RAC customers today, and InfiniBand is good for customers with interconnect intensive (or latency sensitive) applications or a grid environment with many nodes. See the customer case study in the RDS presentation below.

If the customer's application does not stress the existing interconnect (e.g. GigE), then they won't see the benefits of InfiniBand. We also have customers who are interested in InfiniBand for unified fabric or consolidating public, private, and storage networks into one network. That can bring significant infrastructure cost savings by eliminating expensive components like FC switches, etc.

-----------------------------------------------------------------------

At Oracle World 2006, we made two Reliable Datagram Sockets (RDS) over InfiniBand (IB) related announcements. See the press releases below:

1. The general availability of RDS over IB support on Linux
http://www.oracle.com/corporate/press/2006_oct/openworldsf06 -15.html

2. Oracle sets world record TPC-H one terabyte clustered benchmark result (with RDS)
http://www.oracle.com/corporate/press/2006_oct/openworldsf06- 18.html?rssid=rss_ocom_pr

Oracle World RDS presentation
http://www.oracle.com/technology/deploy/availability/pdf/oow06/S281216_Tsien.pdf

RDS installation documents

http://www.oracle.com/technology/products/database/clustering/pdf/rds_installation_on_oracle_rac_10g_release_2_linux_clusters.pdf
"

Читать дальше...

CREATE EDITION in 11g

Q. Where can I find information about the functionality of CREATE EDITION in 11g?
A. The answer is simple, if sad: nowhere*!

It was initially intended to expose edition-based redefinition in 11.1. Sadly, Release Management decided to delay the exposure.

Ждем 11R2 ?

PS
Create edition DDL был обещанный механизм борьбы с проблемой перекомпиляции в 11g. Обещали, что будет возможно держать одновременно несколько версий одного и того же пакета.

Читать дальше...

Global FS and voiting file

Ниже идет теоритическое рассуждение, пока не подкрепленное практикой. Буду благодарен любым комментариям.

"
Казалось, что нет никаких проблем в том, чтобы положить скажем voiting file на разделяемую файловую систему. Это поддерживается в многочисленных статьях по совместимости. Однако, при близжайшем рассмотрении, оказалось что это не совсем так. Так. например в Note: 444136.1 уже совсем не рекомендуется делать это для AIX GPFS.
Наскольк я понял, пока файловая система будет решать свои проблемы реконфигурации, voliting file становится недоступным и кластер может "развалиться".

Так ли уж специфична эта проблема для GPFS ? Мне кажется нет.
Опять таки догадка, что важно здесь, работает ли конкретная GPFS поверх понятного для Oracle кластерного софта или нет. Пример - Veritas Global VxFS работает поверх Veritas Cluster'а, а вот похоже GPFS использует свой протокол (не HACMP).

Итак, если у нас есть такая "самостоятельная" глобальная файловая система и у нас, скажем, отъезжает одна из нод, то если реконфигурация файловой системы будет идти долше чем timeout Oracle clusterware - то велик риск, что кластер развалится полностью, чтобы не повредить данные.
Timeout. Ага. Из Note:294430.1 можно видеть, что для Unix таймаут (misscount) стоит по умолчанию в 30 сек. И ноды перегружаются, если не могут внутри таймаута провзаимодействовать или по сети, или через диск.
Не могу привести сейчас источник, но читал, что если Oracle clusterware "садится" поверх стороннего кластерного ПО, то timeout становится 600 сек.

Исходя из последних нескольких предложений: Если у нас "самостоятельная" файловая система то timeout у Oracle clusterware стоит в 30 сек, в момент реконфигурации файловой системы ноды будут перегружаться. Если файловая система стоит поверх кластерного ПО, таймауты у Oracle Clusterware большие, реконфигурация успеет пройти.
Но все равно, мне кажется что voiting стоит размещать только на shared raw устройствах.

Возможно спасает использование копии voiting файла на общем NFS ?

"

Читать дальше...

What's New in Oracle Real Application Clusters Administration and Deployment?

Вот об этом можно будет поговорить 1 ноября на специальном стенде посвещенном RAC на Oracle TechForum. Чтобы Вы не ошиблись привожу общий вид стенда слева :)))

Читать дальше...

RAC on Extended Distance Clsuters

Отличная статья про построение extended distance clusters.
Дейстивтельно, очень интересная, написанная очень простым языком, но содержащая огромное кол-во деталей, которое надо уметь читать между строк.

Даны очень полезные ссылки, приведен список известных customer'ов, использующих это решение.

Крайне рекомендую, мне по крайне мере очень понравилась, и я далеко не все понимаю.
Кто-нибудь может вот это объяснить ?
"
Quorum implementation in HP-UX require that there is an equal number of nodes at each site"
"

Как один человек смог это все написать, легко перескакивая между различными стеками вендорского clusterware ?

ExtendedRAC10gR2.pdf (application/pdf Object)

Читать дальше...

Подписаться на: Сообщения (Atom)