Vous êtes sur la page 1sur 6

INFORME

ANALISIS DE CONFIGURACION DE IBM V7000


PROBLEMA FILESYSTEM CORRUPTOS
U275/U230/U232 CDLV

PLATAFORMA PSERIES

Contenido
1.- Introduccin
2.- Descripcin del Problema y detalle de Eventos
3.- Anlisis de problemas detectados y revisin
4.- Conclusin
5.- Recomendaciones
6.- Plan de Accin

1.- Introduccin

El siguiente documento contiene la revisin de configuracin del IBM


Storwize V7000 usado para migrar datos en el Banco de Chile y el
anlisis del snap recolectado en la unidad. Contiene la revisin del log
de eventos y el anlisis de los casos de software y hardware
generados por los problemas relativos a eventos de corrupcin de
datos en sistemas corriendo IBM AIX que fueron migrados dentro del
proyecto Consolidacin de Storage y Migracin de Datos en el Banco
de Chile.

1.1 Contenido

Descripcin del problema y detalle de eventos

Anlisis de problemas detectados y revisin

Conclusin

Recomendaciones

Plan de Accin

2.- Descripcin del Problema y detalle de Eventos


Varios servidores corriendo IBM AIX han presentado problemas de posible
corrupcin, los eventos registrados en los logs de los sistemas operativos
apuntan a daos en la estructura de filesystems. El Cliente ha ejecutado
reparaciones de estos filesystems usando las herramientas y
funcionalidades del sistema operativo resolviendo el problema en forma
temporal, no obstante, los problemas vuelven a presentarse en varios
casos.
Sistemas detenidos
PMR
RCA

: N/A
: 00044, 00061, 00071, 00076, 00078
: N/A

3.- Anlisis de problemas detectados y revisin


Host
La revisin de los snap recolectados desde los sistemas afectados muestra
errores de corrupcin de la estructura de filesystems provenientes de la
SAN con backend IBM Storwize V7000. No se detectan errores de hardware
o en sistema operativo IBM AIX.

SAN IBM Storwize V7000 - backend


Los siguientes Host estn definidos en el mapping:

Host name

U249

U231

U230

U275

U232

HBA WWPN
2100001B321108A1
2101001B323108A1
2100001B329201DC
2101001B32B201DC
2101001B32B2DDDE
2100001B3292DDDE
2101001B32B257DA
2100001B329257DA
21000024FF230B30
21000024FF230B31

Estado
Online
Online
Online
Online
Online
Online
Online
Online
Online
Online

Todos los Host definidos se encuentran online y cada HBA (Host BUS
Adapter fcsXX) corresponde a las que muestra el sistema operativo en la
salida de cada adaptador para el comando # lscfg vpl las que se
encuentran en estado online y en login 2 veces por cada nodo, esto quiere
decir que el nodo 1 del cluster tiene acceso a ambas HBA, del mismo
modo, el nodo 2 del cluster tiene acceso a ambas HBA.
Lo anterior cumple las recomendaciones de mejores prcticas de
configuracin e instalacin en donde cada nodo en el IBM Storwize V7000
debe estar conectado y zonificado en cada fabric de la SAN, en este
escenario, el nodo 1 debe ver todas las HBA por Fabric 1 y 2 mientras que
el nodo 2 debe ver todas las HBA en Fabric 1 y 2 para cada Host definido
para mapping.
El mapping de vDisk es vlido en el Storage para los Host reportados, cada
HBA est online y los volmenes publicados (vDisk) se encuentran en
estado online.

Existen eventos registrados en el IBM Storwize V7000 GUI (Graphical User


Interface) relacionados con configuracin de controladoras de hardware no
soportada. Estos eventos estn relacionados con el acceso actual del
Storage los backends que se utilizaron en las migraciones anteriores y que
mantienen acceso a los puertos de los nodos del cluster en la SAN. Estos
eventos son despreciables y no deben ser tomados en cuenta para la
determinacin de problemas de este caso. Los mismos desaparecern
cuando las zonas activas en la SAN sean eliminadas por el administrador.
Es interesante el hecho que los Host reportados con corrupcin detectada
luego del proceso de migracin no fueron migrados con la herramienta del
IBM Storwize V7000. Estos Host fueron migrados utilizando la
funcionalidad de LVM (mirror, migratepv) a solicitud del Cliente ante la
imposibilidad del reboot de sanidad y apagado controlado de varios de los
sistemas que es uno de los requerimientos para la migracin por
virtualizacin.
En adicin, el Host U234 tambin se migr utilizando las herramientas de
LVM AIX y no se ha reportado con problemas, en este documento se
recomendar validar y certificar su contenido.

4.- Conclusin
Posible problema de estructura de filesystems.
5.- Recomendaciones

Validar requerimientos de IBM Storwize V7000 para IBM AIX en cada


Host

Planificar eliminacin de zonas para storage backends migrados y


baja en la SAN

Configurar las alertas de los equipos para el envo de email a IBM y


al administrador

6.- Plan de Accin


6.1 Validar requerimientos de IBM Storwize V7000 para IBM AIX en cada Host
http://www-01.ibm.com/support/docview.wss?uid=ssg1S4000201

Prerequisitos AIX
http://www-01.ibm.com/support/docview.wss?
rs=540&context=ST52G7&dc=D400&q1=Host+script&uid=ssg1S4000203&loc=en_US&cs=utf8&lang=en

Actualization software multiphat Host Attachments y SDDPCM


Secuencia de instalacin para AIX 5.3
Host Attachments
Fileset
Actualizar PTF

(devices.fcp.disk.ibm.rte)
devices.sddpcm.53.rte.tar
devices.sddpcm.53.2.6.3.2.bff

o superior
o superior

Warning: SDDPCM 2.1.3.0 (and below) requires APARS for use with AIX 5.2 TL10 SP1 (5200-10-01)
or AIX 5.3 TL6 SP1 (5300-06-01) or with VIOS V1.4 or above. See this flash for details.

SDDPCM para IBM Storwize V7000


http://www-01.ibm.com/support/docview.wss?uid=ssg1S4000201#Storwize

6.2 Crear nuevos vDisk y publicar a los Host


6.3 Crear nuevos filesystems en los nuevos hdisk (LUN en vDisk del backend)
6.4 Copiar o mover los datos desde los filesystems afectados
6.5 Sincronizar y crear nuevas reas de boot y modificar lista de boot para rootvg
6.6 Reboot controlado y certificacin de cada Host
6.7 Documentar e informar resultados

Vous aimerez peut-être aussi