Linux Revisar estado de una interfaz de red

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.880
Amigos, necesito que me ayuden con ideas.

Tengo dos servidores RedHat 6 conectados con una red privada que es de uso sólo de esos dos servidores. Además, estos servidores tienen otras interfaces de red con ip pública.

La cosa es que uno de los servicios de los servidores (cluster de oracle) falló por problemas de red para acceder al otro servidor mediante la red privada.

Así a lo bruto tiré un ping desde el servidor "malo" al servidor "bueno" por intermedio de la red privada, y efectivamente se demora en responderme algunos ping y me da 45% de packet loss. A la inversa lo mismo, desde el servidor "bueno" tiré un ping al servidor "malo" por intermedio de la red privada 54% de packet loss. Las pruebas de ping en ambos servidores por la ip pública anduvieron bien, 0% de packet loss.

¿Conocen herramientas, métodos o lo que sea para chequear el estado de la tarjeta de red de los servidores? Esto es en paralelo a la revisión del switch.


Gracias
 
Última modificación:

yakko

pingüino mal genio
Se incorporó
24 Agosto 2004
Mensajes
16.883
Y el switch no tiene nada como port secure o similar que detecte varias bocas traficando en la misma ip/mac?
 
Upvote 0

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.880
Y el switch no tiene nada como port secure o similar que detecte varias bocas traficando en la misma ip/mac?

Ni idea. Igual los amigos de Dell me van a mandar unas recomendaciones, pero hasta el momento no hay diagnóstico de por qué de un día para otro comenzaron a haber paquetes perdidos.
 
Upvote 0

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.880
Oye wn y cambiaste el cable físico?

Es una plataforma Blade de Dell. El servidor no tiene un cable físico como tal apuntando a un switch. Los servidores se meten en hojas a un chasis blade y dentro se configura para que bocas tira los "cables". Es una huea rara que no terminé de entender así que no se explicar bien.
 
Upvote 0

Cosme

Gold Member
Se incorporó
27 Febrero 2005
Mensajes
8.281
Es una plataforma Blade de Dell. El servidor no tiene un cable físico como tal apuntando a un switch. Los servidores se meten en hojas a un chasis blade y dentro se configura para que bocas tira los "cables". Es una huea rara que no terminé de entender así que no se explicar bien.

Basta decir que era un blade :v

Iba a preguntar si habías revisado el cable, hasta que caché que esa tarjeta de red viene OEM dentro de los blade DELL M1000E
 
Upvote 0

tglaria

InExperto
Se incorporó
10 Febrero 2005
Mensajes
9.774
Vengo a puro copuchear...
Por esas casualidades de la vida, ¿la conexión a la red pública nunca tuvo problemas? ¿o no se usaba mucho?
Si estás usando una única interfaz física, quizá el error que tienes ahora siempre estuvo, pero a la red pública que no era tan crítico como a la red local de los servidores.

¿O es muy tonto lo uqe pienso?
 
Upvote 0

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.880
Vengo a puro copuchear...
Por esas casualidades de la vida, ¿la conexión a la red pública nunca tuvo problemas? ¿o no se usaba mucho?
Si estás usando una única interfaz física, quizá el error que tienes ahora siempre estuvo, pero a la red pública que no era tan crítico como a la red local de los servidores.

¿O es muy tonto lo uqe pienso?

No se si la red pública tuvo problemas antes, pero las pruebas que he hecho ahora muestran que no tiene niun paquete perdido.
La red pública se usa mucho. Es el servidor de base de datos central, así que los aplicativos llegan por ahí.
De todas maneras el problema es con la red privada, que de un día para otro comenzó a tener 50% o más de paquetes perdidos.

La red privada la usa oracle para que los servidores conversen. Esta red debe ser privada para no tener interferencia, ya que ante el menor paquete perdido entre la comunicación del cluster se corre el riesgo de corrupción de datos por lo cual oracle "se protege" y baja un servicio de base de datos y no levanta hasta que la red privada vuelva a estar impeke. Eso es lo que me está pasando ahora.
 
Upvote 0

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.880
Update. Es como 99% seguro que es el switch porque otra solución distinta, que usa otra vlan dentro de la misma máquina, comenzó a dar jugo a la misma hora que estas máquinas oracle.
 
Upvote 0

yakko

pingüino mal genio
Se incorporó
24 Agosto 2004
Mensajes
16.883
oe pero tener un bonding en un blade es como tener un raid de 2 discos virtuales en el mismo datastore en una maquina virtual vmware, no tiene sentido.
 
Upvote 0

sr_meck

a.k.a chikogollo
REPORTERO
Se incorporó
14 Mayo 2004
Mensajes
6.519
y [MENTION=6]Zuljin[/MENTION] en que estamos, es problema del swtich de blade?
 
Upvote 0

Zuljin

Fundador
Miembro del Equipo
Fundador
ADMIN
Se incorporó
15 Enero 2004
Mensajes
11.880
Yep. Se reinició un tercer switch de la blade y se resolvió.
 
Upvote 0
Subir