GUI - Troubleshooting ASR 1000 v4

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 37

TM

Advanced Services

Cisco Systems Advanced Services


TEE / Troubleshooting Cisco ASR1000

Version 4

Corporate Headquarters
Cisco
170 West Tasman Drive
San Jose, CA 95134-1706
USA
http://www.cisco.com
Tel: 408 526-4000
800 553-NETS (6387)
Fax: 408 526-4100
Contenido

Contenido........................................................................................................................................2

Introducción....................................................................................................................................3

Propósito del documento .........................................................................................................3


Arquitectura de los ASR1000 ........................................................................................................4

Introducción al hardware .........................................................................................................4


Introducción al ASR1001 .................................................................................................................... 5
Introducción al ASR1002 .................................................................................................................... 6
Introducción al ASR1002-X ............................................................................................................... 7
Arquitectura del sistema a alto nivel ......................................................................................8
Troubleshooting .......................................................................................................................... 12

Alarmas del equipo ................................................................................................................ 12


Estado del hardware instalado ............................................................................................. 12
Uso de la CPU y memoria por procesos del IOS-XE .......................................................... 13
Crashes ................................................................................................................................... 15
Tipo de Crashes ................................................................................................................................. 15
Recopilando información sobre el crash ........................................................................................... 15
Fichero de Crashinfo ......................................................................................................................... 16
Fichero Core Dump ........................................................................................................................... 16
IOSD Crash ....................................................................................................................................... 17
SPA Driver Crash.............................................................................................................................. 19
Cisco IOS XE Process Crash ............................................................................................................ 19
Cisco Quantum Flow Processor Microcode Crash ............................................................................ 21
Linux Kernel Crash ........................................................................................................................... 21
ANEXO A – Actualización de software ..................................................................................... 22

Procedimiento para actualizar el software IOS-XE .......................................................................... 22


Procedimiento para actualizar la versión de ROMmon ..................................................................... 27
Procedimiento de recuperación desde estado ROMmon ................................................................... 28
ANEXO B – ERSPAN en ASR1K ................................................................................................ 31

Referencias .................................................................................................................................. 34

Glosario ........................................................................................................................................ 35

Control del documento ............................................................................................................... 36

Historia .................................................................................................................................... 36
Revisiones .............................................................................................................................. 36

March 10, 2015 Troubleshooting Cisco ASR1000 2


Company Confidential. A printed copy of this document is considered uncontrolled.
Introducción

Propósito del documento

A través de esta guía se intentara transmitir los conocimientos básicos necesarios para poder interpretar
los mensajes de error y crashes en los routers de la gama ASR1000, de modo que se pueda determinar en
la medida de lo posible si se trata de un error de hardware o software, así como los comandos básicos
troubleshooting para poder recopilar la información necesaria con el objetivo de agilizar la escalación y
permitir un mejor análisis de la incidencia.

Esta guía en ningún momento pretende reemplazar ó sustituir la documentación oficial de Cisco que se
encuentra disponible en múltiples páginas WEB de Cisco, sino mas bien extraer de ellas, lo fundamental
para ofrecer unas indicaciones de cómo proceder en la mayoría de los casos, donde se requiera la
instalación, manipulación tanto del hardware como del software del mencionado dispositivo.

March 10, 2015 Troubleshooting Cisco ASR1000 3


Company Confidential. A printed copy of this document is considered uncontrolled.
Arquitectura de los ASR1000

Introducción al hardware
De la gama de equipos Cisco ASR1000 actualmente están validados en el Libro técnico de EDCs
los modelos ASR1001, 1002, 1002-X.

Modelos ASR 1001 ASR 1002 ASR 1002-X

Escalabilidad ESP 2.5 Gbps a 5 Gbps (por licencia) 5 Gbps (ESP5) a 10 Gbps (ESP10) 5 Gbps a 36 Gbps (por licencia)

Escalabilidad encriptación
1.8 Gbps 1.8 Gbps (ESP5) a 4 Gbps (ESP10) 4 Gbps
hardware

Shared port adapters (SPA) 1 3 3

Embedded services processor


Integrado 1 Integrado
slots

Route processor slots Integrado Integrado Integrado

Redundacia Si (solo Software) Si (solo Software) Si (solo Software)

Número de SFP en puertos


4 4 6
GE

Integrated Daughter Card


Si * No No
(IDC)

Fuente de alimentación Si: Doble fuente de alimentación; Si: Doble fuente de alimentación; Si: Doble fuente de alimentación;
redundante con la opción de ser AC o DC con la opción de ser AC o DC con la opción de ser AC o DC

Flujo de aire De delante hacia atrás De delante hacia atrás De delante hacia atrás

Altura 43.43 mm 88.9 mm 88.9 mm

Anchura 439.42 mm 437.4 mm 437.4 mm

Profundidad 470 mm 558.8 mm 558.8 mm

Peso 10.59 kg 15.23 kg 17.36 kg

*El modelo ASR1001 validado para Telefónica es el “Cisco ASR1001 Chassis w/o IDC” que no tiene tarjeta hija integrada (IDC).

March 10, 2015 Troubleshooting Cisco ASR1000 4


Company Confidential. A printed copy of this document is considered uncontrolled.
Introducción al ASR1001
El modelo ASR1001 es un equipo de tamaño 1 RU, con el objetivo de ahorrar espacio integra en el
chasis la Route Processor (RP), la procesadora de servicio (ESP) y un slot para una tarjeta SPA (Shared
Port Adapter).

En el chasis también tiene integrado 4 puertos GigabitEthernet con slots SFP.

El rendimiento de la procesadora de servicio se puede incrementar del valor por defecto 2.5 Gbps a
5 Gbps activándolo por licencia (FLS-ASR1001-5G).

El ASR 1001 no permite tener redundancia de hardware ni de la RP ni ESP, pero si permite


redundancia en software, es decir correr dos IOS en la misma RP.

El ASR1001 tiene doble fuente de alimentación en la parte trasera del equipo.

LED COLOR Significado


Encendido, todos los requisitos de alimentación
Verde Fijo
PWR (Power) eléctrica está según las especificaciones
Apagado Apagado. El router está en modo standby.
Rojo Ocurre durante un fallo del sistema o en el arranque.
Arranque en modo ROMMON.
El motivo puede ser un fallo de software en la RP o el
Amarillo Process Manager ha indicado un fallo de un proceso
STAT (Status) crítico de la RP (incluyendo el IOSD).

El Cisco IOSD y otros procesos necesarios han cargado


Verde Fijo
correctamente y están operativos.
Este Led funciona como un indicador de alarma critica,
Rojo Fijo si esta encendido indica una alarma de tipo crítico.
CRIT (Critical)
Tened en cuenta que durante el arranque es normal que
este encendido (fijo, no parpadeando).
MAJ (Major) Rojo Fijo Indicador de alarma mayor.
MIN (Minor) Amarillo Indicador de alarma menor.
BOOT(bootflash LED) Verde Indica actividad en el uso de la memoria
Verde Fijo
Hay link, no hay actividad
LINK (10/100/1000
LED interface) Verde Actividad en el puerto ethernet
parpadeando
Apagado No hay link

March 10, 2015 Troubleshooting Cisco ASR1000 5


Company Confidential. A printed copy of this document is considered uncontrolled.
Introducción al ASR1002
El modelo ASR1002 es un equipo de tamaño 2 RU, con el objetivo de ahorrar espacio integra en el
chasis la Route Processor y una SIP10.

La SIP10 integrada en el chasis del ASR1002 tiene 3 slots para tarjetas SPA y donde normalmente
llevaría el cuarto slot para SPA es donde este equipo lleva integrado la RP y 4 puertos
GigabitEthernet con slots SFP.

La procesadora de servicio (ESP) es modular y se puede sacar del chassis. Este equipo permite la
procesadora de servicio ESP5 o la ESP10.

Solo las SPA soportan la funcionalidad de online insert and removal ( OIR).

El ASR 1002 no permite tener redundancia de hardware ni de la RP ni ESP, pero si permite


redundancia en software, es decir correr dos IOS en la misma RP.

El ASR1002 tiene doble fuente de alimentación en la parte trasera del equipo.

Detalle de los LEDs en la RP1 del ASR1002:

Detalle de los leds en la ESP del ASR1002:

LED COLOR Significado


Encendido, todos los requisitos de alimentación
Verde Fijo
PWR (Power) eléctrica está según las especificaciones
Apagado Apagado. El router está en modo standby.
En la ESP  Verde cuando el procesador de servicio
ACTV (Active) Verde
(ESP) está activa

March 10, 2015 Troubleshooting Cisco ASR1000 6


Company Confidential. A printed copy of this document is considered uncontrolled.
En la RP  Verde cuando la route processor está activa
En este modelo de router, siempre estará apagado. Al no
STBY (Standby) Apagado
haber posibilidad de doble ESP y/o RP.
Rojo Ocurre durante un fallo del sistema o en el arranque.
Arranque en modo ROMMON.
El motivo puede ser un fallo de software en la RP o el
Amarillo Process Manager ha indicado un fallo de un proceso
STAT (Status) crítico de la RP (incluyendo el IOSD).

El Cisco IOSD y otros procesos necesarios han cargado


Verde Fijo
correctamente y están operativos.
Este Led funciona como un indicador de alarma critica,
Rojo Fijo si esta encendido indica una alarma de tipo crítico.
CRIT (Critical)
Tened en cuenta que durante el arranque es normal que
este encendido (fijo, no parpadeando).
MAJ (Major) Rojo Fijo Indicador de alarma mayor.
MIN (Minor) Amarillo Indicador de alarma menor.
Si parpadea indica actividad en el uso de la memoria
HD Verde
(disco duro)
Si parpadea indica actividad en el uso de la memoria
USB Verde
(USB)
Si parpadea indica actividad en el uso de la memoria
BF (Bootflash) Verde
(Bootflash)
Verde Fijo
Hay link, no hay actividad
LINK (10/100/1000
LED interface) Verde Actividad en el puerto ethernet
parpadeando
Apagado No hay link

Introducción al ASR1002-X
El modelo ASR1002-X es un equipo de tamaño 2 RU, en el chasis integra la Route Processor, procesadora de
servicio (ESP) y un SIP con 6 puertos GigabitEthernet con slots SFP.
La procesadora de servicio (ESP) que en este modelo no es modular, ofrece por defecto un ancho de banda
de 5Gbps y permite aumentar por licencia hasta 10 Gbps, 20 Gbps y 36 Gbps.
Solo las SPA soportan la funcionalidad de online insert and removal ( OIR).

El ASR 1002 no permite tener redundancia de hardware ni de la RP ni ESP, pero si permite redundancia en
software, es decir correr dos IOS en la misma RP.

El significado de los leds es idéntico al modelo ASR1002.

March 10, 2015 Troubleshooting Cisco ASR1000 7


Company Confidential. A printed copy of this document is considered uncontrolled.
Arquitectura del sistema a alto nivel

Conviene para hacer troubleshooting de los equipos ASR1000 el entender la arquitectura de esta plataforma,
para poder asociar luego los mensajes de error a los diferentes componentes.
Los ASR1000 tienen una arquitectura de tipo distribuido, podemos separarlo en tres grandes componentes:
Route Processor (RP)  se encarga del plano de control
Embedded Series Processor (ESP)  se encarga del plano de forwarding
SIP Cards  se encargan de la entrada y salida a la red
Los planos de control y de forwarding están separados, lo que permite tener un nivel alto de redundancia. La
carga de uno de estos planos no afecta a otra, son independientes.
El plano de control es de tipo distribuido, no solo la RP sino la ESP e incluso las tarjetas SIP tienen
procesadoras de control lo que significa que tienen su propia CPU y memoria para hacer operaciones de
control.

En los modelos ASR1001, 1002 y 1002-X al no tener posibilidad de redundancia hardware de RP y FP


tendríamos solo los activos (imagen de arriba).
RP (route processor)  Se encarga de correr el plano de control (IOS) incluyendo el proceso de los
paquetes de control de red, calculo de rutas y establecimiento de las conexiones. Se encarga
también de los puertos de gestión, las alarmas del CLI , la distribución del código a otros
componentes del sistema, activación de la redundancia hardware y sincronización entre los
elementos, del logging y las estadísticas en el equipo.

March 10, 2015 Troubleshooting Cisco ASR1000 8


Company Confidential. A printed copy of this document is considered uncontrolled.
La RP también se encarga de diferente tipo de tráfico, por ejemplo todo el Punt traffic en el sistema
(a través de la ESP), trafico de protocolos antiguos como DECnet, Internet Packet Exchange (IPX),
etc. y tambien el de gestión delpuerto de management (el gigabit Ethernet de la RP),
ESP’s Control Processor (FECP)  Se encarga del plano de forwarding, acceso directo a la forwarding
engine y gestión del chipset del procesador “Cisco Packet Processor”
SIP’s Control Processor Acceso CPU a las SPA’s conectadas en la SIP, gestion de los eventos de OIR
(Online Insert-Removal), gestiona los drivers de las SPA para reiniciar y configurar las SPAs

El plano de forwarding, sin embargo es de tipo centralizado todo tráfico pasa por la ESP.

A nivel software tambien los ASR1000 son sistemas distribuidos, la RP, ESP y las SIP cards corren un kernel de
Linux.

El sistema operativo llamado IOSXE podemos verlo como la suma de:

IOS XE = IOS + IOS XE Middleware + Platform Software

Cada tarjeta SIP corre su propio proceso de Linux Kernel y tiene procesos separados para cada SPA que esta
insertada. En Linux cada proceso tiene asignada un espacio de memoria único, al no ser compartida por
otros procesos es más estable. Un fallo de una SPA no debe afectar a otros procesos que corren en el kernel
de la SIP Card (al ser procesos independientes con memoria no compartida).

El IOS corre en el kernel Linux de la RP como un proceso más que se llama IOSD. El CLI es el mismo que el IOS
de otras plataformas.

El kernel de IOS-XE es multitarea y gestiona cada proceso de una forma “preemptive”, es decir la CPU puede
parar la ejecución de un proceso para correr otro proceso de prioridad más alta. Esto se traduce en que los

March 10, 2015 Troubleshooting Cisco ASR1000 9


Company Confidential. A printed copy of this document is considered uncontrolled.
procesos con prioridad más alta no se ven afectados por los procesos con menor prioridad. Procesos con
igual prioridad o menor si se pueden ver afectados entre ellos.

De cara al troubleshooting en los ASR es importante discernir no solo si es de tipo hardware o software sino
también si el problema es del IOS (por tanto independiente de la plataforma) o específico de la plataforma
(IOS XE).

Con una arquitectura de este tipo tenemos que tener en cuenta que podemos tener un CLI que nos
responde correctamente pero a nivel de forwarding el equipo no funciona.
Si tenemos un problema específico de la plataforma, generalmente en los mensajes de error nos indicará
que proceso está siendo afectado.
Los mensajes de error de IOS-XE son muy similares a los mensajes de error de IOS, el formato es el siguiente:

<facility>-<severity>-<error message name>


Ejemplo FMANFP-6-IPACCESSLOGP

En el campo “facility” nos indica el proceso afectado, a continuación se muestra un resumen de los procesos
del IOS-XE y su función para de este modo ver que puede estar afectando y a qué nivel.

IOSd: Cisco IOS basado en la 12.2SR,

El proceso de IOSD tiene tres subprocesos o flujos  IOS thread, Fast thread and IFS thread

IFS thread proceso que gestiona el acceso alsistema de ficheros.


IOS thread se encarga del IOS scheduler y “processes”.
Fast thread es parte del proceso IOSD, y aparece en la parte de interrupt con el comando “show processes
cpu”. Se encarga del fast-switching y algunos procesos a tiempo real (BFD, IPC message pumping etc)

El “Fast thread” tiene una prioridad más alta que la mayoría de los procesos IOS-XE por lo que si hace un uso
intensivo de la CPU si puede afectar a otros procesos IOS-XE ralentizándolos. Esto no pasa con IOS thread o
IFS thread porque no tienen tanta prioridad y aunque hagan un uso intensivo de la CPU el kernel del IOS-XE
permite que se sigan corriendo otros procesos.

FMAND-RP: Forwarding Manager


Responsable del mantenimiento del plano de forwarding entre la RP y ESP.

IMAND-RP: Active Interface Manager


Responsable del mantenimiento del estado de las SIP/SPA

PSD-RP: Platform Service Manager


Responsable de la configuración del hostname, del reloj, del interfaz Ethernet de gestión, etc.

HMAND: Host Manager


Responsable de la configuración a nivel de host por ejemplo las tareas de matar procesos,
generación de los comandos tipo “show”, estadísticas del sistema, etc…

March 10, 2015 Troubleshooting Cisco ASR1000 10


Company Confidential. A printed copy of this document is considered uncontrolled.
SMAND: Shell Manager
Responsable de la infraestructura del shell (es útil cuando IOSd se comporta de forma incorrecta)

CMAND: Chassis Manager


Responsable de la gestión de OIR, monitorización de variables de entorno y otras funcionalidades del
chasis.

EMD: Environmental Monitoring


Es un proceso esclavo del CMAND. Cuando un hardware responde lentamente para no ralentizar el
proceso de CMAND se usa este otro.

LIGHTHTTPD: Web Server (open source)


IOS XE home page

BTRACE: Tracing Server


Responsable de la ejecución de los traces y la rotación de los ficheros de trace.

PMAND: Process Manager


Responsable de la monitorización y reinicio de procesos.

INITD: Initialization Daemon (open source)


Responsable del inicio del sistema

XINETD: IP Connection handler (open source)

Gestiona las conexiones entrantes

PLOGD: Log Server

Gestiona el funciones de logging del sistema

SNTPD: Simple Network Timing Protocol Daemon (open source) .


Sincroniza en hora todos las FRUs

March 10, 2015 Troubleshooting Cisco ASR1000 11


Company Confidential. A printed copy of this document is considered uncontrolled.
Troubleshooting

Alarmas del equipo


La alarmas del equipo también se pueden monitorizar en remoto, a través de SNMP MIB CISCO-
ENTITY-ALARM-MIB ó con el comando “show facility-alarm status”:
Este comando es muy útil para distinguir problemas de tipo hardware de tarjetas, de
alimentación, etc…

ASR1002#show facility-alarm status


System Totals Critical: 1 Major: 2 Minor: 0
Source Severity Description [Index]
------ -------- -------------------
Cisco ASR1002 AC Power Sup CRITICAL Power Supply Failure [0]
SPA subslot 0/1 MAJOR Unknown state [0]
SPA subslot 0/2 MAJOR Unknown state [0]

Para ver mas información de la lista de alarmas y las MIBs de SNMP:


http://www.cisco.com/en/US/docs/routers/asr1000/mib/guide/asr1mib3.html

Estado del hardware instalado


Para ver el hardware instalado y su estado a través del CLI del IOS es:

Router#show platform
Chassis type: ASR1002
Slot Type State Insert time (ago)
--------- ------------------- --------------------- -----------------
0 ASR1002-SIP10 ok 2d22h
0/0 4XGE-BUILT-IN ok 2d22h
R0 ASR1002-RP1 ok, active 2d22h
F0 ASR1000-ESP5 ok, active 2d22h
P0 ASR1002-PWR-AC ok 2d22h
P1 ASR1002-PWR-AC ok 2d22h
Slot CPLD Version Firmware Version
--------- ------------------- ---------------------------------------
0 07120202 12.2(33r)XN2
R0 08011017 12.2(33r)XN2
F0 07091401 12.2(33r)XN2

R0 es la route processor (ASR1002-ESP5) que va integrada en el chassis

F0 es la forwarding processor (ASR1000-ESP5)

March 10, 2015 Troubleshooting Cisco ASR1000 12


Company Confidential. A printed copy of this document is considered uncontrolled.
Uso de la CPU y memoria por procesos del IOS-XE
Para analizar el uso de la CPU de los procesos IOS-XE se recomienda primero hacer uso del comando “show
platform software status control-processor brief", con este comando entre otras cosas también podemos ver
si hay alguna tarjeta que hace un uso alto de la CPU.

“Load average” significa el numero de procesos esperando ser despachados en el gestor de colas.
ASR1006a#show platform software status control-processor brief
Load Average
Slot Status 1-Min 5-Min 15-Min
RP0 Healthy 0.48 0.23 0.14
RP1 Healthy 0.03 0.03 0.04
ESP0 Healthy 0.04 0.06 0.02
SIP1 Healthy 0.03 0.04 0.00
SIP2 Healthy 0.01 0.04 0.00

Memory (kB)
Slot Status Total Used (Pct) Free (Pct) Committed (Pct)
RP0 Healthy 3919872 2224188 (53%) 1695684 (41%) 2323000 (56%)
RP1 Healthy 3919872 2151548 (52%) 1768324 (42%) 2319812 (56%)
ESP0 Healthy 2030444 1107012 (52%) 923432 (44%) 3404448 (162%)
SIP1 Healthy 484452 291300 (55%) 193152 (36%) 242196 (46%)
SIP2 Healthy 484452 291424 (55%) 193028 (36%) 242172 (46%)

CPU Utilization
Slot CPU User System Nice Idle IRQ SIRQ IOwait
RP0 0 11.68 1.51 0.00 86.50 0.04 0.12 0.12
RP1 0 9.15 1.51 0.00 88.26 0.00 0.04 1.01
ESP0 0 5.35 3.43 0.00 91.14 0.02 0.03 0.00
SIP1 0 2.55 0.54 0.00 96.87 0.00 0.01 0.00
SIP2 0 2.53 0.54 0.00 96.90 0.00 0.01 0.00

Para el troubleshooting de uso de memoria, también es útil el comando anterior.

La columna de “Committed” significa el tamaño máximo de memoria que el IOS-XE podría usar. Linux tiene
un sistema de gestión de memoria virtual y los bloques de memoria física que no se asignan hasta que los
datos no son realmente almacenados. Por tanto el tamaño de memoria “Committed” no es el tamaño de
memoria física sino el tamaño de memoria virtual pedida.

En muchos ESPs se observa que tienen en la columna “Committed” un valor por encima del 100%. Esto es
normal y no significa que haya problemas a no ser que el valor de la usada (Columna “Used”) este cercano al
100%.

Otro comando que también es útil es “monitor platform software process" permite revisar la utilización de
la CPU y memoria de los procesos IOS-XE.

March 10, 2015 Troubleshooting Cisco ASR1000 13


Company Confidential. A printed copy of this document is considered uncontrolled.
monitor platform software process {r0|r1|f0|f1|0|1|2}
0, 1, 2 mean SIP slots.

top - 10:56:23 up 5:23, 0 users, load average: 0.28, 0.13, 0.06


Tasks: 80 total, 4 running, 76 sleeping, 0 stopped, 0 zombie
Cpu(s): 0.3% us, 0.0% sy, 0.0% ni, 99.7% id, 0.0% wa, 0.0% hi, 0.0% si
Mem: 2030444k total, 1109560k used, 920884k free, 20100k buffers
Swap: 0k total, 0k used, 0k free, 197472k cached

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND


4483 root 20 0 24648 10m 5572 R 0.3 0.5 0:26.50 cman_fp
14738 binos 20 0 2496 1208 976 R 0.3 0.1 0:00.05 top
1 root 20 0 2132 632 544 S 0.0 0.0 0:10.24 init
2 root 39 19 0 0 0 S 0.0 0.0 0:00.00 ksoftirqd/0
3 root 15 -5 0 0 0 S 0.0 0.0 0:00.03 events/0
4 root 15 -5 0 0 0 S 0.0 0.0 0:00.01 khelper
5 root 15 -5 0 0 0 S 0.0 0.0 0:00.01 kthread

Hay que tener en cuenta que el proceso “ppc_linux_iosd” es el nombre del proceso IOSD que nos sale al
ejecutar el comando “monitor platform software process”
Este comando permite que se auto-ejecute el comando cada cierto intervalo de tiempo.

show platform software process slot {r0|r1|f0|f1|0|1|2} monitor cycles <> interval
<> lines
cycles: <1-4294967295> Number of times (default 5) to run monitor command
interval: Delay (in seconds) after each command (default 3)
lines: Set number of lines of output displayed

March 10, 2015 Troubleshooting Cisco ASR1000 14


Company Confidential. A printed copy of this document is considered uncontrolled.
Crashes

Tipo de Crashes

Tipo de Crash Modulo Descripcion

Cisco IOS Software que corre como IOSD sobre


IOSD Crash RP
el kernel de Linux de la Route Processor (RP).

Software IOS que se ejecuta para controlar la


SPA Driver Crash SIP
SPA en la tarjeta madre SIP

RP
Varios procesos Cisco IOS XE que corren sobre
un linux kernel. Por ejemplo el chassis manager,
Cisco IOS XE Process Crash ESP
el forwarding manager, interface manager, etc
que corren en la RP
SIP

Microcodigo que corre sobre la QFP. La


Cisco Quantum Flow Processor
ESP Quantum Flow Processor es el ASICs que se
(QFP) Microcode Crash
encarga del forwarding de paquetes en la ESP

RP

Linux Kernel Crash ESP Linux kernel que corre sobre la RP, ESP y SIP.

SIP

Recopilando información sobre el crash

Con el fin de determinar la causa, el primer paso es capturar toda la información sobre el problema
como sea posible.

Esta información es necesaria para determinar la causa del problema:


- Logs de consola
- Si hay syslog server, añadir la información recogida durante el fallo
- Show platform  Este comando nos da información sobre el estado de la RP, ESP, SPA instaladas y fuentes de
amlimentacion.
- Show tech-support  Cuando sea posible ejecutar este comando antes de reiniciar el equipo (si fuera necesario)
- Log de la secuencia de arranque  Si el equipo se reinicia es importante obtener la información con los
mensajes que da el equipo al reinicio.
- Fichero de crashinfo
- Fichero de Core Dump
- Fichero de Tracelog  En los ASR 1002 se almacenan en bootflash:tracelogs sobre la RP

March 10, 2015 Troubleshooting Cisco ASR1000 15


Company Confidential. A printed copy of this document is considered uncontrolled.
Fichero de Crashinfo
Cuando hay un crash del IOSD o de un driver de SPA, se genera un fichero de crashinfo se almacena
dependiendo del modelo en:

Localizacion del fichero de


Modelo Tipo de crash
crashinfo

ASR1001 IOSD Crash


ASR1002 bootflash: sobre la RP
ASR1002-X SPA Driver Crash

ASR 1004 IOSD Crash bootflash: sobre la RP

ASR 1006 SPA Driver Crash harddisk: sobre la RP

El formato del fichero es diferente dependiendo del tipo de crash (IOSD o SPA Driver):

Tipo de crash Nombre del fichero de Crashinfo Ejemplo

crashinfo_RP_SlotNumber_00_Date- crashinfo_RP_00_00_20080807-
IOSD Crash
Time-Zone 063430-UTC

crashinfo_SIP_SlotNumber_00_Date- crashinfo_SIP_00_00_20080828-
SPA Driver Crash
Time-Zone 084907-UTC

Fichero Core Dump

Cuando hay un crash de un proceso se genera un fichero de Core Dump, en la tabla de abajo se puede ver
donde se almacena dicho fichero.

Un fichero de Core Dump es una copia de la imagen de memoria del proceso, por tanto guarda mucha más
información que un fichero de crashinfo. Es recomendable guardar el fichero de Core Dump hasta la
resolución del caso.

En el Cisco ASR1002 al no tener “harddisk:” estos ficheros se guardan bajo “bootflash:core”.


Modelo Localizacion del fichero de Core Dump

ASR 1001
ASR 1002 bootflash:core/ sobre la RP
ASR 1002-X

ASR 1004
harddisk:core/ sobre la RP
ASR 1006

No solo los ficheros de Core Dump de la RP sino también de los procesos de SIP o la ESP son almacenados en
la localización que se indica en la tabla.

March 10, 2015 Troubleshooting Cisco ASR1000 16


Company Confidential. A printed copy of this document is considered uncontrolled.
Tipos de
Nombre de fichero Core Dump Ejemplo
Crashes

hostname_RP_SlotNumber_ppc_linux_iosd-
IOSD Crash Router_RP_0_ppc_linux_iosd-_17407.core.gz
_ProcessID.core.gz

SPA Driver
hostname_SIP_SlotNumber_mcpcc-lc-ms_ProcessID.core.gz Router_SIP_1_mcpcc-lc-ms_6098.core.gz
Crash

Router_RP_0_fman_rp_28778.core.gz
IOS XE Process
hostname_FRU_SlotNumber_ProcessName_ProcessID.core.gz
Crash
Router_ESP_1_cpp_cp_svr_4497.core.gz

Cisco QFP Router_ESP_0_cpp-mcplo-


hostname_ESP_SlotNumber_cpp-mcplo-ucode_ID.core.gz
Crash ucode_042308082102.core.gz

Linux Kernel
hostname_FRU_SlotNumber_kernel.core Router_ESP_0_kernel.core
Crash

IOSD Crash
Como se ha comentado el IOS corre bajo un proceso de Linux sobre la Route Processor (RP), el nombre de
este proceso es (ppc_linux_iosd-), el demonio se llama IOSD.

En el caso de tener configurada redundancia de software, en los modelos ASR1002 y ASR1004, habrá dos
demonios IOSD corriendo sobre la RP.

Para identificar un crash del IOSD, hay que encontrar un mensaje de “Exception” del tipo que se muestra en
la tabla de abajo.

En el caso de un ASR1002 o 1004 que no tenga redundancia de software este tipo de crash lo que provoca es
reinicio del router. Si tuviera redundancia de software al haber dos instancias de IOS, habría un switchover
del IOSD en la RP. Si tuviéramos un ASR1006 con redundancia hardware y software, este tipo de crash
provocaría un switchover de la RP.

Exception to IOS Thread:


Frame pointer 2C111978, PC = 1029ED60

ASR1000-EXT-SIGNAL: U_SIGSEGV(11), Process = Exec


-Traceback= 1#106b90f504fce8544ce4979667ec2d5d
:10000000+29ED60 :10000000+29ECB4 :10000000+2A1A9C
:10000000+2A1DAC :10000000+492438 :10000000+1C22DC0
:10000000+4BBBE0

Fastpath Thread backtrace:


-Traceback= 1#106b90f504fce8544ce4979667ec2d5d
c:BC16000+C2AF0 c:BC16000+C2AD0
iosd_unix:BD73000+111DC pthread:BA1B000+5DA0

March 10, 2015 Troubleshooting Cisco ASR1000 17


Company Confidential. A printed copy of this document is considered uncontrolled.
Auxiliary Thread backtrace:
-Traceback= 1#106b90f504fce8544ce4979667ec2d5d
pthread:BA1B000+95E4 pthread:BA1B000+95C8
c:BC16000+D7294 iosd_unix:BD73000+1A83C
pthread:BA1B000+5DA0

PC = 0x1029ED60 LR = 0x1029ECB4 MSR = 0x0002D000


CTR = 0x0BD83C2C XER = 0x20000000
R0 = 0x00000000 R1 = 0x2C111978 R2 = 0x2C057890 R3 = 0x00000034
R4 = 0x000000B4 R5 = 0x0000003C R6 = 0x2C111700 R7 = 0x00000000
R8 = 0x12B04780 R9 = 0x00000000 R10 = 0x2C05048C R11 = 0x00000050
R12 = 0x22442082 R13 = 0x13B189AC R14 = 0x00000000 R15 = 0x00000000
R16 = 0x00000000 R17 = 0x00000001 R18 = 0x00000000 R19 = 0x00000000
R20 = 0x00000000 R21 = 0x00000000 R22 = 0x00000000 R23 = 0x00000001
R24 = 0x00000001 R25 = 0x34409AD4 R26 = 0x00000000 R27 = 0x2CE88448
R28 = 0x00000001 R29 = 0x00000000 R30 = 0x3467A0FC R31 = 0x2C1119B8

Writing crashinfo to bootflash:crashinfo_RP_00_00_20080904-092940-UTC


Buffered messages: (last 4096 bytes only)
...

Cuando hay un crash del IOSD, se genera un fichero de crashinfo y de core dump sobre la RP .

Ejemplo en un ASR1002:

Router#dir bootflash:
Directory of bootflash:
bootflash:crashinfo_RP_00_00_20080904-092940-UTC

Router#dir bootflash:core
Directory of bootflash:core/
3620877 -rw- 10632280 Sep 4 2008 09:31:00 +00:00 Router_RP_0_ppc_linux_iosd-
_17407.core.gz

March 10, 2015 Troubleshooting Cisco ASR1000 18


Company Confidential. A printed copy of this document is considered uncontrolled.
SPA Driver Crash
Los drivers de SPA tienen funciones IOS limitadas para el control de la SPA y corren sobre la tarjeta madre
SIP. Se puede identificar un crash del driver de una SPA si se encuentra el proceso “mcpcc-lc-ms” en modo
“held down”.

Cuando hay un crash del driver de una SPA, la SPA se reinicia:

Aug 28 08:52:12.418: %PMAN-3-PROCHOLDDOWN: SIP0: pman.sh: The process mcpcc-lc-ms has been helddown (rc 142)
Aug 28 08:52:12.425: %ASR1000_OIR-6-REMSPA: SPA removed from subslot 0/0, interfaces disabled
Aug 28 08:52:12.427: %SPA_OIR-6-OFFLINECARD: SPA (SPA-1X10GE-L-V2) offline in subslot 0/0
Aug 28 08:52:13.131: %ASR1000_OIR-6-INSSPA: SPA inserted in subslot 0/0
Aug 28 08:52:19.060: %LINK-3-UPDOWN: SIP0/0: Interface EOBC0/1, changed state to up
Aug 28 08:52:20.064: %SPA_OIR-6-ONLINECARD: SPA (SPA-1X10GE-L-V2) online in subslot 0/0

Cuando hay un crash del driver de una SPA, se genera un fichero de crashinfo y de core dump sobre la RP.

Router#dir bootflash:
Directory of bootflash:/

14 -rw- 224579 Aug 28 2008 08:52:06 +00:00 crashinfo_SIP_00_00_20080828-085206-UTC

Router#dir bootflash:core
Directory of bootflash:/core/

4653060 -rw- 1389762 Aug 28 2008 08:52:12 +00:00 Router_SIP_0_mcpcc-lc-ms_6985.core.gz

Cisco IOS XE Process Crash


Los procesos de IOS-XE corren en el kernel linux sobre la RP, ESP y las tarjetas madres SIP. En la tabla se
muestra los principales procesos.

A tener en cuenta que si se produce un crash, el modulo se reinicia.


Nombre Nombre del proceso Modulo

cmand RP

Chassis Manager cman_fp ESP

cmcc SIP

Environmental Monitoring emd RP, ESP, SIP

Forwarding Manager fman_rp RP

March 10, 2015 Troubleshooting Cisco ASR1000 19


Company Confidential. A printed copy of this document is considered uncontrolled.
fman_fp_image ESP

Host Manager hman RP, ESP, SIP

imand RP
Interface Manager
imccd SIP

Logging Manager plogd RP, ESP, SIP

Pluggable Service psd RP

QFP Client Control Process cpp_cr_svr ESP

QFP Driver Process cpp_driver ESP

QFP HA Server cpp_ha_top_level_server ESP

QFP Client Service Process cpp_sp_server ESP

Shell Manager smand RP

A continuación se muestra un ejemplo de crash del proceso “cpp_cp_svr” sobre una ESP en un Cisco ASR
1002, el mensaje que podría aparecer por consola es el siguiente:

Jan 24 23:37:06.644 JST: %PMAN-3-PROCHOLDDOWN: F0: pman.sh: The process cpp_cp_svr has been
helddown (rc 134)
Jan 24 23:37:06.727 JST: %PMAN-0-PROCFAILCRIT: F0: pvp.sh: A critical processcpp_cp_svr has
failed (rc 134)
Jan 24 23:37:11.539 JST: %ASR1000_OIR-6-OFFLINECARD: Card (fp) offline in slot F0

El fichero de coredump en un ASR1002 estaria en la bootflash:core/.

Router#dir bootflash:core
Directory of bootflash:/core/

1032194 -rw- 38255956 Jan 24 2009 23:37:06 +09:00 Router_ESP_0_cpp_cp_svr_4714.core.gz

También se puede buscar el fichero de tracelog del proceso que puede incluir información útil:

Router#dir bootflash:tracelogs/cpp_cp*
Directory of bootflash:tracelogs/

4456753 -rwx 24868 Jan 24 2009 23:37:15 +09:00 cpp_cp_F0-0.log.4714.20090124233714

March 10, 2015 Troubleshooting Cisco ASR1000 20


Company Confidential. A printed copy of this document is considered uncontrolled.
Más información sobre los mensajes del IOS-XE :
http://www.cisco.com/en/US/docs/routers/asr1000/system/messages/guide/asr1k_SMG.pdf

Cisco Quantum Flow Processor Microcode Crash


Cuando hay un crash del microcódigo de la QFP, se reinicia la ESP.

Para identificar este tipo de crashes, hay que encontraren la salida de consola el siguiente tipo de mensaje o
encontrar un fichero de core dump de cpp-mcplo-ucode:

Dec 17 05:50:26.417 JST: %IOSXE-3-PLATFORM: F0: cpp_cdm: CPP crashed, core file
/tmp/corelink/Router_ESP_0_cpp-mcplo-ucode_121708055026.core.gz
Dec 17 05:50:28.206 JST: %ASR1000_OIR-6-OFFLINECARD:
Card (fp) offline in slot F0

Se puede encontrar el fichero de coredump en los ASR1002 en:

Router#dir bootflash:core
Directory of bootflash:core/

3719171 -rw- 1572864 Dec 17 2008 05:50:31 +09:00 Router_ESP_0_cpp-mcplo-


ucode_121708055026.core.gz

Linux Kernel Crash


En los ASR1000 como se ha comentado que hay un kernel de linux que corre en la RP, ESP y las tarjetas
madre SIP.

Cuando hay un crash del kernel, el módulo reinicia sin salida por consola de la información del crash. Sin
embargo una vez reiniciado se puede identificar si ha habido este tipo de crash porque debe aparecer un
fichero de core dump. El tamaño del fichero de core dump puede ser mayor de 100MBytes.

Router#dir harddisk:core
Directory of harddisk:/core/

393230 ---- 137389415 Dec 19 2008 01:19:40 +09:00 Router_RP_0_kernel_20081218161940.core

March 10, 2015 Troubleshooting Cisco ASR1000 21


Company Confidential. A printed copy of this document is considered uncontrolled.
ANEXO A – Actualización de software

Los routers de la gama ASR1000 se pueden actualizar usando un paquete de software consolidado,
que consiste en un único archivo. Otra alternativa es mediante subpaquetes, es decir varios ficheros
que permiten actualizar los diferentes componentes de manera independiente. Solo se recomienda
actualizar los routers de la gama ASR1000 usando el paquete de software consolidado y no con
subpaquetes.

A continuación se explicará los siguientes procedimientos de actualización de software, en estado


normal y desde rommon

- Procedimiento para actualizar el software IOS-XE


- Procedimiento para actualizar la versión de ROMmon
- Procedimiento de recuperación desde estado ROMmon.

Procedimiento para actualizar el software IOS-XE


Se explica el procedimiento usando protocolo TFTP que es el más comúnmente usado, de todos
modos, también se puede usar de una forma similar los protocolos ftp, http, https, scp, y rcp.

Paso 1.- Seleccionar la imagen de software Cisco IOS.


El primer paso es comprobar que la versión de software que se desea cargar en el router ASR
cumple los requisitos mínimos de memoria (DRAM y Flash), soporta las funcionalidades que
tiene configurado y también soporta los interfaces y módulos que tiene instalados el equipo.
También es importante verificar si con dicha versión de IOS-XE hay que actualizar la versión de
ROMMON del equipo. El router tiene que tener al menos la versión mínima de ROMMON
requerida según la versión instalada de IOS-XE
Table 19 Minimum ROMmon Release Supported by Each FRU
http://www.cisco.com/c/en/us/td/docs/routers/asr1000/release/notes/asr1k_rn_rel_notes/asr1k_rn_sy
s_req.html#96550

Paso 2.- Descargar la imagen de IOS a un servidor TFTP.


Si el equipo tiene acceso a la red de gestión, se puede alojar la versión en algún servidor de esta
red que tenga conectividad IP con el router y tenga un servidor TFTP. Si este no fuera el caso, se
necesitaría alojar la imagen de IOS en un portátil o PC con conectividad IP al router y que tenga
un software de servidor TFTP.

Paso 3.- Identificar el sistema de ficheros para copiar la imagen de IOS


La imagen de IOS la debemos copiar siempre en la bootflash:
Si el equipo dispone de disco duro harddisk: también podemos copiar la imagen ahí, es
recomendable por motivos de redundancia.

March 10, 2015 Troubleshooting Cisco ASR1000 22


Company Confidential. A printed copy of this document is considered uncontrolled.
ASR1002#show file system
File Systems:

Size(b) Free(b) Type Flags Prefixes


- - opaque rw system:
- - opaque rw tmpsys:
* 949506048 224755712 disk rw bootflash: flash:
39313059840 33416019968 disk rw harddisk:
- - opaque rw null:
- - opaque ro tar:
- - network rw tftp:
- - opaque wo syslog:
33554432 33546959 nvram rw nvram:
- - network rw rcp:
- - network rw ftp:
- - network rw http:
- - network rw scp:
- - network rw https:
- - opaque ro cns:
ASR1002#

Paso 4.- Preparación para la actualización de software.


Si hay espacio suficiente en la bootflash: o en el harddisk: se puede dejar la versión antigua y la
nueva, de este modo si hubiera un fallo al cargar la nueva versión y el router queda en modo
rommon, se podría arrancar con la versión anterior en poco tiempo.
También conviene hacer un backup de la configuración del router, por si al arrancar el router con la
nueva versión se modifica algún comando o recibimos algún mensaje de error. De este modo, se
puede comparar ambas configuraciones y saber en qué comandos difieren.

Paso 5.- Copiar la imagen de IOS XE al router ASR1000


Si el servidor TFTP está conectado localmente al router, se puede verificar que hay conectividad IP
con el servidor TFTP. Si el servidor TFTP es un servidor de gestión, hay filtros en la red que impiden
la conectividad ICMP, por lo que no es posible.
El comando para realizar la transferencia TFTP desde el servidor al router es el siguiente:

copy tftp://<ip-address>/<fichero-imagen-IOS-XE> bootflash:

Ejemplo:

ASR1002#copy tftp://10.10.10.41/asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin bootflash:


Destination filename [asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin]?
Accessing tftp://10.10.10.41/asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin...
Loading asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin from 10.10.10.41 (via
FastEthernet0/2/0):
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
[OK - 349430356 bytes]

March 10, 2015 Troubleshooting Cisco ASR1000 23


Company Confidential. A printed copy of this document is considered uncontrolled.
349430356 bytes copied in 785.844 secs (444656 bytes/sec)
ASR1002#

Nota.- Si falla la transferencia TFTP por timeout comprobar que la dirección IP origen para el protocolo TFTP es la loopback
de gestión (normalmente loopback 600). El comando asociado es: “ip tftp source-interface loopback600”.
Comprobar que hay conectividad IP con el servidor TFTP con origen la loopback600.

Paso 6.- Verificar la imagen de IOS XE

Verificar que la imagen esta descargada en la bootflash: con el comando “dir bootflash:”

ASR1002#dir bootflash:
Directory of bootflash:/

11 drwx 16384 Apr 4 2010 19:35:19 +00:00 lost+found


16 -rw- 377745 Dec 9 2010 16:30:28 +00:00 crashinfo_RP_00_00_20101209-163028-UTC
29441 drwx 4096 Apr 4 2010 19:37:11 +00:00 .installer
58881 drwx 4096 Dec 9 2010 17:30:35 +00:00 .prst_sync
44161 drwx 4096 Apr 4 2010 20:05:36 +00:00 .rollback_timer
15 -rw- 349430356 Apr 29 2014 16:18:24 +00:00 asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-
ext.bin

949506048 bytes total (548012032 bytes free)


ASR1002#

Verificar la integridad del fichero descargado.

ASR1002# verify /md5 bootflash:asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin


Verifying file integrity of bootflash:asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin
...........................................................................................
...........................................................................................
...........................................................................................
...........................................................................................
Done!
verify /md5 (bootflash:asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin) =
b949fffb51aff1a56147935462904d05
ASR1002#

Se puede comprobar que el checksum es el mismo que el publicado en la web de Cisco para dicha
imagen.
Paso 7.- Verificar el valor de “configuration register”
Se debe comprobar que el valor de config-register es 0x2102 en la última línea de la salida del
comando “show version”. Si tuviera un valor diferente habría que configurarlo al valor normal 0x2102.

ASR1002#configure terminal
Enter configuration commands, one per line. End with CNTL/Z.
ASR1002 (config)#config-register 0x2102
ASR1002 (config)#^Z

March 10, 2015 Troubleshooting Cisco ASR1000 24


Company Confidential. A printed copy of this document is considered uncontrolled.
Paso 8.- Verificar la variable de boot

Para seleccionar la imagen de IOS-XE con la que queremos arranque el router, debemos configurar el
comando:
boot system flash bootflash:<nombre_fichero_imagen>

En el comando, en el path se debe indicar el device, “bootflash:” o “harddisk:”, se puede cargar una imagen
que esté alojada en el disco duro  harddisk: (no todos los modelos tienen disco duro).

¡Ojo! no serían válidos los siguientes comandos:


Boot system flash flash: <nombre_fichero_imagen>
Boot system flash <nombre_fichero_imagen>

El término “flash” no se reconoce como dispositivo en el arranque.


Tras aplicar correctamente el comando, hay que guardar la configuración.
Si no se configura el comando (boot system …) especificando la versión de IOS-XE, el router al arrancar
intentará arrancar con cada uno de los ficheros que haya en la bootflash: por orden, del primero al último,
pudiendo darse el caso, que arranque con un fichero de imagen no deseado.

ASR1002(config)# boot system flash bootflash:asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin


ASR1002(config)#^Z
ASR1002#show run | i boot
boot-start-marker
boot system flash bootflash:asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin
boot-end-marker
ASR1002#
ASR1002#wr mem
Building configuration...
[OK]
ASR1002#show bootvar
BOOT variable = bootflash:asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin,12;
CONFIG_FILE variable does not exist
BOOTLDR variable does not exist
Configuration register is 0x2102

Standby not ready to show bootvar


ASR1002#

Paso 9.- Reiniciamos el router para cargar la nueva imagen de software.

ASR1002#reload
Proceed with reload? [confirm]

Paso 10.- Verificar la actualización del IOS XE

ASR1002#sh version

March 10, 2015 Troubleshooting Cisco ASR1000 25


Company Confidential. A printed copy of this document is considered uncontrolled.
Cisco IOS XE Software, Version 03.10.00.S - Extended Support Release
Cisco IOS Software, ASR1000 Software (PPC_LINUX_IOSD-ADVIPSERVICESK9-M), Version 15.3(3)S, RELEASE
SOFTWARE (fc1)
Technical Support: http://www.cisco.com/techsupport
Copyright (c) 1986-2013 by Cisco Systems, Inc.
Compiled Thu 25-Jul-13 17:24 by mcpre

Cisco IOS-XE software, Copyright (c) 2005-2013 by cisco Systems, Inc.


All rights reserved. Certain components of Cisco IOS-XE software are
licensed under the GNU General Public License ("GPL") Version 2.0. The
software code licensed under GPL Version 2.0 is free software that comes
with ABSOLUTELY NO WARRANTY. You can redistribute and/or modify such
GPL code under the terms of GPL Version 2.0. For more details, see the
documentation or "License Notice" file accompanying the IOS-XE software,
or the applicable URL provided on the flyer accompanying the IOS-XE
software.

ROM: IOS-XE ROMMON

ASR1002 uptime is 4 minutes


Uptime for this control processor is 7 minutes
System returned to ROM by reload at 10:08:06 UTC Wed Apr 30 2014
System image file is "bootflash:asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin"
Last reload reason: Reload Command

This product contains cryptographic features and is subject to United


States and local country laws governing import, export, transfer and
use. Delivery of Cisco cryptographic products does not imply
third-party authority to import, export, distribute or use encryption.
Importers, exporters, distributors and users are responsible for
compliance with U.S. and local country laws. By using this product you
agree to comply with applicable laws and regulations. If you are unable
to comply with U.S. and local laws, return this product immediately.

A summary of U.S. laws governing Cisco cryptographic products may be found at:
http://www.cisco.com/wwl/export/crypto/tool/stqrg.html

If you require further assistance please contact us by sending email to


[email protected].

cisco ASR1002 (RP1) processor with 646517K/6147K bytes of memory.


Processor board ID FOX1404HC3R
8 FastEthernet interfaces
10 Gigabit Ethernet interfaces
1 Ten Gigabit Ethernet interface
32768K bytes of non-volatile configuration memory.
2097152K bytes of physical memory.
942079K bytes of eUSB flash at bootflash:.
39004543K bytes of SATA hard disk at harddisk:.

Configuration register is 0x2102

ASR1002#

Nota (copiar imagen usando un USB): Las imágenes de IOS-XE ocupan muchos megabytes, por lo que la transferencia
TFTP puede durar bastante tiempo dependiendo del tipo de acceso. Si se tiene acceso local al equipo y un dispositivo de
almacenamiento USB, el procedimiento es similar al indicado, excepto en el punto 5, donde habrá que conectar el
dispositivo de almacenamiento USB a un puerto USB del chasis del ASR (usb0 ó usb1) y ejecutar el comando “ copy
usb<x>:<fichero-imagen-IOS-XE> bootflash:”

Nota (FPD):
En los ASR1000, el paquete de firmware para los FPD (Field Programmable Device) de las tarjetas SPA (Shared Port
Adapter), va incluido en la imagen de IOS-XE.

March 10, 2015 Troubleshooting Cisco ASR1000 26


Company Confidential. A printed copy of this document is considered uncontrolled.
Hay que tener en cuenta que el comando “upgrade fpd auto” está incluido en la configuración por defecto del equipo,
por lo que al arrancar el equipo o al insertar una tarjeta SPA se comprueba la versión mínima de FPD necesaria para
dicha versión de IOS y se procede a actualizar el firmware si fuera necesario.
El comando “show hw-module all fpd” nos permite listar la versión de FPD cargada y la mínima requerida para cada
tarjeta SPA.
También es útil el comando “show upgrade fpd package default” para listar las tarjetas SPA soportadas y las versiones
mínimas de FPD requeridas por la versión actual de IOS del equipo.

Procedimiento para actualizar la versión de ROMmon


En las operaciones de upgrade de IOS XE es un factor crítico que la release de ROMMON que tiene el equipo reúna los
requerimientos de dicha IOS así como los FRUs que contiene el ASR1K.

Ver ROMMON Release Requirements para conocer la release mínima de ROMMON soportada

http://www.cisco.com/c/en/us/td/docs/routers/asr1000/release/notes/asr1k_rn_rel_notes/asr1k_rn_sys_req.html#96
550

Hay que seguir el procedimiento de upgrade descrito en “ROMmon Upgrade Guide” y que se resumen abajo:
http://www.cisco.com/c/en/us/td/docs/routers/asr1000/rommon/rommon.html

1. Se copia el fichero de la versión de ROMmon a la bootflash:


2. Se ejecuta el comando “upgrade rom-monitor filename bootflash:<nombre_fichero> all”
3. Se reinicia el router
ASR1000#copy ftp://asr:[email protected]/asr1000-rommon.152-1r.S.pkg bootflash:
Accessing ftp://*****:*****@223.255.254.234/asr1000-rommon.152-1r.S.pkg... Loading asr1000-rommon.152-
1r.S.pkg !!!!! [OK - 1253680/4096 bytes]
1253680 bytes copied in 0.716 secs (1750950 bytes/sec)

ASR1000#upgrade rom-monitor filename bootflash:asr1000-rommon.152-1r.S.pkg all


Chassis model ASR1001 has a single rom-monitor.
Upgrade rom-monitor
Target copying rom-monitor image file File /tmp/rommon_upgrade/latest.bin is a FIPS ROMMON image
65536+0 records in 65536+0 records out 65536+0 records in 65536+0 records out Checking upgrade
image... 1114112+0 records in 2176+0 records out Upgrade image MD5 signature is
fe18056d332dced800d0632a0f629675 65536+0 records in 65536+0 records out 65536+0 records in 65536+0
records out 65536+0 records in 65536+0 records out Burning upgrade partition... 1114112+0 records in
1114112+0 records out
Checking upgrade partition... 1114112+0 records in 1114112+0 records out Upgrade flash partition MD5
signature is fe18056d332dced800d0632a0f629675 ROMMON upgrade complete.
To make the new ROMMON permanent, you must restart the RP
ASR1000# reload

Tras reiniciar el router debe arrancar normalmente suponiendo que está configurado autoboot (config-register 0x2102).
Si arrancara en modo ROMmon, revisar el siguiente apartado para ver cómo realizar boot de una imagen de IOS XE.

March 10, 2015 Troubleshooting Cisco ASR1000 27


Company Confidential. A printed copy of this document is considered uncontrolled.
Procedimiento de recuperación desde estado ROMmon
El router en el proceso de arranque busca el fichero de la imagen que se indique en la variable de boot, si la
variable está vacía entonces inicia el autoboot, busca en el dispositivo por defecto que es la bootflash: , una
imagen válida, probando fichero a fichero hasta que lo encuentre. Si no lo encuentra entonces entra en
modo ROMmon.
Aunque haya una imagen válida en el disco duro harddisk: , si no se indica en la variable de boot el path, el
router no arrancará con dicha imagen. El router no realiza un autoboot en el harddisk, solo en la bootflash:
Tambien el router puede ir a estado ROMmon por tratar de arrancar con una imagen corrupta y por tanto no
válida.
Los ASR1000 no tienen imagen de boot helper, pero todo lo necesario esta en modo ROMmon.
A continuación se describen dos procedimientos que pueden ayudar a recuperar el equipo desde el modo
ROMmon al modo operacional IOS.
La imagen de IOS XE del ASR1000 puede ser booted desde:
1. Bootflash (soportado en todos los chassis/RP - De modo que es la mejor opción de boot)
2. Harddisk
3. USB
4. TFTP

A.- Procedimiento cuando hay una imagen de IOS XE válida en algún dispositivo de memoria (bootflash:, harddisk: o
USB)

1.-Verificar si hay una imagen en alguno de los dispositivos de almacenamiento conectados al router.
Ejecutamos el comando “dev” y luego un “dir” en cada uno de los devices, para listar los ficheros. Si
encontramos alguna imagen ejecutamos el siguiente comando para arrancar con dicha imagen.
“boot <nombre_dispositivo>:<nombre_fichero_imagen>”

rommon 1 > dev


Devices in device table:
id name
bootflash: Internal flash drive
harddisk: Internal hard disk
usb0: External USB drive 0
usb1: External USB drive 1
rommon 2 >
rommon 3 > dir harddisk:
File System: EXT2/EXT3

11 16384 drwx------ lost+found


622593 65536 drwxrwxrwx tracelogs
3653633 4096 drwxr-xr-x core
12 349430356 -rw-r--r-- asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin
rommon 4 >
rommon 8 > boot harddisk:asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin
Located asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin
Image size 349430356 inode num 12, bks cnt 85311 blk size 8*512
###############################################################
###############################################################
###############################################################
###############################################################
###############################################################
Boot image size = 349430356 (0x14d3e254) bytes

March 10, 2015 Troubleshooting Cisco ASR1000 28


Company Confidential. A printed copy of this document is considered uncontrolled.
En el ejemplo, la imagen está en el harddisk pero la imagen también la podemos tener en un dispositivo
bootflash: o en un USB externo (el sistema de ficheros soportado es FAT16/FAT32) y conectarlo al router en
uno de los puertos USB que tiene. De esta forma podemos arrancar el router ejecutando el comando:
boot usb<x>:<nombre_fichero_imagen>

Hay que tener en cuenta que:


- El único USB soportado oficialmente es: MEMUSB-1024FT, los USB non-Cisco pueden acabar en un
crash del Kernel
- Una vez la imagen ha hecho boot desde el USB, no se puede retirar este USB, de otro modo el router
puede terminar con un crash del Kernel.
- La práctica correcta es usar el USB para copiar la imagen a la bootflash y después realizar el boot
desde la bootflash. Otra opción es, arrancar desde el usb, pero realizar los pasos 2,3, 4 y reiniciar de
nuevo para que arranque desde bootflash:

2.- En todos los casos, una vez arrancado el router, siempre copiaremos la imagen en la bootflash (si no
estuviera):

copy <nombre_dispositivo>:<nombre_fichero_imagen> bootflash:

3.- Se debe comprobar que el valor de config-register es 0x2102 en la última línea de la salida del comando
“show version”. Si tuviera un valor diferente habría que configurarlo al valor normal 0x2102.

ASR1002#configure terminal
Enter configuration commands, one per line. End with CNTL/Z.
ASR1002 (config)#config-register 0x2102
ASR1002 (config)#^Z

4.- Modificamos la variable boot añadiendo dicho path: y luego guardamos la configuración.

no boot system
boot system flash bootflash:<nombre_fichero_imagen>
wr mem

B.- Boot del IOS XE via TFTP desde ROMmon

1.- Conectar un host (pc/portátil) con un servidor TFTP al puerto de gestión “GigabitEthernet0”.
2.- Configurar las variables apropiadas en modo rommon para tener conectividad con el servidor TFTP:

rommon1>IP_ADDRESS=<direccion_ip>
rommon2>IP_SUBNET_MASK=<mascara_red>
rommon3>DEFAULT_GATEWAY=<direccion_ip_puerta_de_enlace>
rommon4>TFTP_SERVER=<direccion_ip_servidor_TFTP>
rommon5>TFTP_FILE=<nombre_fichero_de_imagen>
rommon6> set

March 10, 2015 Troubleshooting Cisco ASR1000 29


Company Confidential. A printed copy of this document is considered uncontrolled.
Ejemplo:
rommon1>IP_ADDRESS=20.0.1.1
rommon2>IP_SUBNET_MASK=255.255.255.0
rommon3>DEFAULT_GATEWAY=20.0.1.100
rommon4>TFTP_SERVER=20.0.1.101
rommon5>TFTP_FILE=asr1000rp1-advipservicesk9.03.10.00.S.153-3.S-ext.bin
rommon6> set

3.- Ejecutar el commando boot para indicarle al router que transfiera la imagen a la DRAM para su ejecución.

rommon7>boot tftp:

4.- Una vez arrancado el equipo, se puede seguir el procedimiento establecido en este anexo para guardar la
imagen en la bootflash.

March 10, 2015 Troubleshooting Cisco ASR1000 30


Company Confidential. A printed copy of this document is considered uncontrolled.
ANEXO B – ERSPAN en ASR1K

Las capturas de tráfico son una herramienta muy útil de troubleshooting.


Para capturar tráfico con un ASR1K se puede usar la funcionalidad de ERSPAN (Encapsulated
Remote Switched Analyzer) que permite capturar el tráfico de un interfaz y enviarlo a otro
interfaz local o remoto (de otro ASR1K) donde haya un sniffer conectado.

Los ASR1K no soportan la funcionalidad de SPAN (Switched Port Analyzer) o RSPAN (Remote
Switched Port Analyzer), pero si la funcionalidad de ERSPAN (Encapsulated Remote Switched
Analyzer) con el cual se consiguen resultados similares.
Para poder monitorizar los paquetes a través de un interface usando ERSPAN, el usuario tiene
que crear una sesión ERSPAN-source y otra sesión ERSPAN-destination. Sin restricciones sobre
si estas dos sesiones se crean en un mismo ASR1000 o no.
Si las dos sesiones se crean en dos dispositivos diferentes, el tráfico a monitorizar será enviado
desde la fuente al destino mediante ERSPAN (tráfico encapsulado en GRE), si las dos sesiones
están creadas en el mismo ASR1000, el flujo de datos fluye en el interior del mismo router.

Configuración de ERSPAN cuando la fuente y destino son en diferentes ASR1K:


Configuración de ERSPAN source session

!
interface Gi1/1/<n>
description "Puerto de origen"
ip address <ip address_source_port>

inter loopback0
ip address <ip_address_origen> <mascara>
!
monitor session 1 type erspan-source
source interface Gi1/0/n
destination
erspan-id <id#>
ip address <ip_address_X>
origin ip address <ip_address_origen>
!

March 10, 2015 Troubleshooting Cisco ASR1000 31


Company Confidential. A printed copy of this document is considered uncontrolled.
Configuración de ERSPAN destination session
!
inter loopback0
ip address <ip_address_X> <mascara>
!
monitor session 2 type erspan-destination
destination interface Gi1/1/<m>
source
erspan-id <id#>
ip address <ip_address_X>
!
interface Gi1/1/<m>
description "Puerto de destino"
plim ethernet vlan filter disable
!

NOTA: Para versiones de IOS XE RLS5 y posteriores, añadir el CLI "plim ethernet vlan filter
disable" en el interface de destino
Si las dos sesiones están creadas en el mismo ASR1000, el flujo de datos fluye en el interior del
mismo router. En este caso donde se quiere configurar ERSPAN en el mismo ASR1000 de modo
que este funcione de forma similar al SPAN local, es decir que el flujo de datos fluya en el
interior del mismo router, hay que asegurarse de que:
 Tanto la sesión de origen como la sesión de destino tienen el mismo ERSPAN-id
 Se utiliza una dirección IPv4 localmente configurada, usada como "ip address" / "orig ip address" en la
sesión … source y la "ip address" en la sesión … destination

En este caso la configuración de ERSPAN seria:


Configuración de ERSPAN en un ASR1000 como local SPAN

!
int loopback0
ip address <ip_address_X> <mascara>
!
monitor session 1 type erspan-source
source interface GigabitEthernet0/0/n
destination
erspan-id <id#>
ip address <ip_address_X>
origin ip address <ip_address_X>
!
monitor session 2 type erspan-destination
destination interface GigabitEthernet0/0/m
source
erspan-id <id#>
ip address <ip_address_X>
!

March 10, 2015 Troubleshooting Cisco ASR1000 32


Company Confidential. A printed copy of this document is considered uncontrolled.
CISCO CONFIDENTIAL INFORMATION
THIS DOCUMENT CONTAINS VALUABLE TRADE SECRETS AND CONFIDENTIAL INFORMATION OF CISCO AND IT’S SUPPLIERS, AND
SHALL NOT BE DISCLOSED TO ANY PERSON, ORGANIZATION, OR ENTITY UNLESS SUCH DISCLOSURE IS SUBJECT TO THE PROVISIONS
OF A WRITTEN NON-DISCLOSURE AND PROPRIETARY RIGHTS AGREEMENT OR INTELLECTUAL PROPERTY LICENSE AGREEMENT
APPROVED BY CISCO THE DISTRIBUTION OF THIS DOCUMENT DOES NOT GRANT ANY LICENSE IN OR RIGHTS, IN WHOLE OR IN PART,
TO THE CONTENT, THE PRODUCT(S), TECHNOLOGY OF INTELLECTUAL PROPERTY DESCRIBED HEREIN.
Copyright  2004, Cisco
All rights reserved. . Cisco, Cisco, and the Cisco logo are registered trademarks or trademarks of Cisco and/or its affiliates in the U.S. and certain other countries
CISCO CONFIDENTIAL INFORMATION

March 10, 2015 Troubleshooting Cisco ASR1000 33


Company Confidential. A printed copy of this document is considered uncontrolled.
Referencias

 Advanced Services team and customer experience

 Cisco internal engineering documents, web pages, search tools and forums

 Release notes - http://www.cisco.com/univercd/home/home.htm

 Field notices -
(external) http://www.cisco.com/warp/public/tech_tips/index/fn.html
(internal) http://wwwin.cisco.com/cgi-bin/it/tsit/FieldNotice/sp_menu.cgi

 Security alerts - http://www.cisco.com/warp/public/707/advisory.html

 Software advisor tool - http://www.cisco.com/cgi-bin/Support/CompNav/Index.pl

 Cisco bug toolkit - http://www.cisco.com/cgi-bin/Support/Bugtool/launch_bugtool.pl

 Cisco Feature Navigator - http://www.cisco.com/support/FeatureNav/resources/

 Cisco IOS software Center - http://www.cisco.com/kobayashi/sw-center/sw-ios.shtml

 Cisco IOS software roadmap – http://www.cisco.com/warp/customer/620/roadmap.shtml

 Cisco IOS Reference Guide - http://www.cisco.com/warp/customer/620/1.html

March 10, 2015 Troubleshooting ASR1002 34


Company Confidential. A printed copy of this document is considered uncontrolled.
Glosario

Please refer to the CCO Internetworking Terms and Acronyms Guide at


http://www.cisco.com/univercd/cc/td/doc/cisintwk/ita/index.htm for additional terms.

March 10, 2015 Troubleshooting Cisco ASR1000 35


Company Confidential. A printed copy of this document is considered uncontrolled.
Control del documento

Autor: Carlos Tejeiro Orellana


Cisco Systems Advanced Services
Cambios:

Historia
Version No. Fecha Estado Razón del cambio
1 20-Oct-2011 Released Primera version del documento

2 13-May-2014 Released Se añade el Anexo A y se hace referencia a los nuevos


modelos validados ASR1001 y 1002-X.

3 03-Sep-2014 Released Se añade procedimiento para actualizar la versión de


ROMmon

4 20-Feb-2015 Released Se añade el Anexo B

Revisiones
Reviewer’s Details Version No. Fecha
Juan Ortega

Este documento se mantendrá bajo control de revisión

March 10, 2015 Troubleshooting Cisco ASR1000 36


Company Confidential. A printed copy of this document is considered uncontrolled.

También podría gustarte