Evaluación Del Aprendizaje: Una Guía Práctica para Profesores
Evaluación Del Aprendizaje: Una Guía Práctica para Profesores
Marzo, 2010
U no de los obstáculos que con mayor frecuencia tienen las
instituciones educativas para realizar un trabajo sistemático de
evaluación del aprendizaje, consiste en la falta de una cultura de
la evaluación entre los actores del proceso educativo -alumnos,
profesores y directivos-, lo que conduce a prácticas evaluativas
que nos son congruentes con los contenidos, enfoques y propósitos
del modelo educativo, o bien son insuficientes o superficiales.
Tales prácticas suceden en gran medida por la carencia de bases
teóricas y técnicas en algunas de las fases del proceso evaluativo:
la planeación, el diseño y desarrollo de instrumentos de
evaluación; el análisis de la información, o la interpretación y uso
de los resultados. Estas carencias se reflejan en la emisión de
juicios de valor subjetivos, superficiales o sesgados que impactan
de manera negativa en los estudiantes. Generalmente estas
prácticas no resultan útiles para la toma de decisiones que tienen
que llevar a cabo los diferentes actores en los distintos momentos
del proceso educativo.
1
1. Introducción a la Evaluación del Aprendizaje
Para iniciar haremos una breve reflexión acerca del concepto de evaluación
educativa. Muchos son los autores que han ido definiendo el concepto a lo largo de la
historia, la evolución del concepto ha permitido su construcción, integrando los nuevos
enfoques o definiciones que a su vez se han ido construyendo a partir de las diferencias,
carencias y perspectivas paradigmáticas en ocasiones contrapuestas, conduciendo a la
elaboración de concepciones evaluativas diferentes a lo largo de la historia. No es el
objetivo del presente hacer una revisión exhaustiva de este proceso, para ello sugiero
revisar la reseña realizada por Ramos, Perales y Pérez (2009).
2
evaluación educativa es el consenso intersubjetivo que pueden manifestar expertos
en educación acerca de la calidad de los fenómenos educativos evaluados.
…orientado a la toma de decisiones; es la base necesaria para poder tomar
decisiones –de cualquier tipo, sean de mejora (evaluación formativa) o de rendición
de cuentas (evaluación sumativa)‐.
…y la mejora; sólo puede entenderse que una evaluación es de calidad, si permite
identificar no sólo los elementos que requieren mejora, sino el cómo dinamizar el
proceso de mejora o innovación, es decir, el carácter formativo se identifica como
un componente fundamental para cualquier evaluación.
3
Para el propósito de este trabajo, nos ubicamos en la evaluación de personas, de
manera específica en la evaluación del aprendizaje de alumnos o estudiantes, esta
primera definición nos brinda un primer paso para establecer la planeación del proceso
evaluativo ya que orienta en gran medida la metodología de trabajo. Ahora bien se
requiere contestar otras preguntas tales como ¿qué evaluar?, es decir qué aspectos o
rasgos del aprendizaje vamos evaluar; el ¿para qué?, es decir, la finalidad y con ello el uso
que se hará de los resultados de la evaluación. La definición del objetivo de la evaluación
guiará otras fases de la planeación y desarrollo del proceso, tales como el diseño y
desarrollo de técnicas e instrumentos de obtención y análisis de la información, así como
el establecimiento de un marco que permita interpretar esta información, para dar
sustento a la emisión de juicios y por lo tanto a la toma de decisiones más adecuadas.
4
nomotética, cuyo referente es externo, puede ser referida a una norma la cual depende
de la población o grupo del cual forma parte el sujeto evaluado, o bien a un criterio
establecido en algún programa educativo formal. Cuando la referencia es normativa, nos
permite la comparación del rendimiento de cada alumno con respecto al logrado por el
grupo, entonces es común escuchar que tal alumno tiene un rendimiento superior al
rendimiento promedio de su grupo; o bien que un grupo específico está una desviación
estándar por debajo del promedio nacional o estatal, ya que generalmente la norma
representa la media de la población evaluada y los puntajes de cada persona o grupo
evaluado pueden distribuirse en torno a esta media en una distribución normal. Si la
referencia empleada es criterial, la interpretación es independiente del nivel logrado por
el grupo o población a la cual pertenece el alumno o persona evaluada, en este caso el
interés se centra en determinar el nivel de competencia del alumno con respecto a uno o
más estándares previamente fijados.
Nomotética Normativa
Por su normotipo Criterial
Ideográfica
Diagnóstica
Por su funcionalidad Formativa
Sumativa
Inicial
Por su temporalidad Procesual
Final
Autoevaluación
Por sus agentes Coevaluación
Heteroevaluación
5
niveles mínimos de condición física presentados para poder iniciar el programa. En cada
caso será necesario establecer un proceso fino de evaluación diagnóstica para determinar
los niveles actuales de rendimiento y con base en ellos establecer un plan de intervención
acorde a las capacidades de cada alumno para después en un proceso de evaluación
continua comparar el rendimiento del alumno longitudinalmente verificando sus avances
sin comparar su desempeño contra criterios externos a él mismo.
6
Principios de interpretación de esta información mediante marcos teóricos
apropiados
Estrategias de retroalimentación oportuna a los alumnos
Pasos a seguir en la adaptación de estos procesos de aprendizaje
En relación con la tipología en función de los agentes, Casanova (2007) refiere que
la autoevaluación se produce cuando el sujeto evalúa sus propias actuaciones, es un tipo
de evaluación que toda persona realiza a lo largo de su vida; en el caso que nos ocupa, es
de suma importancia que el alumno realice de manera continua ejercicios de valoración
de su aprendizaje, de manera que le sea posible identificar aspectos que debe mejorar. En
la medida en que un alumno logre contrastar sus avances contra estándares de actuación
establecidos, podrá identificar áreas de mejora, con lo cual estará en condiciones de
regular su aprendizaje hacia el logro de competencias útiles para su desarrollo social y
profesional.
7
después de una serie de actividades didácticas, los participantes tanto alumnos como el
profesor evalúen ciertos aspectos que consideren importantes de tal actuación conjunta.
Generalmente tras un trabajo en equipos, de manera natural, cada uno valora lo que le ha
parecido más interesante de los otros, por ejemplo se puede valorar si las actividades
resultaron atractivas, si el contenido del trabajo realizado es pertinente, si el nivel de
colaboración facilitó el logro de los objetivos, etc.; es muy importante en la conducción de
estos procesos de coevaluación pedir a los alumnos que se centren en la valoración tanto
de los aspectos positivos o que ellos consideren como los más destacados, como en
aquellos que es necesario trabajar más para mejorar la calidad del trabajo desarrollado en
conjunto.
8
han ido abriendo los marcos de referencia en que sustentar el análisis de las diversas
unidades objeto de evaluación.
9
estándares deben ser difundidos entre los estudiantes, de manera que el proceso de
evaluación sea transparente, justo y equitativo, sólo así podrá ser útil para apoyar la toma
de decisiones de todos los usuarios: los propios estudiantes, los profesores y académicos
tanto a nivel individual como colegiado, y para aquellos que asumen actividades de
dirección en los centros escolares, lo cual en suma representa “la creación de una cultura
de la evaluación”.
10
2. Planeación de la Evaluación del Aprendizaje
11
asignaturas. Una expresión adecuada del enunciado de cada indicador de aprendizaje,
debe comprender tres elementos: a) la conducta o ejecución específica que debe exhibir
el estudiante, la cual se relaciona directamente con el proceso o resultado de aprendizaje
a inferir; b) las condiciones en que deberá manifestarse tal conducta o ejecución, y c) el
estándar o norma de ejecución aceptable.
Para esta parte del diseño se recomienda una taxonomía de objetivos educativos
acorde con los descubrimientos más recientes en materia de procesos implicados en el
aprendizaje. Para tal propósito se realizó una revisión y análisis de diversas taxonomías en
la literatura especializada. Entre las más conocidas se encuentran las publicadas por
Bloom (1956), Gagné (1972), Tuckman (1979), Merril (1994), Haladyna (1997), Marzano
(2000, 2006); aunque existen otros enfoques diferentes o complementarios. Como
resultado de tal revisión, para esta guía práctica propongo utilizar la taxonomía de
Marzano (2000, 2006) la cual ha resultado ser útil y congruente con los modelos
educativos actuales basados en competencias tanto de nivel medio superior como en
diversas carreras de educación superior.
12
cognoscitivo, otra crítica relacionada con este constructo, es acerca de la estructura
jerárquica que presupone que aquellos niveles subordinados involucran menor nivel de
complejidad de los procesos cognoscitivos inherentes. Ambas características de la
taxonomía no se pueden sostener desde los descubrimientos actuales de investigación
básica de los procesos cognoscitivos en el hombre (Furst, 1994).
13
nivel de control de los procesos involucrados. En términos del flujo de información, el
procesamiento de la información siempre inicia con el sistema de autoeficacia, prosigue
con el sistema metacognitivo y finaliza con el sistema cognoscitivo, es decir que los tres
sistemas representan una organización jerárquica en términos del flujo de la información.
Además de que el estatus de los diversos factores dentro de un sistema controla el estatus
de los diferentes factores dentro de los demás sistemas.
Adicionalmente estos tres sistemas también tienen una jerarquía relativa al nivel
de conciencia requerida o recursos de procesamiento conciente para controlar la
ejecución. Es decir que en el sistema de autoeficacia los procesos para establecer la
relevancia, eficacia y motivación hacia la ejecución de una tarea, representan un nivel de
introspección y pensamiento conciente mayor que aquel involucrado en los procesos
metacognitivos de establecimiento de metas y monitoreo conciente. Finalmente en el
sistema cognoscitivo, los procesos de utilización de la información son los que requieren
mayor grado de pensamiento conciente en su ejecución, seguidos de los de análisis,
comprensión y por último los de recuperación que pueden darse de manera automática.
14
Tabla 1. Taxonomía de Objetivos Educativos
Los tres sistemas de pensamiento
Descripción de los objetivos
Nivel 6: Self‐System
Examinando relevancia Identifica la importancia del conocimiento y el razonamiento que subyace a su
percepción
Examinando eficacia Identifica las creencias acerca de su habilidad para mejorar su competencia o
comprensión del conocimiento y el razonamiento que subyace a esta percepción
Examinando respuesta Identifica respuestas emocionales al conocimiento y las razones de estas respuestas
emocional
Examinando motivación Identifica su nivel de motivación para mejorar su competencia o comprensión
relativa al conocimiento y las razones de este nivel de motivación
Nivel 5: Sistema de Metacognición
Especificación de metas Establece un plan de metas relativas al conocimiento
Monitoreo de procesos Monitorea la ejecución del conocimiento
Monitoreo de Claridad Determina el grado en el cual tiene claridad acerca del conocimiento
Monitoreo de exactitud Determina el grado de exactitud del conocimiento
Sistema Cognoscitivo
15
En esta propuesta taxonómica, a diferencia de la propuesta publicada por Bloom,
Marzano divide de manera clara el dominio del conocimiento y las operaciones mentales,
al postular tres sistemas de pensamiento que operan con tres dominios de conocimiento.
En la tabla 2, se presenta una síntesis de tales dominios del conocimiento con sus
componentes, una descripción para cada componente y un ejemplo. Es importante
destacar que dentro de cada dominio, existe un orden jerárquico que tiene que ver con la
complejidad de cada componente.
16
Dominio de procedimientos mentales
Componentes Descripción Ejemplos
Reglas simples Es el tipo más simple, consiste de El procedimiento para realizar una
Habilidades una producción “si (una situación X)‐ resta entre dos números
entonces ejecuta la acción Y)” y se naturales.
emplean en los pasos de algún
procedimiento
Algoritmos Procedimientos mentales que Obtener la media aritmética o la
normalmente no presentan variantes varianza de un grupo de datos.
en su aplicación, tienen resultados
específicos y un número específico
de pasos.
Tácticas Consisten en la producción de un Interpretación de un gráfico que
patrón general en el cual se presenta una función entre
incorporan reglas generales, no hay variables.
un orden o número de pasos rígido.
Procesos Procedimientos Técnicamente se refieren a Elaborar un plan de
macro procedimientos más complejos con mercadotecnia de algún producto
varios subcomponentes y que o servicio.
requieren alguna forma de
administración y control.
Dominio de procedimientos psicomotores
Así los procesos mentales que subyacen a los sistemas de pensamiento interactúan
de diversas maneras con los tres dominios de conocimientos, los cuales pueden
clasificarse en tres categorías generales: a) el dominio de la información ‐que se refiere al
conocimiento declarativo‐; y aquel que se conoce como conocimiento procedimental: b)
el dominio de procedimientos mentales y c) el de los procedimientos psicomotores. Dado
que estos tres tipos de conocimiento son muy diferentes, resulta conveniente pensar en
ellos como dominios sobre los que actúan los tres sistemas del pensamiento.
Ejemplos:
17
Ejemplo 1. Tabla de especificaciones para evaluar habilidades lectoras
Competencia para Evidencia necesaria para verificar que se Niveles de 1.Recuperación
la comunicación desarrolló la competencia a evaluar. Se deben complejidad 2. Comprensión
escrita. enunciar tantos indicadores como el grupo sugeridos 3. Análisis
colegiado determine que es suficiente. 4. Utilización del
conocimiento
5. Metacognición
6. Autoeficacia
Bloques o rasgos de Indicadores de aprendizaje 1 2 3 4 5 6 Dominio Ponderación
competencias
Comprensión Identifica las ideas centrales de diversos tipos de X S. Causa‐ 50%
lectora de textos textos efecto
informativos, Identifica el propósito de diversos tipos de X Episodio
científicos y textos
literarios tanto Diferencia los propósitos de diversos tipos de X Generaliz
continuos como texto. .
discontinuos. Relaciona ciertas ideas contenidas en el texto X Proced.
para obtener información que le permite macro
comprobar hipótesis.
Elabora inferencias a partir de la comparación X Proced.
de distintas fuentes. macro
Reconoce sus aciertos y sus fallas en la X Proced.
comprensión de diversos tipos de texto. macro
Reconoce sus intereses y gustos entre los X Proced.
diversos tipos de textos. macro
Precisión en el uso Selecciona las palabras adecuadas de acuerdo al X Tácticas 30%
del vocabulario y en contexto
el uso de las Identifica el significado de palabras y X S. Causa‐
estructuras expresiones a partir del contexto efecto
lingüísticas en la Aplica las metáforas de manera adecuada y X Proced.
comunicación acorde al contexto en diversas situaciones. macro
escrita. Aplica adecuadamente las reglas de X Algoritm.
concordancia entre adjetivo y sustantivo y entre
verbo y sustantivo
Aplica los tiempos verbales correctamente de X Algoritm.
acuerdo con el mensaje a comunicar
Detecta sus errores gramaticales y semánticos X Proced.
en sus escritos. macro
Redacción de textos Completa oraciones que emiten un mensaje X S. Causa‐ 20%
informativos y claro y específico. efecto
científicos. Diferencia oraciones primarias y secundarias de X S. Causa‐
un párrafo a partir de la intención comunicativa. efecto
Establece nexos entre los párrafos de un texto X S. de
con una intención comunicativa clara y explícita. tiempo
Jerarquiza en un orden lógico los elementos a X Proced.
comunicar (plan de redacción) macro
Reconoce y corrige fallas detectadas en sus X Proced. 100%
escritos. macro
18
Competencias en la Evidencia necesaria para verificar que se Niveles de complejidad 1.Recuperación
solución de desarrolló la competencia a evaluar. Se sugeridos 2. Comprensión
problemas mediante deben enunciar tantos indicadores como el 3. Análisis
el uso de las grupo colegiado determine que es 4. Utilización del
Matemáticas suficiente. conocimiento
5. Metacognición
6. Autoeficacia
Indicadores de aprendizaje 1 2 3 4 5 6 Dominio Ponderación
Bloques o rasgos de
competencias
Uso de las Aplica los algoritmos de las operaciones X Algoritmo 20%
operaciones básicas en la solución de ejercicios con
numéricas básicas. números enteros y fraccionarios.
Aplica la jerarquía de las operaciones X Algoritmo
básicas con enteros y fracciones.
Encuentra el mínimo común múltiplo y el X Reglas
máximo común divisor. simples
Identifica sus tipos de errores en la solución X Proced.
de operaciones con números enteros y macro
fracciones.
Uso de las Aplica las leyes de los exponentes en X Algoritmo 20%
operaciones con operaciones aritméticas.
potencias y raíces. Convierte de la notación de radical a la X Algoritmo
notación de potencia
Aplica las leyes de los radicales X Reglas
simples
Identifica y corrige sus errores en la X Algoritmo
aplicación de las leyes de los exponentes.
Reconoce sus capacidades para el uso de X Proced.
operaciones con potencias y raíces. macro
Traducción y Traduce los polinomios del lenguaje común X Tácticas 20%
operaciones con al algebraico y viceversa.
polinomios Establece en forma algebraica las relaciones X Tácticas
entre datos a través de polinomios.
Identifica términos semejantes en los X Reglas
polinomios simples
Identifica el tipo de errores que comete en X Tácticas
la traducción y establecimiento de
relaciones entre los polinomios.
Solución de Plantea mediante el lenguaje algebraico un X Tácticas 40%
problemas mediante problema para su solución.
el uso de las Establece relaciones entre variables de un X Proced.
matemáticas. problema mediante el lenguaje matemático. macro
Selecciona alternativas viables de solución a X Proced.
problemas planteados. macro
Soluciona problemas mediante el uso de las X Proced.
matemáticas. macro
Corrige las soluciones dadas a diversos X Proced.
problemas planteados mediante la macro
identificación del tipo de error que cometió.
Identifica sus intereses y gustos por las X Proced.
matemáticas y la solución de problemas. macro
19
3. Técnicas e instrumentos de recogida de
datos para la evaluación formativa
20
No se trata sólo de reunir mucha información, se requiere tener una estrategia que
permita integrar la información en un todo coherente que apoye la toma de decisiones
continua y oportuna para ir ajustando la intervención educativa hacia el logro de los
propósitos o desarrollo de las competencias. Para plasmar la información obtenida
mediante las técnicas que se apliquen, es muy importante contar con instrumentos o
registros adecuados a cada técnica para dar garantía de rigurosidad y sistematicidad.
Los instrumentos más comunes que sirven para observar de manera sistemática el
rendimiento y la ejecución de los estudiantes, así como aspectos o rasgos socio‐
personales y de actitudes, son las listas de control, también llamadas listas de cotejo y las
escalas de evaluación.
21
Las escalas de evaluación, son variantes de las listas de control en el sentido de su
finalidad y construcción; no obstante tienen la ventaja de que nos permiten formular
juicios sistemáticos acerca del grado en el que se presenta algún comportamiento o
característica relacionado con el desempeño a observar. Consisten en un conjunto de
características a juzgar y algún tipo de jerarquía, y el observador usa la escala para indicar
la cualidad, cantidad o nivel de rendimiento observado.
Los tres tipos más comunes de escalas son la numérica, la gráfica y la descriptiva;
aunque a veces se usan combinaciones de ellas. La escala descriptiva implica una
22
descripción verbal más completa de los puntos a lo largo del continuo. Presentamos a
continuación algunos ejemplos de escalas; las de la figura 4 son ejemplos de escalas
numéricas y representan grados o frecuencias; mientras que en la figura 5, presentamos
una escala gráfica y una descriptiva.
Para ser congruentes con los aspectos teóricos acerca de lo que significa la
evaluación del aprendizaje, los procedimientos de evaluación deben contribuir al
aprendizaje del estudiante y no sólo medirlo, adicionalmente el aprendizaje que se
requiere para el desarrollo de competencias profesionales tanto genéricas como
específicas a algun campo profesional de la educación superior es complejo y
multidimensional por lo que requiere valorarse a través de múltiples formas (Murphy,
2006) aspecto que además requiere de estrategias de triangulación para el análisis de la
información como se advierte en el paradigma propuesto por Casanova (2007)
representado en la figura 2.
23
La evaluación de competencias
24
La competencia no puede ser observada directamente en toda su complejidad
pero puede ser inferida a partir del desempeño, lo que lleva a pensar en los tipos de
actuaciones que permitan reunir evidencia suficiente para hacer juicios razonables acerca
de los logros de cada estudiante en relación con los resultados de aprendizaje pretendidos
y claramente especificados, lo cual ayuda a los propios estudiantes a la comprensión de lo
que se espera de ellos, a la vez que sirve para informar a otras personas interesadas sobre
el significado de una calificación determinada (Yániz y Villardón, 2006) .
El portafolios de evaluación
25
Lo cierto es que el uso del portafolios de evaluación ha probado ser una
herramienta muy valiosa de evaluación tanto sumativa como formativa, siempre y cuando
se incorpore de forma planificada en el proceso de enseñanza y aprendizaje; su uso tiene
muchas implicaciones psicopedagógicas ya que coadyuva tanto al fortalecimiento de las
capacidades cognoscitivas de los alumnos, como a las metacognitivas, es decir de
autorregulación de su proceso de aprendizaje. Esto es debido a que el portafolios
promueve que el estudiante, mediante la documentación de evidencias de su aprendizaje,
haga un seguimiento y reflexión de su propio desempeño, y con ello la evaluación
continua a lo largo del tiempo, brindando información útil para la identificación de sus
logros y fallas, con lo cual se facilita el ajuste progresivo de sus estrategias y hábitos de
estudio.
Atendiendo a la necesidad que se tiene de contar con enfoques mixtos que por un
lado favorezcan el valor estratégico de la evaluación formativa a la vez que se apoyen los
juicios de acreditación académica que todo sistema educativo formal demanda como
parte de su normativa, los portafolios han mostrado ser herramientas apropiadas en el
cumplimiento de ambas funciones; además de que resulta idóneo para la evaluación de
competencias, ya que permite integrar una gran variedad de tareas y actividades que
pongan en juego los conocimientos, habilidades y actitudes de los estudiantes tanto en
trabajo individual como de equipo.
26
de trabajo se revisa en su totalidad para evaluar sus elementos de manera continua. En
esta parte, para cumplir adecuadamente la función formativa, resulta muy importante la
retroalimentación del profesor para ayudar al alumno a detectar sus áreas de
oportunidad.
Esta propuesta en fases, resalta la importancia de que sean los propios estudiantes
quienes seleccionen lo que van a incorporar tanto al portafolios de evaluación como al de
presentación, con lo cual ilustran lo que ellos creen que es importante de su aprendizaje,
qué es lo que valoran y qué quieren mostrar a los demás. Estrategia que promueve el
desarrollo de habilidades metacognitivas, es decir habilidades para la reflexión acerca de
del propio pensamiento o conocimiento sobre nuestro aprendizaje, así como, sobre
nosotros mismos en cuanto aprendices, lo cual se facilita si para ello tenemos evidencias
tangibles de los avances y logros que se van documentando como parte del ejercicio de
integrar los portafolios. Esta ventaja además de que resulta especialmente relevante ya
que el estudiante se sensibiliza acerca de la importancia que tiene la documentación de
todas las evidencias de su desempeño, es una fuente de motivación y de afirmación de la
autoestima, aspectos que favorecen el logro de las competencias y desde luego la
verificación de que se alcanzaron los estándares establecidos.
27
los aprendizajes, de tal forma que sea posible la evaluación de trayectorias académicas y
por lo tanto del desarrollo de competencias obtenidas por los alumnos en dichas
trayectorias, lo que permite que existan más posibilidades de que los alumnos reciban
retroalimentación de manera oportuna para apoyar su toma de decisiones acerca de su
propio aprendizaje y que para los docentes constituya también una fuente de información
útil para reorientar su práctica, logrando que su intervención sea acorde y oportuna para
atender las necesidades y áreas de oportunidad detectadas por los alumnos.
La mejor forma de lograr tanto la orientación del alumno hacia el logro de tales
estándares, así como la de proporcionar una retroalimentación efectiva y oportuna es la
incorporación de rúbricas basadas en el establecimiento de estándares de ejecución y
niveles de desempeño esperados en las diversas actividades y tareas. Las rúbricas se
realizan una vez que se ha determinado la actividad o tarea a realizar para poner de
manifiesto el desempeño del estudiante, lo que a su vez constituye una forma de
garantizar que los profesores han logrado comunicar eficaz y oportunamente a los
alumnos lo que se espera de ellos para cada actividad o tarea programada (Stevens & Levi,
2005). También servirán como referente para la detección oportuna de profesores y
alumnos de aspectos logrados, así como de aspectos que requieren más trabajo para
cerrar las brechas entre el estándar y lo que cada alumno es capaz de desarrollar en cada
dimensión o criterio evaluado.
28
Debemos considerar estos componentes en la construcción de rúbricas, como se
puede observar las rúbricas representan una escala de evaluación descriptiva por lo que
podemos seguir los mismos pasos en su construcción. De manera similar a las listas de
cotejo y las escalas de evaluación, se requieren dos insumos para que tenga sentido su
construcción: Haber realizado la planeación en donde se especifiquen los resultados de
desempeño esperados y haber elegido aquellas actividades o tareas que pongan en juego
alguno o varios de estos resultados. Sólo así podremos definir las dimensiones o criterios
implicados. Ahora bien, para definir una escala que sea apropiada, necesitamos antes
determinar si el propósito de la evaluación es formativo, sumativo o mixto, generalmente
se usan entre 3 y 5 niveles de ejecución o desempeño si es que vamos utilizar la técnica de
observación de alguna ejecución o conducta en tiempo real; o de calidad en el caso en el
que lo que estemos evaluando sea un producto.
Finalmente para poder describir cada uno del niveles de ejecución por cada
dimensión o criterio, se requiere determinar el estándar o nivel de ejecución satisfactorio
o de competencia máxima a lograr por cada dimensión. A partir de haber definido éste
nivel se procede a describir, según sea el número de niveles de ejecución lo que
representa cada uno de ellos. Facilita la tarea, pensar inicialmente en los extremos, por lo
que después del nivel competente, se puede describir el nivel que implicaría que no se ha
cubierto el estándar; es decir que la ejecución de la persona no es satisfactoria, y después
pensar en él o los niveles intermedios y describir de manera cualitativa cada tipo de
desempeño o ejecución. Es muy importante que las diferencias entre los niveles estén
claramente delimitadas.
En términos de las principales ventajas que se han documentado del uso de las
rúbricas podemos destacar las siguientes:
29
4. Elaboración de reactivos y diseño de pruebas
objetivas para evaluación sumativa
Los estímulos de una prueba objetiva pueden ser de diferentes formas, sin
embargo diversas investigaciones y la propia evidencia empírica resultante de las
aplicaciones, demuestran que los reactivos de opción múltiple son los más estables y nos
sirven no solo para medir los resultados de conocimiento, sino de una gran variedad de
habilidades y capacidades intelectuales, por lo que resultan ser los de uso más común. Las
investigaciones también han demostrado que los estímulos de opción múltiple con cuatro
opciones son los mejores, siempre que se inicie con cinco opciones y se elimine la que
consistentemente tenga menor frecuencia de respuestas.
Algunas ventajas de las pruebas objetivas conformadas por reactivos de opción múltiple
son:
Los reactivos de opción múltiple se conforman por una base y cuatro o cinco
opciones de respuesta. La base es el enunciado que presenta la situación problema
planteada explícita o implícitamente en una pregunta, afirmación o enunciado
incompleto. Las opciones se entienden como las posibles respuestas, entre las cuales una
responde correctamente al enunciado o pregunta y las otras son respuestas incorrectas
llamadas distractores.
En cuanto a su escritura:
30
Evite errores gramaticales: de puntuación y de ortografía, así como abreviaturas.
Evite el uso complicado de gerundios, participios, artículos y preposiciones.
Emplee conceptos conocidos en lugar de sinónimos o vocabulario rebuscado.
Si los artículos o preposiciones que acompañan a los sustantivos son iguales para todas
las opciones, deben formar parte de la base.
Tome en cuenta el tiempo de lectura por reactivo, utilice la información necesaria
pero suficiente, para optimizar el tiempo.
Evite elaborar reactivos que evalúen sólo el sentido común del sustentante.
Tome en cuenta el nivel escolar y el de maduración de los examinados.
En cuanto al contenido:
Cada reactivo debe presentar, por sí mismo, un problema que al ser resuelto permita
demostrar que se ha alcanzado un resultado de aprendizaje determinado.
Incluya todos los elementos estrictamente necesarios para comprender el sentido
correcto de la pregunta, de tal manera que sin leer las opciones tenga sentido propio.
Los reactivos deben ser independientes unos de otros, sin que la información
contenida en uno sugiera la solución de otro.
Elabore un esquema de indagación y no sólo una palabra o frase.
Cuide que la redacción sea precisa y adecuada.
No sobrecargue el enunciado con material no pertinente por el deseo de seguir
enseñando.
Evite términos que confundan o den claves de la respuesta correcta.
Evite que una pregunta ayude a responder otra.
Redacte el enunciado en forma afirmativa siempre que sea posible.
31
La respuesta correcta debe resolver el problema satisfactoriamente.
La respuesta correcta debe ser incuestionable (Por lo menos dos personas deberán
revisar el reactivo para determinar si la solución correcta está clara)
Incluya distractores plausibles.
Deben tener concordancia gramatical con la base.
Deben guardar entre sí un equilibrio coherente en su aspecto gramatical: sintaxis,
género, número, tiempo verbal, etc.
Deben ser congruentes con el campo semántico de la base.
Evite repetir el material en cada opción e incluya el contenido común en la base.
No debe repetirse ninguna opción ni con sinónimos.
Deben presentar la misma extensión.
Evite que una opción ayude a elegir la opción correcta, por indicios gramaticales o
plausibilidad.
Preséntelas al azar, a menos que se requiera un orden cronológico o numérico.
Incluya en los distractores los errores más comunes de los estudiantes.
No utilice en las opciones: “todas la anteriores”, “ninguna de las anteriores”, “no sé”,
etc.
Evite las formas negativas (no, excepto) o las absolutas (nunca, siempre,
completamente, totalmente).
Utilice enunciados verosímiles pero incorrectos. Evite las frases inadecuadas, ridículas
o humorísticas.
No repita palabras del enunciado entre las opciones.
1. Simple
2. Jerarquización u ordenamiento
3. Selección de elementos de un listado
4. Relación de Columnas
5. Multireactivos (de cabecera o grupo de reactivos dependientes del contexto)
32
1. Formato Simple:
Formato:
BASE: Texto y / ó gráficas. Si el reactivo contiene esquemas, gráficas o imágenes, es importante que incluya
también las instrucciones para que se entienda con claridad lo que se tiene que hacer.
Ejemplos:
A) Avenida
B) Consecuencia
C) Revistero
D) Consulado
A) Paz
B) Célula
C) Fotografía
D) Situación
A) el
B) en
C) ha
D) su
A) situación
B) potenciar
C) consulado
D) además
33
2. Jerarquización u ordenamiento
Este tipo de reactivo es útil para evaluar entre otros aspectos: Identificación de
procesos, procedimientos y eventos históricos. El número de elementos a ordenar no
deber ser muy grande y se asignará un punto por el ordenamiento correcto y ninguno por
los demás.
Formato:
ENUNCIADO: ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐.
1. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
2. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
3. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Aquí se escribe la lista de elementos en desorden ‐
4. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
5. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
OPCIONES:
A) 3, 2, 4, 1, 5
B) 2, 4, 3, 5, 1
C) 5, 1, 2, 4, 3
D) 4, 3, 1, 2, 5
E) 2, 3, 4, 5, 1
Ejemplo:
Indica la secuencia en la que se ordenan cronológicamente los acontecimientos de la vida política de Benito
Juárez.
A) 2, 3, 1, 4
B) 1, 2, 4, 3
C) 2, 4, 3, 1
D) 4, 1, 3, 2
34
3. Selección de elementos de un listado:
Formato:
ENUNCIADO: ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐.
1. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
2. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ Aquí se escribe la lista de elementos mayor a la
3. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐ solicitada en la base.
4. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
5. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
OPCIONES:
A) 1, 2, 5
B) 2, 3, 5
C) 1, 2, 4 Se elige un número de elementos relacionados con un aspecto específico
D) 2, 4, 5
Ejemplo:
De los siguientes tipos de tejido presentados en la lista, elige los cinco tipos de tejido conectivo.
1. Muscular estriado
2. Óseo
3. Cartilaginoso
4. Conjuntivo denso
5. Nervioso
6. Adiposo
7. Sanguíneo
A) 1, 3, 4, 5, 7
B) 2, 3, 4, 6, 7
C) 1, 2, 3, 6, 7
D) 2, 3, 4, 5, 6
Es una forma modificada del estímulo de opción múltiple donde se enlistan en una
columna una serie de premisas y en la otra columna las respuestas posibles. No obstante,
a menos que todas las respuestas sirvan como opciones razonables para cada premisa, el
formato será inadecuado. Hay dos errores comunes al elaborar este tipo de reactivos:
35
• Tendencia a mantener la misma cantidad de premisas y respuestas;
• Incluir demasiados elementos en ambas listas.
Formato:
1.__________________________________ a) _______________________________
b) _______________________________
2. __________________________________ c) _______________________________
d) _______________________________
OPCIONES:
A) 1 a, b; 2 c, d
B) 1 a, c; 2 b, d
C) 1 b, c; 2 a, d
D) 1 c, d; 2 a, b
Ejemplo:
Relacione los movimientos con sus consecuencias.
Movimientos Consecuencias
A) 1 a, b; 2 c, d
B) 1 a, c; 2 b, d
C) 1 b, c; 2 a, d
D) 1 c, d; 2 a, b
36
5. Multirreactivos
Formato:
Instrucciones:‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
Situación o caso : ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐.
Base 1 1. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
Opciones:
A) ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
B) ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
C) ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
D) ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
Base 2 2. ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
Opciones:
A) ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
B) ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
C) ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
D) ‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐‐
.
Se aplicó un inventario de habilidades de estudio, en su versión autoreporte a 900 alumnos de las
licenciaturas de psicología, ingeniería y derecho. Los resultados indican que los alumnos de psicología
presentan una distribución negativamente sesgada en la escala de autorregulación; los alumnos de
ingeniería muestran un sesgo positivo en la escala de adquisición de la información y; los alumnos de
derecho muestran distribuciones con sesgo casi igual a cero en las escalas de autorregulación y
adquisición de información.
37
1. Forma de distribución que representa mejor las puntuaciones de los alumnos de Psicología
B)
A)
C D)
Razonamiento.
La respuesta correcta es A), ya que una curva con sesgo negativo extiende una de sus colas hacia los
puntajes bajos y acumula la mayoría de los datos en las puntuaciones altas. La opción C) es incorrecta por
que hace referencia a una curva aplanada o con baja curtosis, D) no es correcta por que hace referencia a
curvas con sesgos positivos y la opción B es incorrecta por que hace alusión a una curva son sesgo casi igual
a cero.
2. ¿De acuerdo con la distribución de frecuencias, ¿cómo es la mayoría de los alumnos de ingeniería?
Razonamiento.
La respuesta correcta es C) ya que una curva con sesgo positivo extiende una de sus colas hacia la
derecha y acumula la mayoría de los datos en las puntuaciones bajas . A) es incorrecta porque representa
una curva con sesgo negativo. B) es incorrecta porque representa una curva con sesgo igual a cero. D) es
incorrecta porque hace referencia a una curva aplanada o con baja curtosis.
3. ¿Cómo son los valores de las medidas de tendencia central de las puntuaciones de los alumnos de derecho en
cuanto a sus estrategias de adquisición de la información?
Razonamiento.
La opción correcta es D) ya que en una curva con sesgo casi igual a cero; la media , la mediana y la
moda se ubican en el mismo valor debajo de la curva. Las opciones A), B) y C) son incorrectas por que se
refieren a valores tomados de curvas con sesgo positivo y negativo.
38
4. ¿Cómo son la mayoría de los alumnos de derecho en sus estrategias de adquisición de información, en comparación con
los alumnos de ingeniería?
Razonamiento.
La opción correcta es A) ya que los alumnos de derecho al mostrar una distribución con sesgo casi igual
a cero poseen una distribución casi normal, mientras que los ingenieros tienen una distribución con sesgo
positivo. Las opciones A), B) y D) son incorrectas porque se refieren a situaciones en las cuales los alumnos
de derecho presentarían curvas con sesgo positivo o negativo.
Lee con atención la información del siguiente caso clínico y contesta las dos preguntas asociadas:
Se presenta a consulta un paciente de 12 años de edad. Durante la exploración se observa incisivo central
izquierdo de color pardo y el incisivo central derecho de coloración rojiza, ambos incisivos se muestran
sintomáticos; en la radiografía se observa tratamiento de conductos con muy poca estructura radicular en el
central izquierdo y en el incisivo central derecho una zona radio lúcida en forma de bombilla a nivel del tercio
medio del conducto. Al interrogarlo, el paciente refiere haber sufrido fractura de ambos incisivos superiores
centrales a la edad de siete años, con exposición de la pulpa vital en el central izquierdo, al cual se le realizó el
tratamiento de conductos de inmediato.
1. ¿Qué procedimiento se debió haber realizado para preservar más estructura radicular en el central
izquierdo?
A) Tratamientos de conductos
B) Apicogénesis
C) Observación y control
D) Implante endodóntico
Respuesta correcta: B)
Razonamiento.
A la edad de siete años el ápice los incisivos centrales no se encontraría totalmente formado, por lo
que el tratamiento inicial en caso del central izquierdo, con la pulpa dental expuesta debió ser la
apicogénesis o pulpotomía con hidróxido de calcio para permitir la formación radicular y el cierre apical, y
posteriormente –ya finalizado éste‐ efectuar el tratamiento de conductos.
A) Observación y control
B) Apicogénesis
C) Cirugía exploratoria
39
D) Tratamientos de conductos
Respuesta correcta D)
Razonamiento.
En el caso del central derecho el diagnóstico es muy claro, dado que se describen las características
clínicas y radiográficas que corresponden a una resorción radicular interna, en cuyo caso se requiere realizar
el tratamiento de conductos para evitar que ésta continúe.
40
Análisis y calibración de reactivos
Calibración de reactivos
Las preguntas tienen una dificultad relativa de acuerdo con el grupo y nivel en que
se apliquen. Una pregunta con una baja frecuencia de aciertos tiene una dificultad mayor
que otra con una frecuencia alta. La dificultad del reactivo es una información básica para
la base de datos del banco de reactivos y para el momento del diseño de la prueba, ya que
ésta debe estar balanceada en cuanto a la dificultad global y de cada una de sus áreas o
secciones.
41
P
GD= x100 ; 0 ≤ GD ≤ 100%
N
donde
P = Total de respuestas correctas de los sustentantes
N = Total de sustentantes (sólo respuestas válidas)
P(GS ) − P(GI )
PD = x100
N
donde:
P(GS) = Respuestas correctas del Grupo Superior
P(GI) = Respuestas correctas del Grupo Inferior
N = Total de sustentantes (sólo respuestas válidas)
PD
RD =
ND
42
Los reactivos con valores inferiores de RD deben revisarse personalmente por los
redactores de reactivos para verificar su redacción, la opción correcta, el comportamiento
de las opciones distractoras, etc.
Análisis de distractores
Para que un reactivo sea aceptable se deben verificar varias relaciones. Las
verificaciones a realizar corresponden al funcionamiento de un reactivo en la tabla de
contingencias, de acuerdo con las siguientes condiciones:
43
análisis de Rasch. En el Manual Técnico del CENEVAL (1999), se describen ambos
procedimientos.
Supongamos que tenemos un grupo de 40 estudiantes y les aplicamos una prueba objetiva
con reactivos de cinco opciones de respuesta. Después de calificar a los alumnos, los
ordenamos desde el que obtuvo el mayor porcentaje de respuestas correctas hasta el de
menor porcentaje, y dividimos al grupo por la mediana de manera que nos quedan dos
grupos iguales a los cuales designaremos como grupo superior y grupo inferior.
Opciones A B* C D E
Superior 20 1 12 4 2 1
Inferior 20 5 3 3 7 2
Total 40 6 15 7 9 3
* = respuesta correcta
El índice de dificultad de acuerdo con el modelo clásico, será la frecuencia de respuestas correctas
(15), entre el número total de alumnos (40) y se expresa en términos de porcentaje:
P
GD= x100 ; 0 ≤ GD ≤ 100%
N
donde
P = Total de respuestas correctas de los sustentantes
N = Total de sustentantes (sólo respuestas válidas)
En nuestro ejemplo:
El reactivo del ejemplo tiene un valor aceptable porque se encuentra entre el 20% y el 80%,
(aún con el criterio más estricto de 27% y 73% que exige Kalt), observamos además que se
trata de un reactivo difícil ya que lo contestaron menos del 50% de los alumnos.
PD = (12 − 3) / 40
= 9 / 40
= 0.225
x 100 = 22.50
ND = 0.3 x GD
es decir: 30% del GD
30% (37.5) = 11.25
44
La relación discriminativa:
RD = 22.5 / 11.25 = 2
2≥ 1
Análisis de la prueba
El concepto de validez
45
distintos tipos de validez. La validez es un concepto unitario y se refiere al grado en el cual
la evidencia acumulada apoya la interpretación de las medidas de la prueba de acuerdo
con el propósito propuesto.
Análisis de confiabilidad
Además de la validez, debemos demostrar que los exámenes que construimos son
confiables, es decir que podemos obtener la misma medición en diferentes condiciones.
Confiabilidad indica consistencia y precisión en la medición.
En algún caso la condición será el paso del tiempo (estabilidad temporal), es decir,
que sin que medie ningún aprendizaje extra, la persona que es medida en dos momentos
diferentes debe dar las mismas respuestas al instrumento. Por el dinamismo que
representa el proceso de aprendizaje el primer caso está expuesto a cambios en cortas
temporadas, midiéndose en muchas ocasiones la estabilidad del instrumento viciada con
el dinamismo de aprendizaje, por lo que no se sugiere realizar estudios de este tipo en
períodos que excedan los tres meses.
46
En el tercer caso la condición consiste en la relación que guardan cada una de las
partes del instrumento, con el resultado final que se obtiene (consistencia interna). Esto
implica la relación que guarda la calificación total del estudiante con las calificaciones
obtenidas en los temas y las preguntas que integran el instrumento.
N ⎛ ∑ GD(100 − GD) ⎞
ALFA = ⎜1 − ⎟⎟
N − 1 ⎜⎝ s2 N 2 ⎠
donde
N = número de reactivos
GD = Grado de dificultad de cada reactivo
s2 = varianza de puntuaciones de los sustentantes en porcentaje de aciertos
47
Mediante el software Kalt, se obtiene en cada corrida en forma rutinaria diversos
errores de medida (Tristán, 1999). En particular se tienen los siguientes errores estándar:
σ
a) error estándar para la media =
N
π
b) error estándar para la mediana = σ
2N
σ
c) error estándar para la desviación estándar =
2N
d) error estándar de medida = s 1 − α
s
e) error de medida de cada sujeto = t 0.975 ( M − 1)
M −1
en estas expresiones:
M = número de reactivos
N = número de sustentantes
s = desviación estándar de las dificultades de los reactivos
t0.975(M‐1)= valor de t de Student para 97.5% de confianza (5% en prueba estadística de 2
colas) para M reactivos (M‐1 grados de libertad)
α = confiabilidad (ALFA de Cronbach)
σ = desviación de las puntuaciones
π = 3.14159265359
48
longitudes de un examen o partes del mismo (Tristán, 1999). El tamaño de la muestra de
reactivos que debe aplicarse a los sustentantes tiene un error dado por la expresión:
s
error de medida ≥ t 0.975 ( M − 1)
M −1
donde:
M = número de reactivos
s = desviación estándar de las dificultades de los reactivos
t0.975(M‐1)= valor de t de Student para 97.5% de confianza (5% en prueba estadística de 2
colas) para M reactivos (M‐1 grados de libertad)
error % 20 15 12 10 5
Número mínimo de reactivos 12 19 27 39 131
49
Referencias Bibliográficas
Bloom, B. et al. (1990): Taxonomía de los objetivos de la educación: Clasificación de las metas
educacionales. Buenos Aires: El Ateneo.
Centro Nacional de Evaluación para la Educación Superior, (1999): Manual Técnico. México,
CENEVAL.
Danielson, C. y Leslie, A. (1999): Una Introducción al uso de portafolios en el aula. México. Fondo
de Cultura Económico.
Haladyna, T. M. (1997): Writing test items to evaluate higher order thinking. Boston: Allyn & Bacon.
50
Johns, J. (1992): “How professionals view portfolio assessment” en Reading Research and
Instruction, núm. 32, 1.
Leyva, Y. E., (2009): Fundamentos de la educación basada en competencias. (En prensa) México,
INITE.
Leyva, Y. E., y Jornet, J.M. (2006). El perfil del evaluador educativo. Boletín CENEVAL, nº 7 (Nov.),
págs. 2‐6. México: CENEVAL.
Marzano, R. J. (2000): Designing a New Taxonomy of Educational Objectives. Corwin Press, Inc. A
Sage Publications Company. California.
Marzano, R. J. (2006): Designing a New Taxonomy of Educational Objectives; 2nd. Ed., Corwin
Press, Inc. A Sage Publications Company, California.
Miras, M. y Solé, I. (1991): “La evaluación del aprendizaje y la evaluación en el proceso enseñanza‐
aprendizaje”. En Coll, C., et. al. (Comp.) Desarrollo Psicológico y Educación II. Psicología de
la Educación. España: Alianza Editorial.
Murphy, R. (2006): Evaluating new priorities for assessment in higher education. En C. Bryan y K.
Clegg (Eds.) Innovative Assessment in Higher Education. New York. Routledge.
51
Seda‐Santana, I. (2002): Evaluación por portafolios. Revista Latinoamericana de Estudios
Educativos. 1‐34.
Stevens, D. D. & Levi, A. J. (2005): Introduction to Rubrics: An Assessment Tool to Save Grading
Time, Convey Effective Feedback and Promote Student Learning. Canada, Stylus Publishing,
LLC.
Tenbrink, Terry (1997): Evaluación: Guía Práctica para Profesores. Madrid, Narcea S. A. de
Ediciones. 255‐273.
Tristán López, Agustín (1995): “Nuevas capacidades de Kalt para el dictamen de cuestionarios
objetivos”. Memoria del I Foro Nacional de Evaluación Educativa. México: CENEVAL.
Tristán, Agustín, (1996): “Formulación directa para calcular la Confiabilidad con Alfa de Cronbach”,
Cuadernos del CENEVAL 96‐1.
Tristán, Agustín (1999) Contribución al estudio del error de medida (parte 1). Notas sobre
Evaluación Criterial. CENEVAL / ICI.
Tristán, Agustín (1999) Contribución al estudio del error de medida (parte 1). Notas sobre
Evaluación Criterial. CENEVAL / ICI.
Yániz, C. y Villardón, L. (2006): Planificar desde competencias para promover el aprendizaje. Bilbao,
Mensajero.
Wiggins, G. (1989): A True Test: Toward More Authentic and Equitable Assessment. Phi Delta
Kappan, 70/9, 703‐713.
52