Teachers Class Time BRT - Nov 22.en - Es

Traducido del inglés al español - www.onlinedoctranslator.
com
Uso del tiempo de clase por parte de los maestros y rendimiento de los estudiantes†
Simon Burgess, Universidad de Bristol

Shenila Rawal, Asociación de Oxford para la investigación y el análisis de la educación
Eric S. Taylor, Universidad de Harvard y NBER
noviembre 2022
Estudiamos las elecciones de los maestros sobre cómo distribuir el tiempo de clase en diferentes
actividades educativas, por ejemplo, lectura, discusión abierta o práctica individual. Nuestros datos
provienen de escuelas secundarias en Inglaterra, específicamente clases anteriores a los exámenes GCSE.
Los estudiantes obtienen mejores calificaciones en matemáticas cuando su maestro dedica más tiempo
de clase a la práctica y evaluación individual. Por el contrario, los estudiantes obtienen una puntuación
más alta en inglés si hay más discusión y trabajo con los compañeros de clase. La distribución del tiempo
de clase predice los puntajes de las pruebas independientemente de la calidad de la instrucción del
maestro durante las actividades. Estos resultados sugieren oportunidades para mejorar el rendimiento
de los estudiantes sin cambios en las habilidades de los maestros.
JEL n.° I21, J24
†
Diputado: [email protected] . Rawal: [email protected] . taylor:
[email protected] . En primer lugar, agradecemos a la Fundación Nuffield por el generoso apoyo
financiero de este análisis y a la Fundación Education Endowment por el apoyo del experimento original
que recopiló los datos. Gracias por los comentarios y consejos a Anna Vignoles, Ellen Greaves, Hans
Sievertsen, Julie Cohen y Matthew Burgess, y al Departamento de Educación por acceder a la Base de
datos nacional de alumnos.
Las elecciones y habilidades de los maestros afectan la vida de sus estudiantes. Los estudiantes
asignados a maestros más efectivos aprenden más rápido y, como resultado, obtienen un mayor éxito en
la edad adulta. Sin embargo, aunque la evidencia muestra continuamente diferencias en las
contribuciones de los maestros a los resultados de sus alumnos, la evidencia sobre por qué esas
contribuciones difieren sigue siendo escasa. En particular, todavía sabemos poco sobre el papel de las
prácticas de instrucción. Aquí, "prácticas" es una abreviatura de las elecciones que hacen los maestros
sobre cómo enseñar, y la medida en que llevan a cabo con éxito esas elecciones. Las prácticas están
limitadas por las habilidades de enseñanza, pero no son sinónimo de habilidades.1
En este artículo examinamos datos novedosos sobre las prácticas de los docentes, combinados
con las puntuaciones de las pruebas posteriores de sus alumnos. Estudiamos a profesores y alumnos de
escuelas secundarias públicas (estatales) de Inglaterra. Específicamente, las clases de matemáticas e
inglés previas a los exámenes del Certificado General de Educación Secundaria (GCSE) generalmente se
toman a los 16 años. Los datos sobre las prácticas se recopilaron durante las observaciones en el aula
realizadas por otros maestros que trabajan en la misma escuela. Describimos varios resultados
empíricos, algunos nuevos para la literatura sobre la economía de los docentes y la enseñanza.
Nuestro enfoque principal son las elecciones de los maestros sobre cómo distribuir el tiempo de clase
en diferentes actividades educativas. Primero, los maestros toman decisiones diferentes. Algunos maestros
pasan gran parte del tiempo de clase utilizando la instrucción directa tradicional, incluidas las conferencias y el
uso de libros de texto, mientras que otros maestros dedican más tiempo de clase a los estudiantes que trabajan
con sus compañeros de clase o practican individualmente. Para nuestro estudio,
1Jackson, Rockoff y Staiger (2014) revisan la literatura sobre docentes. Los maestros y las escuelas no son
únicos en este sentido. Como Syverson (2011) revisa, la evidencia de muchos sectores e industrias
muestra grandes diferencias en la productividad entre empresas, plantas, etc., pero las causas de esas
diferencias solo se comprenden parcialmente. Algunas causas potenciales intuitivas, como las "prácticas
de gestión", reciben menos atención en la literatura porque son difíciles de medir y probar (cuasi)
experimentalmente (sobre la gestión, consulte Bloom y van Reenen 2007, Bloom et al. 2013 y Bloom et al.
2015 para escuelas). Las prácticas docentes son igualmente difíciles de medir y de manipular
(cuasi-)experimentalmente.
1
los observadores del salón de clases registraron cuál de las doce actividades de instrucción usó el
maestro y durante cuánto tiempo de clase. Los observadores simplemente registraron qué
actividades estaban sucediendo sin juzgar la idoneidad o la calidad de la actividad. La lista de
actividades, que se muestra en la tabla 1, incluye cosas como "exposición o dictado", "enseñanza
uno a uno" y "discusión abierta entre los estudiantes y el maestro". A modo de ejemplo, más de un
tercio de los docentes de nuestros datos utilizaron la actividad "discusión abierta..." durante la
mayor parte o todo el tiempo de clase, pero una cuarta parte de los docentes no utilizaron ninguna
"discusión abierta...". diferentes actividades, esas opciones no están relacionadas en gran medida
con la materia que se enseña (inglés o matemáticas) o con las características de los estudiantes en
la clase.
En segundo lugar, las elecciones de los maestros son (potencialmente) importantes para el
rendimiento de sus alumnos. Los estudiantes obtienen mejores calificaciones en los exámenes de matemáticas
cuando su maestro dedica más tiempo de clase a la práctica y evaluación individual. En la clase de matemáticas
típica (promedio), el maestro asigna "parte del tiempo" a la evaluación y la práctica. En una clase en la que el
profesor dedica "la mayor parte del tiempo" a la práctica y la evaluación, las puntuaciones del GCSE son 0,08σ
más altas que las de la clase típica (σ = desviaciones estándar de la puntuación de la prueba del alumno). Para
los exámenes de inglés, por el contrario, los estudiantes obtienen mejores puntajes cuando pasan más tiempo
trabajando y hablando con sus compañeros de clase, con ganancias previstas similares en magnitud a las
matemáticas.
Necesitamos interpretar este resultado cuidadosamente. A modo de comparación, observamos
que los documentos innovadores sobre prácticas de gestión y desempeño empresarial (Bloom y van
Reenen 2007, Bloom et al 2013) tienen la misma estructura que este documento: preguntar a los agentes
(gerentes/profesores) sobre sus acciones (prácticas de gestión). /uso del tiempo en el aula) y relacione
esto con los resultados (desempeño de la empresa/rendimiento de los alumnos). El problema tanto para
esos documentos como para este documento es hasta qué punto podemos controlar los factores de
confusión que afectan la medida de resultado. En nuestro caso, la principal preocupación se omite en las
habilidades del maestro: los estudiantes aprenden más porque sus maestros son más hábiles y los
maestros más hábiles eligen diferentes actividades de instrucción. Este tipo de
2
la preocupación por las variables omitidas a nivel docente limita las afirmaciones causales en muchos
estudios de docentes, incluso cuando los estudiantes se asignan aleatoriamente a los docentes (p. ej.,
Kane et al. 2011, Taylor 2018, Aucejo et al. 2020).
De hecho, nuestros datos nos permiten recorrer un largo camino hacia la eliminación de
este problema porque tenemos una medida de la eficacia de la instrucción de los maestros. Los
observadores calificaron la calidad de la enseñanza que observaron utilizando una rúbrica
detallada, el Marco para la Enseñanza (Danielson 2007). Estas calificaciones de eficacia educativa
miden una combinación de habilidades y esfuerzo en diez tareas de enseñanza, juzgadas contra un
estándar normativo definido por la rúbrica. Por ejemplo, una de las diez tareas es “usar técnicas de
cuestionamiento y discusión” (ver tabla 2).
El control de la eficacia de la instrucción del maestro nos da nuestro tercer resultado: las
actividades de instrucción que elige un maestro predicen el rendimiento de sus alumnos
independientemente de sus habilidades de enseñanza. Encontramos los mismos patrones: el tiempo para
la práctica individual y la evaluación beneficia los puntajes de matemáticas, y la interacción entre pares
beneficia los puntajes de inglés. Las estimaciones puntuales son de un cuarto a un tercio más pequeñas,
pero siguen siendo educativamente significativas y estadísticamente significativas en los niveles
convencionales. Estos resultados sugieren que, independientemente de las habilidades o el esfuerzo del
maestro, algunos enfoques de la instrucción en el aula tienen más éxito que otros para promover el
aprendizaje de los estudiantes. Este resultado es quizás la contribución más novedosa de este artículo. El
supuesto identificador de una interpretación causal es que nuestra medida de la eficacia de la instrucción
del maestro captura las habilidades del maestro que están correlacionadas con sus elecciones de
actividades de instrucción y el rendimiento de los estudiantes. Incluso si persiste algún grado de sesgo de
variable omitida, nuestras estimaciones tienen un argumento causal mucho más sólido que las
estimaciones existentes que omiten por completo las habilidades de los docentes.
En cuarto lugar, las calificaciones de efectividad de la instrucción de un maestro también predicen
puntajes de rendimiento más altos. Un estudiante asignado a un maestro del cuartil superior, medido por
índices de eficacia, obtendrá una puntuación de aproximadamente 0,08σ más alta que un estudiante similar
asignado a un maestro del cuartil inferior. Esa diferencia es aproximadamente de la misma magnitud que la
3
diferencia predicha por el uso que hacen los maestros del tiempo de clase para practicar matemáticas o para la
interacción entre pares en inglés.
Estas relaciones entre las prácticas de los maestros y los puntajes de los exámenes de los
estudiantes son significativas desde el punto de vista educativo y económico. Una mejora de 0,08σ es
aproximadamente un tercio de la desviación estándar en las contribuciones totales de los docentes a las
puntuaciones del GCSE (Slater, Davies y Burgess 2011). Las mejoras en las puntuaciones del GCSE
también predicen los ingresos futuros y la asistencia a la universidad (Mcintosh 2006, Hayward, Hunt y
Lord 2014, Hodge, Little y Weldon 2021).
Este artículo hace dos contribuciones a la literatura. Nuestra principal contribución es
demostrar la relación entre la elección de actividades educativas de un maestro y el rendimiento de
sus alumnos, incluso condicionado a su eficacia educativa. Muchos artículos miden las diferencias
entre los profesores en con qué eficaciaellos hacen su trabajo; Las calificaciones de las rúbricas de
observación en el aula son bastante comunes (ver Jackson, Rockoff y Staiger 2014 para una
revisión). Pocos documentos tienen medidas que puedan distinguir entre lo que los maestroshacer
en el trabajo decon qué eficaciaellos lo hacen. Los ejemplos más cercanos a este artículo, de los que
tenemos conocimiento, son Aslam y Kingdon (2011) y Taylor (2018). Ambos documentos distinguen
entre las actividades de instrucción y las habilidades de los docentes, y ambos usan esas medidas
para predecir los puntajes de los exámenes de los estudiantes, pero las medidas y los escenarios
son bastante diferentes a los de este documento.
Esta primera contribución tiene implicaciones importantes para los docentes y los administradores de
docentes que trabajan para mejorar la escolarización. A menudo, el enfoque en las escuelas, y entre los
investigadores, es mejorar las habilidades de los docentes. A menudo, esas habilidades son difíciles de aprender,
como manejar el mal comportamiento de los estudiantes o hacer preguntas efectivas en clase. Los resultados de
este artículo sugieren, por ejemplo, que los estudiantes aprenderían más matemáticas si los maestros
simplemente dedicaran más tiempo de clase a la práctica individual, incluso sin un cambio en las habilidades de
los maestros.
Una segunda contribución son las nuevas estimaciones de la correlación entre las calificaciones de las
rúbricas de observación (calificaciones de la eficacia de la instrucción) y las pruebas de los estudiantes.
4
puntuaciones. Varios estudios anteriores reportan la misma correlación, y nuestras estimaciones son
similares en magnitud (por ejemplo, Kane et al. 2011, Kane y Staiger 2012, Kane et al. 2013). Aún así,
nuestras estimaciones son novedosas en algunos aspectos. Primero, son de escuelas secundarias en
Inglaterra. Las estimaciones existentes provienen casi en su totalidad de escuelas primarias y secundarias
de los Estados Unidos; una excepción es Araujo y coautores (2016) que estudian las clases de jardín de
infantes en Ecuador. En segundo lugar, los observadores de nuestro estudio tenían poca formación en
comparación con estudios anteriores. Los observadores suelen recibir mucha más capacitación, que a
menudo incluye pruebas para asegurar la confiabilidad entre evaluadores. En tercer lugar, las
calificaciones de las rúbricas pueden depender de las actividades de instrucción utilizadas durante la
visita del observador. Podemos controlar las actividades de instrucción al estimar la correlación con los
puntajes de las pruebas de los estudiantes.
En la siguiente sección describimos a los maestros, estudiantes y escuelas en nuestro
estudio. La Sección 2 se enfoca en nuestras medidas de actividades educativas y efectividad
educativa, y las diferencias observadas en las elecciones y habilidades de los maestros. En la
Sección 3 examinamos la relación entre las prácticas de los docentes y los puntajes de las pruebas
de rendimiento de sus alumnos. Concluimos en la sección 4.
1. Configuración y muestra
Estudiamos a maestros que trabajan en escuelas secundarias públicas (estatales) en
Inglaterra y enseñan matemáticas e inglés a estudiantes de 10 y 11 años (aproximadamente entre
14 y 16 años). Nuestra medida del rendimiento estudiantil son los exámenes GCSE, que los
estudiantes toman al final del año 11. Nuestras medidas de prácticas docentes, tanto actividades
educativas como eficacia educativa, provienen de observaciones en el aula realizadas por maestros
compañeros de trabajo.
Los datos de observación del salón de clases se recopilaron como parte de un experimento de
campo previo en los años escolares 2014-15 y 2015-16. Los detalles completos y los resultados del
experimento se describen en Burgess, Rawal y Taylor (2021). Las escuelas de tratamiento comenzaron un
nuevo programa de observación entre maestros. En cada uno de los tratamientos
5
escuelas, algunos maestros siempre fueron los observadores, algunos siempre los observados, y
algunos participaron en ambos sentidos. Las escuelas fueron asignadas aleatoriamente a
tratamiento o control, y los maestros fueron asignados aleatoriamente a roles de observador y
observado. La Sección 2 describe los datos recopilados en las observaciones entre pares. Si bien los
maestros se calificaron entre sí, el programa no implicó ningún incentivo (formal) ni consecuencias
vinculadas a esos puntajes.
Todos los datos de los estudiantes provienen de la Base de datos nacional de alumnos (NPD) del
gobierno del Reino Unido, incluidos los puntajes de los estudiantes individuales de los exámenes del
Certificado general de educación secundaria (GCSE). Al final del año 11, los estudiantes toman los
exámenes GCSE en varias materias, pero en este documento solo usamos puntajes de matemáticas e
inglés. Los exámenes GCSE son importantes para los estudiantes; por ejemplo, los puntajes influyen en
las admisiones a la universidad. Y los GCSE predicen ganancias futuras (Mcintosh 2006, Hayward, Hunt y
Lord 2014, Hodge, Little y Weldon 2021). Además de los puntajes de GCSE, los datos de NPD brindan
puntajes de exámenes anteriores de los estudiantes, datos demográficos y medidas de exposición a la
pobreza en sus familias y vecindarios.
El NPD no recopila datos que vinculen a los estudiantes con sus maestros específicos. Durante el
experimento de observación entre pares, las escuelas proporcionaron listas de clases que usamos para vincular
a estudiantes y maestros. Las listas utilizan códigos de identificación de maestros enmascarados que,
lamentablemente, no podemos vincular con ningún otro dato sobre maestros individuales.
Nuestra muestra de estudio incluye 251 maestros en 32 escuelas y poco más de 7,000
estudiantes que fueron enseñados por esos maestros y para quienes tenemos los puntajes de las
pruebas GCSE. Para matemáticas tenemos 5.211 alumnos y 136 profesores, y para inglés 4.301 y
1202. Los datos de observación en el aula fueron recopilados por 231 maestros compañeros
diferentes.
La selección en esta muestra involucró tres pasos. Primero, las escuelas se ofrecieron como voluntarias para
participar en el nuevo experimento del programa de observación entre pares. el equipo de investigación
2Esto se debe a que es más probable que los maestros de matemáticas sean observados, no porque tengamos puntajes
diferenciales en los exámenes de los estudiantes.
6
contactó a casi todas las escuelas secundarias públicas (estatales) de alta pobreza en Inglaterra y las
invitó a participar en el experimento.3Las escuelas no fueron seleccionadas en base a los puntajes de las
pruebas de los estudiantes. En segundo lugar, la mitad de las escuelas de voluntarios fueron asignadas
aleatoriamente al programa de tratamiento. En tercer lugar, dentro de cada una de las escuelas de
tratamiento, se seleccionó una muestra aleatoria de maestros para observarlos y calificarlos. Cuarto, los
maestros elegían si participar o no. Por lo tanto, nuestra muestra de 32 escuelas y 251 docentes es en
parte seleccionada al azar y en parte autoseleccionada.
La Tabla 3 proporciona una descripción de nuestra muestra. Las escuelas invitadas a participar en el
experimento fueron seleccionadas intencionalmente por tener altos índices de pobreza, y esa selección inicial se
refleja en las filas de IDACI y comidas escolares gratuitas de la tabla 3. Poco más del 40 por ciento de los
estudiantes son, o alguna vez han sido, elegibles para recibir alimentos gratuitos. comidas escolares,
sustancialmente más altas que el promedio nacional. La comparación entre las columnas de la tabla 3
proporciona alguna información sobre la autoselección de maestros en nuestra muestra.
2. Medidas de prácticas docentes
Las observaciones en el salón de clases revelaron diferencias significativas entre los maestros tanto en
las actividades de instrucción que los maestros eligieron usar en clase como en las calificaciones basadas en
rúbricas de la efectividad de la instrucción de los maestros. En esta sección describimos la variación en las
prácticas y la eficacia. En la siguiente sección relacionamos las medidas de los maestros con los puntajes de las
pruebas de los estudiantes.
Los datos de observación se recopilaron durante casi 2700 visitas a las aulas, donde un
observador calificó a uno de sus compañeros maestros. Las visitas solían durar entre 15 y 20
minutos. El maestro típico (mediano) fue observado ocho veces durante dos años (IQR 4-15). El
maestro típico fue puntuado por tres compañeros observadores diferentes (IQR 2-5). Todos los
maestros recibieron capacitación sobre la rúbrica y otros aspectos del programa.
3Para este propósito, las “escuelas de alta pobreza” eran aquellas escuelas donde el porcentaje de estudiantes elegibles para
comidas escolares gratuitas estaba por encima de la media de Inglaterra.
7
Sin embargo, la capacitación fue breve en comparación con la capacitación que han recibido los
observadores en otros estudios y entornos (p. ej., Kane et al. 2011, Kane et al. 2013).
2.1 Actividades de instrucción
Para medir las opciones de actividades educativas de los maestros, se les dio a los
observadores una lista de actividades y se les pidió que registraran la frecuencia con la que se
usaba cada actividad. Es importante destacar que los observadores pares registraron solo la
frecuencia de la actividad durante su visita; no se pidió a los observadores que evaluaran la calidad
o la adecuación de la actividad. La lista completa de doce actividades se muestra en la tabla 1,
incluidas cosas como “discusión abierta entre los niños y el maestro” y “uso de la pizarra por parte
del maestro”. Los observadores podían elegir entre cinco opciones: nada (0), muy poco (1), algunas
veces (2), la mayor parte del tiempo (3), tiempo completo (4). La lista de actividades y el instrumento
fueron adaptados del proyecto SchoolTELLS (Kingdon, Banerji y Chaudhary 2008).
Los profesores toman decisiones bastante diferentes sobre cómo pasar el tiempo de clase. La
Figura 1 muestra las doce diferentes actividades de instrucción y la frecuencia de su uso. Por ejemplo, en
más de un tercio de las clases, los observadores registraron “discusiones abiertas entre los niños y el
maestro” durante la mayor parte o la totalidad del tiempo de clase. Sin embargo, en una cuarta parte de
las clases, la "discusión abierta..." era muy rara o estaba completamente ausente. Los maestros estaban
divididos de manera similar sobre "los niños que hacen el trabajo escrito solos". Un ejemplo contrastante
es el uso de un libro de texto, que se registró como raro o ausente en casi nueve de cada diez clases.
Los patrones de las actividades de instrucción son bastante similares en las clases de
matemáticas e inglés. La correlación entre sujetos en la frecuencia media de actividades es de 0,96. La
figura A1 del apéndice muestra la figura 1 por separado por tema. Sin embargo, esta similitud en el uso
del tiempo no significa que las actividades contribuyan a los puntajes de los exámenes de matemáticas e
inglés de los estudiantes de la misma manera, como mostramos en la sección 3.
Algunos grupos de actividades de instrucción están correlacionados. La Tabla 4 muestra la
matriz de correlación para las doce actividades. Algunas actividades pueden ser complementarias
8
insumos para el aprendizaje de los estudiantes, mientras que otras actividades pueden ocurrir
simultáneamente por razones prácticas. Examinar las correlaciones, junto con la sustancia de las
actividades, sugiere una oportunidad para alguna reducción de dimensión.
Nuestro análisis se centra en cuatro grupos de actividades de instrucción. Primero, un
grupo que llamamos “interacción entre estudiantes y compañeros”, combinando las actividades 1 y
2, que involucran a los estudiantes interactuando entre sí (y con el maestro). Segundo, “instrucción
personalizada”, combinando las actividades 3-4, que involucran atención personalizada del maestro
a los estudiantes. Tercero, “práctica y evaluación”, que combina las actividades 5 a 7, que implican
la práctica y la evaluación de los estudiantes. Cuarto, “instrucción directa”, que combina las
actividades 8-11, que involucran lectura tradicional y otra instrucción directa.
La Tabla 5 describe las elecciones de los maestros usando estos cuatro grupos de actividades. El grupo
de actividades más común es “interacción entre estudiantes” con una media de 1,7, donde un 2 es “parte del
tiempo” en una escala de 0 “nada” a 4 “tiempo completo”. El menos común es la “instrucción directa” con una
media de 1,2. En la sección 3, mostramos que estos cuatro tipos de actividades predicen las calificaciones de los
estudiantes de manera muy diferente en matemáticas en comparación con las de inglés.
La simplificación implica compensaciones. Nuestra agrupación divide las doce
actividades en categorías mutuamente exclusivas y exhaustivas que son relativamente
sencillas. La contrapartida es que estos grupos simples ignoran la variación en cómo se
correlacionan las actividades dentro y entre grupos. Para complementar el agrupamiento
simple, mostramos en el Apéndice C que los resultados del documento son robustos al uso
del análisis de componentes principales para la reducción de dimensiones.
2.2 Eficacia de la instrucción

Para medir la efectividad de la instrucción de los maestros, los observadores calificaron a
los observadores usando una rúbrica estructurada conocida comoMarco para la enseñanza(
Danielson 2007, FFT). La rúbrica es ampliamente utilizada por los sistemas escolares y en la
investigación (por ejemplo, Kane et al. 2011, Taylor y Tyler 2012, Kane et al. 2013, Bacher-Hicks et al.
9
2017). Los maestros fueron calificados en diez tareas de instrucción separadas (o "estándares" en la
jerga de FFT), que se enumeran en la columna de la izquierda de la tabla 2. Para cada tarea, la
rúbrica incluye descripciones detalladas de los comportamientos observados que deben calificarse
como " enseñanza “altamente efectiva”, “efectiva”, “básica” e “ineficaz”. En la tabla 2 reproducimos
las descripciones de “efectivo” como ejemplo. La rúbrica completa se proporciona en el apéndice B.
Los observadores pares asignaron una puntuación del 1 al 12 a cada uno de los diez elementos de la rúbrica.
En la mayoría de los entornos, la rúbrica FFT se califica del 1 al 4 correspondiente a las cuatro
descripciones. En este estudio, los observadores fueron capacitados para usar 1-3 para "ineficaz",
4-6 para "básico", 7-9 para "eficaz" y 10-12 para "altamente eficaz". Así, por ejemplo, un observador
que sintiera que el maestro era "efectivo" podría elegir una puntuación de 7, 8 o 9, donde 7 sugiere
"efectivo" pero más cercano a "básico" y 9 sugiere "efectivo" pero más cercano a "altamente".
eficaz."
Los maestros difieren en la efectividad de la instrucción, según la calificación de sus
compañeros de trabajo. Para ser claros, en este contexto, la "eficacia de la instrucción" es una medida de
las acciones observables de un maestro en el aula. Si bien usamos la palabra "eficacia", estas
calificaciones también podrían describirse como medidas de "desempeño laboral". Las calificaciones
reflejan una combinación de las habilidades y el esfuerzo de un maestro aplicado a tareas de enseñanza
específicas, juzgadas contra un estándar normativo definido por la rúbrica.
La Figura 2 muestra un histograma de calificaciones a nivel de elemento en el panel superior,
agrupando las diez tareas. El puntaje más común es 10 de 12, otorgado en casi el 25 por ciento de las
calificaciones; pero las puntuaciones de 8, 9, 11 y 12 tienen cada una entre el 10 y el 15 por ciento de las
calificaciones. Muy pocos maestros obtienen una calificación de 3 o menos ("ineficaz").
4Estas diez tareas puntuadas (o estándares) se dividen en dos "dominios" de "ambiente del aula" e
"instrucción". Estos dos dominios se califican durante las observaciones en clase, y durante el
experimento de evaluación por pares solo se calificaron estos dos dominios. La rúbrica FFT también
incluye varios estándares en otros dos dominios, "planificación" y "evaluación", que se califican en base a
conversaciones con el maestro y una revisión de los materiales.
10
El sesgo en la figura 2 refleja en parte el sesgo de indulgencia, que es una característica común
de las calificaciones de desempeño laboral de los docentes (Weisberg et al. 2009, Kraft y Gilmour 2017) y
en muchas otras ocupaciones (Prendergast 1999). El sesgo de indulgencia puede ser más probable en
nuestro entorno donde los observadores y los observados trabajaron juntos en la misma escuela como
compañeros. Alternativamente, la naturaleza de bajo riesgo de las observaciones de los pares puede
haber hecho que las calificaciones resultantes sean más precisas. Y la escala de 12 puntos les dio a los
evaluadores una forma de diferenciar entre la enseñanza "altamente efectiva". Al final, mientras que las
calificaciones se agrupan en la parte superior de la escala en nuestros datos, hay más variación de lo que
es típico de las observaciones en el aula y mucho menos efecto techo de lo que es típico.5
Para cada una de las diez tareas de instrucción, la tabla 6 informa la calificación media y la
desviación estándar. Los observadores calificaron a los maestros más alto, en promedio, por "manejo del
comportamiento de los estudiantes" (media 9.4) y más bajo por "uso de la evaluación" (media 8.5). En
general, los maestros fueron calificados como más efectivos en las tareas del entorno del salón de clases
que en las tareas de instrucción. El “uso de la evaluación” también mostró las mayores diferencias en la
efectividad entre docentes (desviación estándar 2.2). Los maestros fueron más similares en "comunicarse
con los estudiantes" (desviación estándar 1.9).
Las calificaciones de efectividad de la instrucción de un maestro en todas las tareas están fuertemente
correlacionadas. La correlación promedio en la calificación entre dos tareas cualesquiera es 0,70, con un rango
de 0,55 a 0,86. La matriz completa de correlaciones por pares se muestra en el cuadro A1 del apéndice. La
correlación entre tareas refleja en parte el hecho de que las verdaderas habilidades y esfuerzos subyacentes
están correlacionados. De hecho, 0,70 puede subestimar la correlación en las habilidades o el esfuerzo, ya que
se observa a los docentes brevemente y con poca frecuencia al introducir el error de medición clásico. La
correlación también surge en parte porque las calificaciones de las diez tareas
5La figura A2 del apéndice muestra un histograma de los mismos datos que el panel A de la figura 2, pero donde las
calificaciones del 1 al 12 se colapsan en la escala más común del 1 al 4. Los efectos de sesgo y techo son, como era de
esperar, mucho más fuertes.
11
son dados por un observador. Sin embargo, utilizando solo la variación dentro del observador, la
correlación por pares promedio sigue siendo 0,60, con un rango de 0,44 a 0,79.
En la práctica, entonces, las calificaciones de las rúbricas miden principalmente una dimensión
general de la eficacia de la instrucción. La tabla A2 del apéndice muestra los resultados de un análisis de
componentes principales de las calificaciones a nivel de ítem. El primer componente principal es
efectivamente el promedio simple de los diez elementos de la tarea, y ese promedio simple explica las
tres cuartas partes de la variación en las calificaciones a nivel de elemento. A modo de comparación, el
primer componente principal de los elementos de actividades de instrucción explica solo el 13 por ciento
de los datos de actividades. Este patrón de correlaciones entre calificaciones coincide con estudios
previos que utilizan la rúbrica de observación FFT.6
Dadas estas correlaciones, nos enfocamos en un puntaje único para la efectividad de la
instrucción: el promedio simple de las diez calificaciones de la rúbrica FFT. El panel inferior de la
figura 2 muestra un histograma de estos puntajes promedio, con un puntaje promedio para cada
visita de observación de pares.
Una nota final sobre la medición de las prácticas docentes. Las diferencias entre los
profesores pueden reflejar en parte las diferencias en los estudiantes a los que enseñan. Los
maestros pueden elegir diferentes actividades de instrucción para estudiantes con diferentes
necesidades académicas. O los estudiantes con diferentes necesidades pueden ser asignados
a maestros en base a la efectividad de instrucción del maestro o el uso de actividades. Tales
elecciones o asignaciones intencionales pueden o no mejorar el éxito de una escuela (Duflo,
Dupas y Kremer 2011, Ballatore y Sestito 2017, Aucejo et al. 2020, Graham et al. 2021).
Alternativamente, los juicios de los observadores del aula pueden verse influenciados por los
estudiantes de la clase durante la visita (Campbell y Rondfeldt 2018). Sin embargo, en el
contexto de este artículo, encontramos poca evidencia de una relación entre
6En tres estudios previos en escuelas de EE. UU., las calificaciones de los diez ítems de FFT están correlacionadas entre 0,72 y 0,88
(Kane y Staiger 2012, Ho y Kane 2013, Gitomer et al. 2014, ICPSR nd, comunicación personal de Andrew Ho, 3 de mayo de 2019).
Kane et al. (2011) reporta resultados de componentes principales similares. Sin embargo, en nuestros datos, los niveles de
calificación son consistentemente más altos en todos los elementos, alrededor de 0,9 puntos en la escala de 4 puntos, y nuestras
calificaciones tienen una variación más alta, alrededor de un 30 por ciento más grande.
12
las características de los estudiantes (puntajes de exámenes anteriores, exposición a la pobreza, etc.) y las
opciones de actividades de instrucción de sus maestros o la eficacia de la instrucción calificada (tabla A3
del apéndice).
3. Prácticas docentes y rendimiento estudiantil
Pasamos ahora a la relación entre las prácticas docentes y el rendimiento de los estudiantes. Como
detallamos en esta sección, los estudiantes obtienen mejores calificaciones en matemáticas cuando su maestro
asigna más tiempo de clase a la práctica y evaluación de los estudiantes. Por el contrario, los estudiantes
obtienen mejores calificaciones en inglés cuando los maestros dedican más tiempo a que los estudiantes
trabajen y hablen entre ellos en clase. Estas relaciones, entre las actividades de instrucción en clase y el
rendimiento de los estudiantes, se mantienen incluso controlando la eficacia de la instrucción del maestro. Los
estudiantes también obtienen puntajes más altos cuando su maestro tiene una calificación más alta en la
efectividad de la instrucción.
3.1 Estimación
Nuestra estrategia de estimación comienza con un modelo estadístico convencional de los puntajes de las
pruebas de los estudiantes:
= + + + , (1)

dónde es el puntaje GCSE estandarizado para estudiantes en tema (matemáticas o
inglés) impartido por el profesor en el año escolar previo a los GCSE.7el vector
representa puntajes o medidas tomadas de las observaciones del maestro en el aula
,y descrito en la sección 2. Nuestro interés es estimar .el vector incluye
varios controles adicionales: estudiante 's propios puntajes de exámenes anteriores en matemáticas e inglés;
7Estrictamente hablando el índice en y es redundante porque, en nuestros datos, cada estudiante es
asignado a un solo profesor por asignatura y así = ( ).mantenemos el índice para facilitar la exposición. Los puntajes
de los estudiantes están estandarizados (media 0, sd 1) por materia y año escolar dentro de nuestra muestra de análisis.
13
las medias de clase y las desviaciones estándar de los dos puntajes de prueba anteriores,
omitiendo ; y varios otros estudiantes observables.8El término representa efectos fijos sujetos.
Nuestras estimaciones preferidas de también dan cuenta de las diferencias entre los observadores. Sobre la
base de la especificación 1, ajustamos:
= + + + + , (2)

dónde son las puntuaciones dadas al profesor por observador .La adición del observador
efectos fijos, , controla las diferencias entre los observadores en sus expectativas, prácticas,
experiencia, etc.9Para estimar la especificación 2, primero creamos un nuevo conjunto de datos con
duplicados de cada registro de pareja alumno-profesor, ,en los datos originales,
dónde es el número de observadores que puntuaron maestro .A estos nuevos datos nos
añade el puntuaciones.10Entonces estimamos 2 ponderaciones por1⁄ ; por lo tanto, cada estudiante-
pareja de maestros, ,se le da el mismo peso independientemente del número de observadores que calificaron
al maestro .A lo largo del informe, informamos estimaciones de error estándar robustas de clúster, donde los
clústeres son maestros .
Reportamos estimaciones de separados por tema. Estimamos la especificación 2 pero
permitimos todos y los términos sean diferentes según el tema. Efectos fijos del observador, ,
siguen siendo sujetos cruzados para nuestros resultados principales, pero esos resultados son robustos para el
uso de efectos fijos observador por sujeto (equivalentemente, estimando 2 por separado por sujeto).
3.2 Actividades de instrucción en clase y resultados de las pruebas de los estudiantes
Los diferentes maestros eligen distribuir el tiempo de clase de diferentes maneras (clase,
discusión en grupo, práctica individual, etc.) y esas diferentes actividades de instrucción explican en parte
las diferencias en los puntajes de las pruebas de los estudiantes. Como las estimaciones en la tabla
8Los puntajes de las pruebas anteriores son puntajes de Key Stage 2 (KS2). Las otras características son el género, alguna vez
elegible para comidas escolares gratuitas, puntaje IDACI, mes de nacimiento y el año en que el estudiante tomó los GCSE.
También incluimos un indicador de si la escuela está en Londres.
9Estas diferencias de los observadores pueden incluir, por ejemplo, diferencias entre los observadores en su
sentido de lo que constituye "medir la comprensión de los estudiantes" o "trabajo no docente", o los umbrales
entre "algunas veces" y "la mayor parte del tiempo".
10Cuando observa más de una vez, usamos las medidas o puntajes promedio de en . Similarmente,
para en la ecuación 1 usamos el promedio de todos los observadores.
14
En el panel A de 7 columnas 1, los estudiantes obtienen una puntuación más alta en los GCSE de
matemáticas cuando el enfoque de su maestro incluye más tiempo para la práctica y la evaluación
individuales. Aumentar el tiempo para "práctica y evaluación" en una desviación estándar predice
puntajes de prueba de matemáticas 0.068σ más altos. En la clase de matemáticas típica (promedio), el
maestro asigna "parte del tiempo" a la evaluación y la práctica. En una clase en la que el profesor dedica
"la mayor parte del tiempo" a la práctica y la evaluación, esperaríamos que las puntuaciones fueran
aproximadamente 0,08σ más altas que las de la clase típica.11Por el contrario, las otras actividades de
clase son predictores mucho más débiles de las puntuaciones de matemáticas.
Sin embargo, para los GCSE de inglés, los estudiantes obtienen una puntuación más alta cuando el tiempo de
clase incluye una mayor interacción del estudiante con sus compañeros de clase. El coeficiente de "interacción entre
estudiantes y compañeros" es 0.053σ para predecir los puntajes de las pruebas de inglés (tabla 7, columna 1, panel B),
aproximadamente tan grande como lo es "práctica y evaluación" para matemáticas. Pero otras actividades no son
fuertes predictores de los puntajes de inglés, de hecho, más tiempo en las otras actividades puede conducir a puntajes
más bajos en las pruebas.
La relación entre las actividades de instrucción y el rendimiento de los estudiantes es
económica y educativamente significativa. Una mejora de 0,08σ es aproximadamente un tercio de
la desviación estándar entotalcontribuciones de los maestros a los puntajes de las pruebas de los
estudiantes.12Una diferencia de 0,08σ también es aproximadamente la diferencia entre ser
asignado a un maestro de primer año o un maestro de quinto año (ver Jackson, Rockoff y Staiger
2014 para una revisión reciente). Una ganancia de 0.08σ también es similar a la ganancia de
11Como se muestra en la tabla 5, la media matemática para "práctica y evaluación" es 1,73, donde 2 es "parte del
tiempo". La desviación estándar es 0,086, por lo que un cambio de un punto de escala de 2 "algunas veces" a 3 "la mayor
parte del tiempo" sería aproximadamente 0,068σ/0,86 = 0,08σ.
12Slater, Davies y Burgess (2011) estiman que la desviación estándar de las contribuciones de los maestros a las
puntuaciones del GCSE es de 0,272 desviaciones estándar de los estudiantes. Esta estimación proviene de escuelas
secundarias de inglés y cursos GCSE, como en nuestro estudio actual, aunque la muestra de Slater, Davies y Burgess
(2011) es más amplia. Para obtener un resumen general de las estimaciones sobre la distribución del valor agregado de
los docentes, consulte Jackson, Rockoff y Staiger (2014) y Hanushek y Rivkin (2010), aunque muchas estimaciones de esas
estimaciones provienen de escuelas primarias y secundarias en los Estados Unidos. La estimación de 0,272 puede ser
mayor que otras estimaciones en parte porque los estudiantes suelen pasar dos años con su profesor de GCSE.
15
agregando 2-3 semanas de instrucción al año escolar (Sims 2008, Fitzpatrick,
Grissmer y Hastedt 2011, Aucejo y Romano 2016).
Las estimaciones en la columna 1 de la tabla 7 por sí solas no son suficientes para concluir que más
práctica y evaluación provocan puntuaciones más altas en matemáticas per se, o que una mayor interacción de
los estudiantes provoca puntuaciones más altas en inglés. Ciertamente, es plausible que los estudiantes
aprendan más o menos debido a cómo sus maestros distribuyen el tiempo de clase. Sin embargo, no podemos
descartar una explicación alternativa: que los estudiantes aprenden más o menos debido a otra cosa que hacen
sus profesores, y que esa otra cosa está simplemente correlacionada con la elección de actividades de
instrucción por parte del profesor. Esta preocupación por las variables omitidas a nivel docente también limita
las afirmaciones causales en otras investigaciones similares, incluso cuando los estudiantes se asignan
aleatoriamente a los docentes (p. ej., Kane et al. 2011, Taylor 2018, Aucejo et al. 2020).
Una importante variable potencial omitida es la habilidad o el esfuerzo del maestro.
El hecho de que una determinada actividad educativa beneficie o no el aprendizaje de los
estudiantes debería depender, al menos en cierta medida, de la habilidad o el esfuerzo del
maestro en esa actividad específica. Considere, por ejemplo, las “interacciones entre
estudiantes”, que incluyen debates abiertos entre la clase. Tal vez esta actividad contribuya a
un mayor rendimiento en inglés pero no en matemáticas, como en la tabla 7, porque los
profesores de inglés son más hábiles (o se esfuerzan más en) “usar técnicas de preguntas y
debate”. Quizás los profesores de matemáticas asignan más tiempo de clase a la “práctica y
evaluación” porque son mejores en esas tareas.
Probamos este posible sesgo, al menos parcialmente, agregando calificaciones de efectividad
de la instrucción como controles y examinando si los coeficientes de las actividades de instrucción
cambian y cómo cambian. Como se discutió anteriormente, nuestra medida de la efectividad de la
instrucción es una combinación de habilidades y esfuerzo de enseñanza.
Compare las columnas 1 y 3 de la tabla 7. Para matemáticas, la estimación puntual para
"práctica y evaluación" se reduce aproximadamente un tercio a 0.047σ, pero sigue siendo significativa, y
no podemos rechazar el valor nulo de que no ha cambiado desde 0.068σ. La estimación puntual de
dieciséis
“instrucción directa” casi se duplica a 0.023σ. Esto sería consistente con que las clases sean más
productivas cuando el maestro es más hábil en matemáticas (ver, por ejemplo, Taylor 2018). Para el
inglés, al igual que para las matemáticas, la estimación del punto clave sobre la "interacción entre
estudiantes y compañeros" se reduce en aproximadamente una quinta parte, pero sigue siendo
significativa desde el punto de vista educativo. Los coeficientes negativos de “instrucción personalizada” y
“práctica y evaluación” aumentan en valor absoluto y se estiman con mayor precisión.
Estos resultados sugieren que, independientemente de las habilidades o el esfuerzo del maestro,
algunos enfoques de la instrucción en el aula tienen más éxito que otros para promover el aprendizaje de los
estudiantes. Los resultados también sugieren que la naturaleza de esa actividad más efectiva puede depender
de la materia que se enseña. Este resultado es quizás la contribución más novedosa de este artículo a la
literatura. Son raras las investigaciones que combinan tanto las medidas de las actividades de instrucción como
las medidas de las habilidades del maestro para predecir los puntajes de las pruebas de los estudiantes. Los más
cercanos, de los que tenemos conocimiento, son Aslam y Kingdon (2011) y Taylor (2018).
Una segunda amenaza potencial para la interpretación causal proviene de las variables omitidas a
nivel de estudiante, que surgen de cómo los estudiantes son asignados a los maestros. Sin embargo, la amenaza
de las características de los estudiantes que no se observan es probablemente mucho menor que la amenaza de
las características de los maestros que no se observan. Nuestras estimaciones controlan los puntajes de las
pruebas anteriores de los estudiantes, la distribución de los puntajes anteriores de los compañeros, los
antecedentes de los estudiantes y los efectos fijos de la escuela. Una limitación es que nuestros puntajes de
exámenes anteriores son el examen Key Stage 2 tomado cinco años antes de los exámenes GCSE, no el año
escolar inmediatamente anterior. Evidencia bien conocida, de Kane y Staiger (2008), Chetty, Friedman y Rockoff
(2014) y otros, sugiere que es plausible suponer que las asignaciones de estudiantes a maestros son ignorables,
en el sentido de inferencia causal, condicional en resultados de exámenes de años anteriores. . Está menos claro
cómo se degradan los beneficios de los controles de puntuación retrasados con retrasos más largos, aunque
un trabajo reciente en Angrist et al. (en prensa) sugiere razones para el optimismo.
Como enfoque alternativo, las columnas con números pares en la tabla 7 usan efectos fijos de
estudiantes. Las estimaciones puntuales son más pequeñas, se reducen a la mitad o dos veces.
17
tercios Aún así, se mantiene el mismo patrón: las matemáticas se benefician del tiempo de clase para la práctica y
evaluación individual, el inglés se beneficia de la interacción entre estudiantes y compañeros.
Las estimaciones de la variable dependiente rezagada y las estimaciones de los
efectos fijos de los estudiantes proporcionan límites sobre la influencia del sesgo de la
variable omitida a nivel de los estudiantes, como el rendimiento no observado del año
anterior. Correctamente purgado de cualquier sesgo que surja de la clasificación no aleatoria
de estudiantes a profesores, el coeficiente de “práctica y evaluación” para matemáticas estaría
entre 0,015σ y 0,047σ, por ejemplo. Las estimaciones de efectos fijos de los estudiantes serán
correctas, en el sentido específico de evitar cualquier sesgo de las características omitidas de
los estudiantes, solo si las asignaciones de estudiantes y maestros para matemáticas e inglés
se basan en la misma información. De lo contrario, las estimaciones de FE del estudiante
probablemente sean demasiado pequeñas. Las asignaciones de matemáticas e inglés se
realizan al mismo tiempo, por lo que la escuela dispone de la misma información para ambas
decisiones.13
3.3 Calificaciones de la eficacia de la enseñanza y puntajes de las pruebas de los estudiantes
Las calificaciones de efectividad de la enseñanza basadas en rúbricas también predicen los puntajes
de las pruebas GCSE de los estudiantes. En la columna 5 de la tabla 7, el coeficiente estimado de la puntuación
FFT es 0,077σ para matemáticas y 0,040σ para inglés. Imagine dos estudiantes: el primer estudiante está
asignado a un maestro del cuartil superior, según lo medido por la rúbrica FFT, y el segundo a un maestro del
cuartil inferior. El primer estudiante obtendrá una puntuación más de 0,10 σ más alta que el segundo estudiante
en los GCSE de matemáticas (o 0,05 σ en inglés).
Varios estudios previos también informan la correlación entre los puntajes FFT de los maestros y los puntajes
de las pruebas de los estudiantes. Nuestras estimaciones de las escuelas secundarias inglesas están en línea con las
estimaciones existentes. Estudiantes de maestros y estudiantes más jóvenes en los Estados Unidos
13Rothstein (2010) argumenta convincentemente en contra del uso de efectos fijos de estudiantes para estudiar a los
maestros de escuela primaria, el escenario más común en la literatura. El requisito de que las escuelas usen la misma
información se viola fácilmente cuando la estrategia de efectos fijos de los estudiantes usa observaciones durante varios
años para un estudiante determinado.
18
Unidos, pero utilizando datos y regresiones similares, los artículos anteriores informan coeficientes
en la puntuación FFT de 0.08-0.09σ (Kane et al. 2011) y 0.05-0.11σ (Kane et al. 2013). La última cita
es del gran proyecto Métodos de Enseñanza Efectiva (MET, por sus siglas en inglés), que incluía
medir la enseñanza usando otras rúbricas de observación además de FFT, y en general las otras
rúbricas también predijeron puntajes de prueba de manera similar (Kane y Staiger 2012). Un
estudio similar de maestros y niños de jardín de infantes en Ecuador encontró coeficientes de
0.05-0.07σ para la rúbrica CLASS (Araujo et al. 2016). Por el contrario, las calificaciones
(relativamente) subjetivas de los maestros por parte de los líderes escolares son menos predictivas
de las calificaciones de los estudiantes (Jacob y Lefgren 2008, Rockoff y Speroni 2010, Rockoff et al.
2012).
Nuestras estimaciones se distinguen de dos maneras, incluso si son similares en magnitud a las
estimaciones anteriores. Primero, los observadores pares tenían poca capacitación en comparación con
estudios anteriores. En estudios anteriores, los docentes fueron observados y calificados por
investigadores o administradores escolares que reciben una capacitación sustancial y, a menudo, se
someten a pruebas de confiabilidad antes de realizar las evaluaciones.14En segundo lugar, las
calificaciones de las rúbricas pueden depender de las actividades de instrucción utilizadas durante la
visita del observador. Por ejemplo, una calificación de las “técnicas de discusión y preguntas” de un
maestro puede ser más exacta o precisa si la clase dedica más tiempo a la discusión grupal. Podemos
controlar las actividades de instrucción. Compare las columnas 5 y 3 de la tabla 7. El coeficiente de las
calificaciones de efectividad es bastante similar, ya sea que controlemos o no la combinación de
actividades durante la clase observada.
3.4 Resultados adicionales
El Apéndice C analiza varios resultados adicionales que resumimos brevemente aquí.
Primero, como prueba de robustez, utilizamos el análisis de componentes principales para
reducir la dimensionalidad de los datos de la actividad educativa. Luego repita el
14A veces, los evaluadores se conocen como "evaluadores de pares", pero "compañeros" se refiere al hecho de que el evaluador
había sido (recientemente) un maestro de clase. El rol de evaluador es un trabajo especializado distinto con una capacitación
sustancial.
19
análisis en la tabla 7, reemplazando los cuatro grupos de actividades con cinco puntajes de
componentes principales. Los resultados muestran los mismos patrones sustantivos que la tabla 7;
los patrones sustantivos no son un artefacto de cómo combinamos los datos de actividad. Por
ejemplo, en inglés, el cuarto componente principal es el predictor sobresaliente. Este componente,
que denominamos “trabajo en grupo versus trabajo individual”, aumenta en actividades en las que
los estudiantes interactúan con sus compañeros de clase y disminuye en actividades en las que los
estudiantes trabajan solos o uno a uno con el maestro.
En segundo lugar, el grado en que las calificaciones de la eficacia de la instrucción predicen el
crecimiento de los logros de los estudiantes depende de los resultados de los estudiantes.previologro.
Como se muestra en la tabla A4 del apéndice, la correlación—entre los puntajes de GCSE de los
estudiantes y las calificaciones de efectividad de los maestros—se reduce a medida que aumentan los
puntajes de las pruebas anteriores del estudiante. Este resultado de heterogeneidad apunta a una
literatura estrechamente relacionada: qué prácticas docentes mejoran mejor el rendimiento de los
estudiantes bien pueden depender de las características de los estudiantes en el aula (Lazear 2001,
Lazear 2006, Duflo, Dupas y Kremer 2011, Aucejo et al. 2020 , Graham et al. 2021). Sin embargo, en
contraste con las calificaciones de efectividad, la correlación entre las actividades de instrucción y los
puntajes de GCSE no cambia con el rendimiento previo de los estudiantes. Por ejemplo, en las clases de
inglés, la interacción entre estudiantes y compañeros no es más o menos efectiva para los estudiantes
con un rendimiento previo más bajo.
4. Conclusión
Este artículo describe varios resultados que contribuyen a responder la pregunta en curso: ¿Qué
implica realmente la enseñanza efectiva? ¿O qué prácticas de enseñanza son importantes para el
rendimiento de los estudiantes? Estudiamos las prácticas docentes y los logros de los estudiantes en las
escuelas secundarias públicas (estatales) de Inglaterra.
Nuestro enfoque principal son las elecciones de los maestros sobre cómo distribuir el
tiempo de clase en diferentes actividades educativas. Los observadores del aula registraron cuánto
tiempo de clase se dedicaba a diferentes actividades de instrucción, por ejemplo, "abrir
20
discusión entre niños y maestra” y “uso de pizarra por parte de la maestra”. Los
observadores simplemente registraron qué actividades estaban sucediendo sin juzgar la
idoneidad o la calidad de la actividad.
En resumen, encontramos que las elecciones de actividades educativas de los maestros predicen
puntajes posteriores de rendimiento de sus estudiantes. En las clases de matemáticas, por ejemplo, los
estudiantes obtienen puntajes más altos con maestros que dan más tiempo para la práctica individual. En la
clase de matemáticas típica (promedio), el maestro asigna "parte del tiempo" a la evaluación y la práctica. En una
clase en la que el profesor dedica "la mayor parte del tiempo" a la práctica y la evaluación, las puntuaciones del
GCSE son 0,08σ más altas que las de la clase típica (σ = desviaciones estándar de la puntuación de la prueba del
alumno). Para los exámenes de inglés, por el contrario, más tiempo trabajando con compañeros de clase predice
puntajes más altos.
Los educadores e investigadores bien podrían ser escépticos de que el simple uso del tiempo prediga
las puntuaciones de los estudiantes, ya que es probable que los maestros varíen en la eficacia con la que llevan a
cabo diferentes actividades. Nuestros datos, tanto con el uso del tiempo como con las medidas de efectividad,
brindan una rara oportunidad de probar la hipótesis de ese escéptico. Cuando controlamos las calificaciones de
eficacia de la instrucción, el uso del tiempo de clase aún predice el rendimiento de los estudiantes. La
implicación práctica es que los estudiantes probablemente ganarían (o perderían) con los cambios en las
actividades de instrucción, incluso si las habilidades del maestro no cambiaran.
También encontramos que las calificaciones basadas en rúbricas de la eficacia de la instrucción
también predicen el rendimiento de los estudiantes. Un estudiante asignado a un maestro del cuartil superior,
medido por índices de eficacia, obtendrá una puntuación de aproximadamente 0,08σ más alta que un estudiante
similar asignado a un maestro del cuartil inferior. Las observaciones en el aula y las rúbricas no son nuevas para
las escuelas ni para los investigadores en educación. Aún así, nuestros datos son novedosos en algunos
aspectos. Lo más notable es que nuestros datos de observación fueron recopilados por compañeros maestros,
el observador y el observado eran compañeros de trabajo en la misma escuela, y los observadores recibieron
poca capacitación, mucha menos capacitación de la que a menudo se describe como necesaria para
observaciones "válidas" o "confiables". Al final, encontramos que las calificaciones de los pares sobre la eficacia
de la instrucción predicen al menos tan bien como se ha documentado en otros estudios. Par
21
la observación puede ser un enfoque factible y efectivo para aprender sobre las diferencias en la
enseñanza, incluso con poca capacitación adicional para los observadores.
Una forma de pensar en la magnitud de nuestras estimaciones es preguntarse qué significaría una
mejora de 0,08σ en las puntuaciones de GCSE para el futuro de un estudiante. De hecho, los puntajes de GCSE
son quizás más relevantes para el futuro de los estudiantes, en comparación con las pruebas a edades más
tempranas, porque los GCSE llegan al final de la educación obligatoria y también informan sobre las admisiones
a la universidad. En un nuevo análisis, Hodge, Little y Weldon (2021) estiman que un aumento de una desviación
estándar, 1σ, en los puntajes promedio de GCSE predice un aumento de alrededor del 20 por ciento en las
ganancias de por vida (VPN a los 16 años). Por lo tanto, a partir de 0,08σ, predeciríamos un aumento del 1,6 % en
los ingresos de por vida, o alrededor de 7500 libras esterlinas en valor actual a los 16 años.
22
Referencias
Angrist, J., Hull, P., Pathak, PA y Walters, C. (en prensa). “Valor escolar creíble-
agregado con loterías escolares suscritas”.Revista de Economía y
Estadística.
Aucejo, Esteban, Patrick Coate, Jane Cooley Fruehwirth, Sean Kelly y Zachary
Mozenter. (2020). "Efectos de coincidencia en el mercado laboral docente:
eficacia docente y composición del aula". Hoja de trabajo.
Aucejo, Esteban M., and Teresa Foy Romano. (2016). “Evaluar el efecto de
días de escuela y ausencias en el rendimiento de la puntuación de la prueba”,Revista de economía de la
educación 55, 70-87.
Araujo, M. Caridad, Pedro Carneiro, Yyannú Cruz-Aguayo and Norbert Schady.

(2016). “Calidad de los maestros y resultados de aprendizaje en el jardín de infantes”.
Revista trimestral de economía, 131(3), 1415-1453.
Aslam, Monazza y Geeta Kingdon. (2011). “¿Qué pueden hacer los maestros para educar a los alumnos?
¿logro?"Revista de Economía de la Educación, 30(3), 559-574
Bacher-Hicks, Andrew, Mark J. Chin, Thomas J. Kane y Douglas O. Staiger.
(2019). “Una evaluación experimental de tres medidas de calidad docente: valor
agregado, observaciones en el aula y encuestas de estudiantes”.Revista de Economía de
la Educación, 73, 101919.
Ballatore, Rosario María, and Paolo Sestito. (2016). “Tratar con el estudiante
heterogeneidad: estrategias de implementación del currículo y rendimiento estudiantil”. Banco
de Italia Temi di Discussione (Documento de trabajo) No. 1081.
Bloom, Nicholas y John Van Reenen. (2007). “Medir y explicar

Prácticas de gestión entre empresas y países”.Revista trimestral de
economía, 122(4), 1351–1408.
Bloom, Nicholas, Benn Eifert, Aprajit Mahajan, David McKenzie y John
Roberts. (2013). “¿Importa la gestión? Evidencia de la India”.Revista
trimestral de economía, 128(1), 1–51.
Bloom, Nicholas, Renata Lemos, Raffaella Sadun y John Van Reenen. (2015).
“¿Importa la gestión en las escuelas?”Diario Económico, 125(584), 647-674.
Burgess, Simon, Shenila Rawal y Eric S. Taylor. (2021). “Maestro compañero
Observación y puntajes de las pruebas de los estudiantes: evidencia de un experimento de
campo en las escuelas secundarias de inglés”.Revista de Economía Laboral, 39(4), 1155-1186.
23
Campbell, Shanyce L. y Matthew Ronfeldt. (2018). “Evaluación observacional
de maestros: ¿Midiendo más de lo que esperábamos?”Revista de investigación educativa
estadounidense, 55(6), 1233–1267.
Chetty, Raj, John N. Friedman y Jonah E. Rockoff. (2014). “Medición de la

impactos de los docentes I: valor agregado de los docentes y resultados de los estudiantes en
la edad adulta”.Revista Económica Estadounidense, 104(9), 2593-2632.
Danielson, Charlotte. (2007).Mejorar la práctica profesional: un marco para

enseñando. Asociación para la Supervisión y Desarrollo Curricular,
Alejandría, VA.
Duflo, Esther, Pascaline Dupas y Michael Kremer. (2011). “Efectos de pares, maestro
incentivos y el impacto del seguimiento: Evidencia de una evaluación aleatoria en
Kenia”.Revista Económica Estadounidense, 101(5), 1739-1774.
Fitzpatrick, Maria D., David Grissmer y Sarah Hastedt. (2011). "Qué

la diferencia que hace un día: estimar las ganancias de aprendizaje diarias durante el jardín de
infantes y el primer grado usando un experimento natural”.Revista de economía de la educación 30,
269-279.
Gitomer, Drew, Courtney Bell, Yi Qi, Daniel McCaffrey, Bridget K. Hamre y

Roberto C. Pianta. (2014). “El desafío educativo para mejorar la calidad de la
enseñanza: lecciones de un protocolo de observación en el aula”.Registro del Colegio
de Maestros, 116(6), 1–20.
Graham, Bryan S., Geert Ridder, Petra Thiemann y Gema Zamarro. (2021).
“Asignación de maestro a salón de clases y rendimiento de los estudiantes”. Hoja de trabajo.
Hanushek, Eric A. y Steven G. Rivkin. (2010). “Generalizaciones sobre el uso

medidas de valor agregado de la calidad del maestro”.Revista Económica Estadounidense, 100
(2), 267-271.
Hayward, Hugh, Emily Hunt y Anthony Lord. (2014).El valor económico de
calificaciones intermedias clave: estimación de los rendimientos y ganancias de
productividad de por vida para GCSE, niveles A y aprendizajes.Departamento de
Educación Informe DFE-RR398A.Londres: Departamento de Educación.
Ho, Andrew D. y Thomas J. Kane. (2013).La confiabilidad del aula

Observaciones del Personal Escolar.Seattle, WA: Fundación Bill y Melinda
Gates.
Hodge, Louis, Allan Little y Matthew Weldon. (2021).Logro de GCSE y
ganancias de por vida.Informe de Investigación del Departamento de Educación.
24
ICPSR. (Dakota del Norte). “Medidas de Enseñanza Efectiva: 3c - Datos Base: Nivel de ítem
Puntuaciones observacionales, 2009-2011 Descripción de variables y frecuencias”.
ICPSR 34346.
Jackson, C. Kirabo, Jonah E. Rockoff y Douglas O. Staiger. (2014). "Maestro

efectos y políticas docentes”.Revista Anual de Economía, 6(1), 801-825.
Jacob, Brian A. y Lars Lefgren. (2008). “¿Pueden los directores identificar

maestros? Evidencia sobre evaluación subjetiva del desempeño en educación”.
Revista de Economía Laboral, 26(1), 101-136.
Kane, Thomas J., Daniel F. McCaffrey, Trey Miller y Douglas O. Staiger.
(2013).¿Hemos identificado maestros efectivos? Validación de medidas de
enseñanza efectiva mediante asignación aleatoria.Seattle, WA: Fundación Bill y
Melinda Gates.
Kane, Thomas J. y Douglas O. Staiger. (2008). “Estimar los impactos de los maestros en
rendimiento estudiantil: una evaluación experimental”. Documento de trabajo NBER núm.
14607.
Kane, Thomas J. y Douglas O. Staiger. (2012).Recopilación de comentarios para

Enseñanza: combinación de observaciones de alta calidad con encuestas de estudiantes y
ganancias de rendimiento.Seattle, WA: Fundación Bill y Melinda Gates.
Kane, Thomas J., Eric S. Taylor, John H. Tyler y Amy L. Wooten. (2011).
"Identificación de prácticas efectivas en el aula utilizando datos de rendimiento de los
estudiantes".Revista de Recursos Humanos, 46(3), 587-613.
Kingdon, Geeta, Rukmini Banerji R y PK Chaudhary. (2008).EscuelaTELLS

Encuesta de escuelas primarias rurales en Bihar y Uttar Pradesh, 2007–08.Londres:
Instituto de Educación, Universidad de Londres.
Kraft, MA y Gilmour, AF (2017). “Revisando el efecto del widget: Profesor

las reformas de evaluación y la distribución de la eficacia docente”.Investigador
Educativo, 46(5), 234-249.
Lazear, Edward P. (2001). “Producción educativa”.Revista trimestral de
Economía, 116(3), 777-803.
Lazear, Edward P. (2006). “Exceso de velocidad, terrorismo y enseñanza para la prueba”.
Revista trimestral de economía, 121(3), 1029-1061.
MacIntosh, Steven. (2006). “Análisis adicional de los retornos a la educación y
cualificaciones vocacionales."Boletín de Oxford de Economía y Estadística, 68(2),
225-251.
25
Prendergast, C. (1999). “La provisión de incentivos en las empresas”.Diario de Economía
literatura, 37(1), 7-63.
Rockoff, Jonah E. y Cecilia Speroni. (2010). "Subjetivo y objetivo
evaluaciones de la eficacia docente”.Revista Económica Estadounidense, 100(2),
261-266.
Rockoff, Jonah E., Douglas O. Staiger, Thomas J. Kane y Eric S. Taylor. (2012).
“Información y evaluación de empleados: evidencia de una intervención
aleatoria en escuelas públicas”.Revista Económica Estadounidense, 102(7),
3184-3213.
Rothstein, J. (2010). “Calidad docente en la producción educativa: seguimiento, decadencia,

y rendimiento estudiantil”.Revista trimestral de economía, 125(1), 175-214.
Sims, David P. (2008). “Respuestas estratégicas a las medidas de responsabilidad escolar: es

todo en el tiempo.”Revista de Economía de la Educación, 27, 58-68.
Slater, Helen, Neil M. Davies y Simon Burgess. (2012). “¿Importan los maestros?
Midiendo la variación en la efectividad de los maestros en Inglaterra”.Boletín de
Oxford de Economía y Estadística, 74(5), 629-645.
Syverson, Chad. (2011). “¿Qué determina la productividad?”Diario de Economía

literatura, 49(2), 326-265.
Taylor, Eric S. (2018). “Habilidades, tareas laborales y productividad en la docencia: Evidencia
de un ensayo aleatorio de prácticas de instrucción”.Revista de Economía Laboral, 36(
3), 711-742.
Taylor, Eric S. y John H. Tyler. (2012). “El efecto de la evaluación en el maestro

actuación."Revista Económica Estadounidense, 102(7), 3628-3651.
Weisberg, D., Sexton, S., Mulhern, J., Keeling, D., Schunck, J., Palcisco, A. y
Morgan, K. (2009).El efecto widget: Nuestro fracaso nacional para reconocer y actuar
sobre las diferencias en la efectividad de los docentes.Nueva York; El Proyecto Nuevo
Maestro.
26
Medir la comprensión de los estudiantes 24 28 48
Debate abierto entre alumnos y profesor. 25 38 38
Uso de pizarra blanca por parte del profesor. 32 36 32
Los estudiantes están haciendo el trabajo escrito solos. 38 36 26
Los estudiantes están trabajando en grupos. 54 26 19
Pasar tiempo especial para ayudar a los estudiantes débiles. 38 44 18
Lectura o dictado 52 35 13
Asignar tareas o trabajos de clase a los estudiantes 69 20 11
Enseñanza uno a uno 52 38 10
Estudiantes copiando de la pizarra 68 27 5
Profesor usando un libro de texto durante las actividades de enseñanza 88 7 5
Se dedica a labores no docentes 88 8 4
0 20 40 60 80 100
Porcentaje de clases
Nada o muy poco Algo de tiempo La mayoría o todo el tiempo
Figura 1—Frecuencia de las actividades de instrucción
Nota: Para cada actividad, la barra roja (izquierda) es la proporción de clases donde hubo “ninguna” o “muy poca” actividad. La barra azul
(derecha) es la proporción de clases en las que la actividad estaba ocurriendo "la mayor parte del tiempo" o "a tiempo completo". La barra
blanca (del medio) es "algunas veces". Las proporciones son de 2.687 observaciones, cada una de las cuales es la visita de un compañero
observador. a la clase del maestro .
27
(A) Puntuaciones a nivel de ítem
(B) Promedio de las puntuaciones de los ítems
Figura 2—Distribución de las calificaciones de efectividad de la instrucción
Nota: El panel A muestra un histograma de las 23 047 puntuaciones a nivel de ítem registradas en los diez ítems de la rúbrica. El panel B muestra un
histograma de 2687 puntajes promedio. Cada una de las 2687 observaciones es la visita de un compañero observador a la clase del maestro .El eje x es
el promedio simple de las puntuaciones de los diez ítems para una visita de observación dada, ignorando las puntuaciones de los ítems faltantes.
28
Tabla 1—Actividades de instrucción
Actividades utilizadas por los observadores Grupo de actividades
1. Debate abierto entre alumnos y profesor Interacción entre estudiantes y compañeros
2. Los estudiantes están trabajando en grupos.
3. Enseñanza uno a uno Instrucción personalizada
4. Pasar tiempo especial para ayudar a los estudiantes débiles
5. Los estudiantes están haciendo trabajos escritos solos Práctica y evaluación
6. Medir la comprensión de los estudiantes (p. ej., a través de

una evaluación escrita u oral)
7. Asignar tareas o trabajos de clase a los estudiantes
8. Lectura o dictado (transacción unidireccional, el Instrucción directa

maestro hablaba y los estudiantes escuchaban)
9. Estudiantes copiando de la pizarra
10. Uso de la pizarra por parte del docente
11. El maestro estaba usando un libro de texto durante las

actividades de enseñanza (uso de ejemplos del texto,
tomando referencias del texto, leyendo las líneas del capítulo)
12. Dedicado a trabajos no docentes (mantenimiento de

registro, preparación de datos, preparación de
formatos, etc.)
Nota: Lista de actividades adaptada del proyecto SchoolTELLS (Kingdon, Banerji y Chaudhary 2008). La agrupación de
actividades en la columna de la derecha se describe en el texto.
29
Tabla 2—Estándares de la rúbrica y descripción asociada de “Efectivo”
Dominio 1. Entorno del aula
1.a Las interacciones en el aula, tanto entre el maestro y los estudiantes

Creando un Ambiente como entre los estudiantes, son educadas y respetuosas, reflejan
de Respeto y Relación calidez y cariño en general, y son apropiadas para las diferencias
culturales y de desarrollo entre los grupos de estudiantes.
1.b La cultura del salón de clases se caracteriza por altas expectativas para la
Establecer una cultura para el mayoría de los estudiantes y un compromiso genuino con la materia tanto
aprendizaje por parte del maestro como de los estudiantes, con el maestro
demostrando entusiasmo por el contenido y los estudiantes demostrando
orgullo por su trabajo.
1.c Se pierde poco tiempo de enseñanza debido a las rutinas del salón de clases
Gestión del aula y los procedimientos para las transiciones, el manejo de los útiles y el
Procedimientos desempeño de las tareas no docentes, que ocurren sin problemas. El
trabajo en grupo está bien organizado y la mayoría de los estudiantes se
involucran productivamente mientras trabajan sin supervisión.
1.d Los estándares de conducta parecen ser claros para los estudiantes, y el
Estudiante administrador maestro monitorea el comportamiento del estudiante contra esos
Comportamiento estándares. La respuesta del maestro al mal comportamiento de los
estudiantes es consistente, proporcionada, apropiada y respeta la dignidad
de los estudiantes.
1.e El salón de clases es seguro y el aprendizaje es accesible para todos

Organización Física los estudiantes; el profesor se asegura de que la disposición física
Espacio sea adecuada para las actividades de aprendizaje. El docente hace un
uso eficaz de los recursos físicos, incluida la tecnología informática.
30
Tabla 2 (cont.)—Estándares de la rúbrica y descripción asociada de “Efectivo”
Dominio 2. Instrucción
2a Las expectativas de aprendizaje, las instrucciones y los procedimientos, y las

comunicarse con explicaciones del contenido son claras para los estudiantes.
Estudiantes Las comunicaciones son precisas y apropiadas para las culturas y los
niveles de desarrollo de los estudiantes. La explicación del contenido por
parte del maestro es estructurada, clara y precisa y se conecta con el
conocimiento y la experiencia de los estudiantes. Durante la explicación
del contenido, el maestro se enfoca, según corresponda, en las
estrategias que los estudiantes pueden usar cuando trabajan de forma
independiente e invita a la participación intelectual de los estudiantes.
2b La mayoría de las preguntas del maestro provocan una

Uso de preguntas y respuesta reflexiva, y el maestro da suficiente tiempo para que
Técnicas de discusión los estudiantes respondan. Todos los estudiantes participan en
la discusión, y el maestro se hace a un lado cuando
corresponde.
2c Las actividades y asignaciones, los materiales y las agrupaciones de

Involucrar a los estudiantes en estudiantes son completamente apropiados para los resultados de
Aprendiendo aprendizaje y las culturas y niveles de comprensión de los estudiantes.
Todos los estudiantes están comprometidos en un trabajo de alto nivel de
rigor. La estructura de la lección es coherente, con un ritmo adecuado.
2d La evaluación se usa regularmente en la enseñanza, a través de la autoevaluación

Uso de la evaluación o la evaluación por parte de los estudiantes, el seguimiento del progreso del
aprendizaje por parte del maestro y/o los estudiantes, y la retroalimentación de
alta calidad para los estudiantes. Los estudiantes son plenamente conscientes de
los criterios de evaluación utilizados para evaluar su trabajo y lo hacen con
frecuencia.
2e El maestro promueve el aprendizaje exitoso de todos los estudiantes,

Demostrar flexibilidad y haciendo los ajustes necesarios a los planes de lecciones y
capacidad de respuesta acomodando las preguntas, necesidades e intereses de los
estudiantes.
Nota: Adaptado deMarco para la enseñanza(Danielson 2007).
31
Tabla 3—Características descriptivas
Escuelas
con cualquier
Experimento observado Observado

escuelas maestro Profesores
(1) (2) (3)
Puntaje previo de inglés 0.006 0.009 0.039

(1.00) (1.00) (0.98)
Puntuación previa en matemáticas 0.007 0.008 0.058
(1.00) (1.00) (0.97)
Femenino 0.487 0.488 0.480
IDACI 0.276 0.279 0.314
(0.17) (0.17) (0.18)
Alguna vez comidas escolares gratuitas 0.398 0.402 0.426
Mes de nacimiento (1-12) 6.569 6.579 6.581
(3.42) (3.42) (3.39)
escuela de londres 0.162 0.164 0.180
Nota: Medias y desviaciones estándar (entre paréntesis) para las muestras descritas por los encabezados de las columnas.
32
Tabla 4—Correlaciones entre actividades de instrucción
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)
1. Debate abierto entre alumnos y profesor 1
2. Los estudiantes están trabajando en grupos. 0.19 1
3. Enseñanza uno a uno 0.01 0.11 1
4. Pasar tiempo especial para ayudar a los estudiantes débiles 0.08 0.14 0.39 1
5. Los estudiantes están haciendo trabajos escritos solos - 0.09 - 0,12 0,17 0,14 1
6. Medir la comprensión de los estudiantes 0.24 0.17 0.09 0.17 0.22 1
7. Asignar tareas o trabajos de clase a los estudiantes 0.08 0.14 0.09 0.14 0.20 0.23 1
8. Lectura o dictado - 0.09 - 0.11 - 0,04 -0,08 0,04 -0,02 0,12 1
9. Estudiantes copiando de la pizarra 0.00 - 0.06 - 0,01 0,01 0,07 0,03 0,12 0,31 1
10. Uso de la pizarra por parte del docente 0.05 - 0.08 - 0,03 0,00 0,00 0,13 0,09 0,29 0,33 1
11. Uso de un libro de texto durante las actividades de enseñanza - 0,04 0,04 0,07 0,05 0,10 0,04 0,15 0,10 0,19 0,04 0,00 0,07 0,08 0,05 1
12. Comprometidos en trabajos no docentes 0,20 0,08 0,26 0,07 0,13 0,05 0.20
Nota: Correlaciones del uso del tiempo de clase entre doce actividades de instrucción, netas de los efectos del observador. Cada una de las 2687 observaciones es la visita de un compañero
observador a la clase del maestro .Los observadores registraron el uso del tiempo en cinco categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4)
tiempo completo. Antes de estimar las correlaciones, primero calculamos observador 's media para cada elemento y restar esa media de todos los puntajes asignado para ese artículo.
33
Tabla 5—Actividades de instrucción
Matriz de correlación Media (desviación estándar)
agrupados agrupados Matemáticas Inglés

(1) (2) (3) (4) (5) (6) (7)
Instrucción directa 1 1.23 1.36 1.06

(0.71) (0.72) (0.66)
Interacción entre estudiantes y compañeros 0.17 1 1.68 1.71 1.66
(0.93) (0.91) (0.94)
Instrucción personalizada 0.21 0.31 1 1.44 1.52 1.34
(0.92) (0.91) (0.92)
Práctica y evaluación 0.37 0.28 0.35 1 1.58 1.73 1.38
(0.91) (0.86) (0.95)
Nota: Medias y desviaciones estándar (columnas 5-7) para, y correlaciones entre (columnas 1-4), uso del tiempo de clase en cuatro grupos de
actividades de instrucción, descritos por etiquetas de fila. Esta tabla utiliza una muestra de 2687 observaciones. Cada una de las 2687
observaciones es la visita de un compañero observador a la clase del maestro .Cada una de las cuatro medidas (filas) es en sí misma el
promedio de varios puntajes de nivel de elemento registrados por observadores pares, como se describe en el texto. El uso del tiempo se mide
en categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4) tiempo completo.
34
Tabla 6—Clasificaciones de eficacia de la instrucción
agrupados Matemáticas Inglés

(1) (2) (3)
Media general 9.09 9.15 9.00

(1,75) (1,80) (1,69)
Ambiente de clase promedio 9.27 9.35 9.17

(1,84) (1,88) (1,78)
1a. Crear un ambiente de respeto y compenetración 9.32 9.35 9.28
(2,04) (2,09) (1,97)
1b. Establecer una cultura para el aprendizaje. 9,20 9,25 9,13
(2,01) (2,04) (1,96)
1c. Gestionar los procedimientos del aula. 9.24 9.31 9.14
(2.04) (2.06) (2.01)
1d. Manejar el comportamiento de los estudiantes 9.41 9.42 9.41
(2,05) (2,12) (1,96)
1e. Organización del espacio físico. 9.13 9.29 8.87
(2.18) (2.14) (2.23)
Promedio de instrucción 8.90 8.94 8.86

(1,83) (1,87) (1,77)
2a. Comunicarse con los estudiantes 9.29 9.31 9.25
(1,91) (1,95) (1,85)
2b. Uso de técnicas de preguntas y debate. 8.77 8.80 8.72
(2.17) (2.16) (2.18)
2c. Involucrar a los estudiantes en el aprendizaje 8.99 9.03 8.93
(2.00) (2.09) (1.86)
2d. Uso de la evaluación 8.50 8.53 8.46
(2.21) (2.19) (2.23)
2e. Demostrando flexibilidad y capacidad de respuesta. 8,83 8,78 8,90
(2.05) (2.08) (2.01)
Nota: Medias y desviaciones estándar (entre paréntesis), usando una muestra de 2687 observaciones en la columna 1. Cada una de las 2687
observaciones es la visita de un observador par a la clase del maestro .Las muestras de las columnas 2 y 3 son 1.510 y 1.177 respectivamente.
Para cada uno de los diez elementos enumerados anteriormente, los observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3
ineficaz, 4 a 6 básico, 7 a 9 eficaz y 10 a 12 muy eficaz. Los tres puntajes promedio anteriores son la media de los puntajes de nivel de elemento
relevantes, ignorando los puntajes faltantes.
35
Tabla 7—Actividades educativas y puntajes de rendimiento estudiantil
(1) (2) (3) (4) (5) (6)

(A) Matemáticas
Actividades de instrucción
Instrucción directa 0.012 0.006 0.023 0.009
(0.016) (0.007) (0.015) (0.007)
Interacción entre estudiantes y compañeros 0.020 0.007 0.002 0.001
(0.013) (0.006) (0.014) (0.008)
Instrucción personalizada 0.004 0.003 0.003 0.003
(0.019) (0.008) (0.019) (0.008)
Práctica y evaluación 0,068** 0.023** 0.047* 0.015+
(0.019) (0.008) (0.019) (0.008)
Eficacia educativa 0.070** 0.024* 0.077** 0.026**

(0.018) (0.010) (0.017) (0.010)
(B) Inglés
Instrucción directa - 0.018 - 0.024+ - 0.009 - 0.019
(0.020) (0.013) (0.019) (0.012)
Interacción entre estudiantes y compañeros 0.053** 0.028** 0.043** 0.024**
(0.016) (0.009) (0.016) (0.009)
Instrucción personalizada - 0.021 - 0.011 - 0.026+ - 0.014
(0.013) (0.009) (0.014) (0.009)
Práctica y evaluación - 0.024 - 0.015 - 0.030+ - 0.021+
(0.016) (0.011) (0.017) (0.012)
Eficacia educativa 0.039+ 0.027* 0.040* 0.026*

(0.021) (0.011) (0.019) (0.010)
Estudiante covariables √ √ √
Estudiante efectos fijos √ √ √
Nota: Estimaciones puntuales y conglomerados (profesor )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una
con la misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Cada columna
informa estimaciones de una sola regresión. La variable dependiente es un puntaje de prueba para el estudiante en tema (matemáticas o
inglés) medido en unidades de desviación estándar del estudiante. Las variables independientes clave, las filas en la tabla, son puntajes de
observación para el estudiante. 'profesor en tema ,dónde = ( ).Los puntajes de los maestros se miden en unidades de desviación estándar
del maestro. Maestro 'Las puntuaciones no varían entre los estudiantes, pero sí entre los observadores. quien determinaba las puntuaciones.
Los datos utilizados para ajustar cada regresión son estudiantes por profesor (sujeto equivalente )por observador ,pero cada uno el par se
pondera por igual, es decir, se pondera1/ dónde es el número de observadores Quien anoto
maestro .Todas las especificaciones incluyen observador efectos fijos y variables indicadoras por sujeto. Las “covariables del estudiante” incluyen
controles para el estudiante 's puntajes de exámenes anteriores en ambas materias, género, elegibilidad para comidas escolares gratuitas, puntaje
IDCACI, mes de nacimiento, año de examen y escuelas en Londres. Todas las especificaciones incluyen controles para la media de la clase y la desviación
estándar de las puntuaciones anteriores en ambas materias. Cuando falta una covariable, la completamos con cero e incluimos un indicador = 1 para
falta en la característica dada.
+ indica p<0,10, * 0,05 y ** 0,01
36
Apéndice A: Figuras y tablas adicionales
(A) Matemáticas
Asignar tareas o trabajos de clase a los estudiantes sesenta y cinco 21 14
0 20 40 60 80 100
Porcentaje de clases de matemáticas
(B) Inglés
Asignar tareas o trabajos de clase a los estudiantes 75 18 7
0 20 40 60 80 100
Porcentaje de clases de inglés
Figura A1 del apéndice—Frecuencia de las actividades de instrucción, por tema
Nota: Para cada actividad, la barra roja (izquierda) es la proporción de clases donde hubo “ninguna” o “muy poca” actividad. La barra azul
(derecha) es la proporción de clases en las que la actividad estaba ocurriendo "la mayor parte del tiempo" o "a tiempo completo". La barra gris
(del medio) es "algunas veces". El panel A es para clases de matemáticas, y las proporciones son de 1510 observaciones, cada una de las cuales
es la visita de un compañero observador k a la clase de un profesor de matemáticas j. El panel B es para las clases de inglés y se basa en 1177
observaciones.
37
Apéndice figura A2—Distribución de calificaciones de efectividad de instrucción,
puntajes a nivel de ítem, escala de 4 puntos
Nota: Histograma de las 23 047 puntuaciones a nivel de elemento registradas en los diez elementos de la rúbrica. Esta figura muestra los mismos datos a
nivel de ítem que el panel A de la figura 2, excepto que la escala de puntajes de 12 puntos se ha reducido a una escala de 4 puntos: los puntajes 1-3 en el
panel A se convierten en puntajes de 1 en el panel B, 4-6 se convierten en 2, 7-9 se convierten en 3 y 10-12 se convierten en 4.
38
Tabla A1 del apéndice: correlaciones entre las calificaciones de eficacia de la instrucción
(1a) (1b) (1c) (1d) (1e) (2a) (2b) (2c) (2d) (2e)
1a. Crear un ambiente de respeto y compenetración 1
1b. Establecer una cultura para el aprendizaje 0.86 1
1c. Manejar los procedimientos del salón de clases 0.79 0.81 1
1d. Manejar el comportamiento de los estudiantes 0.79 0.80 0.82 1
1e. Organización del espacio físico 2a. 0.68 0.68 0.69 0.67 0.74 0.76 1 0.72 0.71 0.65 0.65 0.67
Comunicarse con los estudiantes 0.63 0.61 0.55 0.75 0.73 0.77 0.71 1 0.72 0.61 0.79 0.76
2b. Usar técnicas de cuestionamiento y discusión 2c. 0.62 0.65 0.63 0.59 0.58 0.66 0.68 0.72 0.70 1 0.71 0.66
Involucrar a los estudiantes en el aprendizaje 0.66 0.62 0.62 1
2d. Uso de la evaluación 1
2e. Demostrando flexibilidad y capacidad de respuesta. 1
Nota: Correlaciones de las calificaciones de eficacia de la instrucción basadas en rúbricas entre diez tareas, utilizando una muestra de 2687 observaciones. Cada una de las 2687 observaciones es la
visita de un observador par a la clase del maestro .Los observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3 ineficaz, 4 a 6 básica, 7 a 9 eficaz y 10 a 12 muy eficaz.
39
Tabla A2 del apéndice—Componentes principales de las calificaciones de la eficacia de la instrucción
Neto de observador
unidades originales efectos fijos
Componente Componente
1 2 1 2
(1) (2) (3) (4)
Peso en componente
1a. Crear un ambiente de respeto y compenetración 1b. 0.33 - 0,27 0.33 - 0,28
Establecer una cultura para el aprendizaje. 0.33 - 0,23 0.34 - 0,25
1c. Manejar los procedimientos del salón de clases 0.32 - 0,34 0.32 - 0,37
1d. Manejar el comportamiento de los estudiantes 0.32 - 0,37 0.32 - 0,38
1e. Organización del espacio físico 2a. Comunicarse 0.29 - 0,30 0.27 - 0,20
con los estudiantes 0.33 0.16 0.33 0.18
2b. Usar técnicas de cuestionamiento y discusión 2c. 0.30 0.44 0.30 0.44
Involucrar a los estudiantes en el aprendizaje 0.33 0.22 0.33 0.21
2d. Uso de la evaluación 0.30 0.39 0.29 0.41
2e. Demostrando flexibilidad y capacidad de respuesta. 0.31 0.33 0.31 0.32
valor propio 7.43 0,69 6.60 0.78

Proporción de variación explicada 0.74 0.07 0,66 0.08
Nota: Análisis de componentes principales de las calificaciones de eficacia educativa basadas en rúbricas entre diez tareas, utilizando una
muestra de 2687 observaciones. Cada una de las 2687 observaciones es la visita de un observador par a la clase del maestro .Los
observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3 ineficaz, 4 a 6 básica, 7 a 9 eficaz y 10 a 12 muy eficaz. El cuerpo principal de
la tabla informa las cargas de los componentes, donde las cargas son los pesos asignados a cada elemento (filas) al calcular la puntuación de
un componente determinado (columnas). Las columnas 1-2 informan los componentes 1-2 utilizando índices de efectividad no ajustados,
según lo registrado por el observador .Las columnas 3 y 4 informan los componentes 1 y 2 utilizando índices de efectividad netos de los
efectos fijos del observador. Para las columnas 3-4, antes del análisis de componentes principales, primero calculamos el observador 's media
para cada elemento y restar esa media de todos los puntajes asignado para ese artículo.
40
Tabla A3 del apéndice—Características, actividades y calificaciones de los estudiantes
Clase
st.desv. Siempre libre
Prueba previa prueba previa Mes de escuela IDACI

puntaje puntaje Femenino nacimiento comidas puntaje
(1) (2) (3) (4) (5) (6)

(A) Actividades educativas, matemáticas
Instrucción directa 0,002 0,006 - 0,004 (0,039) 0.000 0.002 - 0,006**

(0,018) (0,009) (0.042) (0.008) (0.002)
Interacción entre estudiantes y compañeros - 0,033 0,017 - 0,002 (0,045) 0.010 - 0.012 0.002
(0,020) (0,009) (0.044) (0.011) (0.002)
Instrucción personalizada - 0,026 - 0,014 0,014+ - 0.051 0.003 0.001
(0,029) (0,019) (0,007) (0.039) (0.007) (0.002)
Práctica y evaluación - 0,029 0,011 0,007 (0,031) 0.110** 0.008 - 0.001
(0,019) (0,007) (0.037) (0.009) (0.003)
(B) Eficacia educativa, matemáticas
Eficacia educativa 0.057+ 0.001 0.005 0.016 - 0.008 - 0.001
(0,034) (0,016) (0,011) (0.036) (0.009) (0.002)
(C) Actividades de instrucción, inglés
Instrucción directa 0,022 - 0,008 - 0,012 (0,043) - 0.060 - 0,010 - 0,006+
(0,019) (0,010) (0.050) (0,011) (0,003)
Interacción entre estudiantes y compañeros 0,018 0,026 - 0,013 (0,035) - 0.036 - 0,011 - 0,005
(0,017) (0,008) (0.044) (0.012) (0.003)
Instrucción personalizada - 0,024 - 0,014 0,005 (0,031) 0.034 0.009 0.003
(0,015) (0,009) (0.035) (0.009) (0.002)
Práctica y evaluación - 0,069+ 0,025 - 0,026** - 0,043 (0,040) 0.007 0.002
(0,019) (0,009) (0,051) (0.008) (0.003)
(D) Eficacia educativa, inglés
Eficacia educativa 0,073* - 0,006 0,012 0,033 (0,036) - 0,006 - 0,005+
(0,016) (0,009) (0,047) (0,010) (0,003)
Nota: Estimaciones puntuales y conglomerados (profesor )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una con la
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Cada columna dentro de cada panel
informa los resultados de una regresión separada. Todos los detalles de la estimación son los mismos que para la tabla 7 con estas excepciones: La
variable dependiente, descrita en el encabezado de cada columna, es una característica de referencia del estudiante. o estudiante 's compañeros de
clase para la materia .Los únicos controles son los efectos fijos del observador y el tiempo en el "trabajo no docente" para los paneles A y C.
+ indica p<0,10, * 0,05 y ** 0,01
41
Apéndice tabla A4—Diferencias por puntajes de exámenes anteriores de los estudiantes
agrupados Matemáticas Inglés

(1) (2) (3) (4) (5) (6)
(A) Calificación de la eficacia de la instrucción

Eficacia educativa 0.060** 0.074** 0.039*
(0.014) (0.017) (0.019)
Eficacia educativa - 0,027* -0,023* -0,030* -0,028+ - 0.016 - 0.008
* puntaje de prueba anterior (0,011) (0,012) (0,015) (0,016) (0.015) (0.014)
(B) Actividades de instrucción

Instrucción directa - 0.003 0.013 - 0.017
(0.012) (0.015) (0.020)
Instrucción directa - 0,008 -0,002 -0,025 -0,012 (0,011) 0.001 0.002
* puntaje de prueba anterior Interacción (0,011) (0,016) (0,016) 0,034** (0.015) (0.012)
entre estudiantes y compañeros 0.019 0.053**
(0.010) (0.014) (0.016)
Interacción entre estudiantes y compañeros - 0.001 - 0,006 0,002 0.001 - 0,001 - 0,006
* puntaje de prueba anterior (0.013) (0.014) (0.020) (0.022) (0.013) (0.012)
Instrucción personalizada - 0.004 0.006 - 0.022
(0.012) (0.019) (0.014)
Instrucción personalizada - 0,005 -0,010 -0,008 -0,009 -0,001 -0,006 (0,013) (0,014)
* puntaje de prueba anterior (0,021) (0,023) (0,016) (0,015) 0,020
Práctica y evaluación 0.070** - 0.024
(0.014) (0.019) (0.016)
Práctica y evaluación - 0,009 -0,007 -0,025 -0,026 (0,014) 0.005 0.004
* puntaje de prueba anterior (0,015) (0,023) (0,025) (0.014) (0.014)
Efectos fijos del profesor √ √ √
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Todos los detalles de la estimación
son los mismos que para la columna 5 de la tabla 7 con estas excepciones: Interactuamos con el maestro 's índice de eficacia de instrucción o uso de
actividades de instrucción con el estudiante 's puntaje de prueba anterior en materia ,recordar = ( ).En columnas con números pares, también
incluimos profesor efectos fijos
+ indica p<0,10, * 0,05 y ** 0,01
42
Apéndice B: Rúbrica de eficacia de la instrucción
DOMINIO 1: EL AMBIENTE DEL AULA

Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)
Las interacciones en el aula,

Las interacciones en el aula, Las interacciones en el aula,
Las interacciones en el aula, tanto entre el profesor y
tanto entre el profesor y los tanto entre el profesor y los
tanto entre el profesor y estudiantes y entre
alumnos como entre alumnos como entre
estudiantes y entre estudiantes, son altamente
estudiantes, son negativos, estudiantes, son generalmente
1a Creando un estudiantes, son corteses y respetuosa, reflejando
inapropiados o insensibles a la apropiados y libres de conflicto,
Ambiente respetuosos, reflejan calidez y genuina calidez y cariño y
cultura de los estudiantes. pero pueden reflejar muestras
de respeto cariño en general, y son sensibilidad a las culturas y
antecedentes, edades y ocasionales de
y relación apropiados para la cultura y niveles de desarrollo de los
niveles de desarrollo insensibilidad o falta de capacidad
el desarrollo estudiantes. Estudiantes
Las interacciones de los estudiantes se de respuesta a las diferencias
diferencias entre grupos de ellos mismos aseguran un alto
caracterizan por el sarcasmo, las culturales o de desarrollo entre los
estudiantes. niveles de civismo entre
humillaciones o el conflicto. estudiantes.
los miembros de la clase.
Los intentos del maestro por crear La cultura del aula se

Los altos niveles de energía de los
una cultura para el aprendizaje son caracteriza por una alta
El ambiente del salón de clases transmite estudiantes y la pasión de los maestros
parcialmente exitosos, con poco expectativas para la mayoría
una cultura negativa para el aprendizaje, por la materia crean una cultura de
compromiso del maestro con el estudiantes y genuinos
1b caracterizada por un bajo compromiso de aprendizaje en la que todos comparten
tema, modesto compromiso con la materia por
Estableciendo un los maestros con la materia, bajas la creencia en el
expectativas para el rendimiento de los parte del profesor y
Cultura para expectativas para el rendimiento de los importancia de la materia y
estudiantes y poco orgullo de los estudiantes, con el profesor
Aprendiendo estudiantes y poco o ningún orgullo por el todos los estudiantes se
estudiantes en el trabajo. Tanto el demostrando entusiasmo por el
trabajo de los estudiantes. mantienen en alto
maestro como los estudiantes parecen contenido y los estudiantes
estándares de desempeño
estar solo "haciendo los movimientos". demostrando orgullo por su
que han interiorizado.
trabajo.
43
DOMINIO 1: EL AMBIENTE DEL AULA (cont.)
Se pierde mucho tiempo de El tiempo de enseñanza se

Se pierde poco tiempo de
enseñanza debido a la ineficacia Se pierde algo de tiempo de maximiza debido a rutinas de
enseñanza debido al aula
rutinas de clase y enseñanza porque las rutinas y los clase eficientes y fluidas y
rutinas y procedimientos para
procedimientos para transiciones, procedimientos del aula para procedimientos. Estudiantes
transiciones, manejo de suministros
manejo de suministros y desempeño las transiciones, el manejo de contribuir al funcionamiento
1c Gestión y desempeño de tareas no docentes,
de funciones no docentes. Los suministros y el desempeño de fluido del aula
Aula que ocurren sin problemas. El
estudiantes que no trabajan con el funciones no docentes son solo rutinas y procedimientos para
Procedimientos trabajo en grupo está bien
maestro no participan parcialmente efectivos. Los transiciones, manejo de suministros
organizado y la mayoría de los
productivamente en el aprendizaje. estudiantes en algunos grupos son y desempeño de deberes no
estudiantes se involucran
Poca evidencia de que los participando productivamente sin instructivos. Los estudiantes en
productivamente mientras trabajan
estudiantes conozcan o sigan las la supervisión del maestro. grupos asumen la responsabilidad
sin supervisión
rutinas establecidas. de la productividad.
Los estándares de conducta son

claros, con evidencia de la
Los estándares de conducta parecen participación de los estudiantes en
No hay evidencia de que se
Parece que el maestro ha ser claros para los estudiantes, y el su establecimiento. El seguimiento
hayan establecido
hecho un esfuerzo para maestro monitorea el del profesor al estudiante.
estándares de conducta, y
establecer estándares de comportamiento del estudiante el comportamiento es sutil y
1d Gestión hay poca o ninguna
conducta para los estudiantes. El maestro contra esos estándares. El maestro preventivo, y la respuesta del
Alumno seguimiento del estudiante
intenta, con resultados desiguales, respuesta al estudiante maestro al estudiante
Comportamiento comportamiento. Respuesta a
monitorear el comportamiento de los el mal comportamiento es el mal comportamiento es sensible a las
el mal comportamiento del estudiante es
estudiantes y responder al mal consistente, proporcionado, necesidades individuales de los estudiantes y
represivo o irrespetuoso de la dignidad
comportamiento de los estudiantes. apropiado y respeta la dignidad respeta la dignidad de los estudiantes. Los
del estudiante.
de los estudiantes. estudiantes toman un papel activo en el
seguimiento de las normas de
comportamiento.
44
DOMINIO 1: EL AMBIENTE DEL AULA (cont.)
El salón de clases es seguro y el

El salón de clases es seguro y el
aprendizaje esencial es El salón de clases es seguro y el
entorno físico garantiza el
El entorno físico no es seguro accesible para la mayoría de los aprendizaje es accesible para todos
aprendizaje de todos los
o algunos estudiantes no estudiantes; el uso que hace el maestro los estudiantes; el maestro
estudiantes, incluidos aquellos
tienen acceso a de los recursos físicos, incluyendo asegura que el arreglo físico
1e Organización con necesidades especiales. Los
aprendiendo. Hay una tecnología informática, es sea apropiado para las
Físico estudiantes contribuyen al uso o
mala alineación entre los moderadamente eficaz. El actividades de aprendizaje. El
Espacio adaptación del entorno físico para
disposición física de muebles maestro puede intentar docente hace un uso eficaz de
avanzar
y recursos y las actividades modificar el físico los recursos físicos, incluidos
aprendiendo. La tecnología se usa
de la lección. arreglo para adaptarse a las actividades de los informáticos.
hábilmente, según corresponda a la
aprendizaje, con limitaciones tecnología.
lección.
eficacia.
45
DOMINIO 2: ENSEÑANZA
Las expectativas de aprendizaje, las

instrucciones y los procedimientos, y
las explicaciones del contenido son
claras para los estudiantes. El
Las expectativas de aprendizaje, las
profesor vincula el
instrucciones y los procedimientos, y las
propósito instructivo de la
explicaciones del contenido son claras
lección al más amplio
para los estudiantes.
plan de estudios. La oralidad y la
Las comunicaciones son
escritura del profesor.
precisos y apropiados para las
Las expectativas de aprendizaje, las Las expectativas de aprendizaje, las la comunicación es clara y
culturas y los niveles de
instrucciones y los procedimientos, y instrucciones y los procedimientos y las expresiva, apropiada a las
desarrollo de los estudiantes. La
las explicaciones del contenido no explicaciones del contenido se aclaran culturas de los estudiantes y
explicación del contenido por
están claras o son confusas para los después de la confusión inicial; el niveles de desarrollo y se
2a parte del docente es
estudiantes. El lenguaje hablado o lenguaje hablado o escrito del maestro anticipa a posibles conceptos
Comunicado estructurada, clara y
escrito del maestro contiene errores es correcto pero puede no ser erróneos de los estudiantes. El
con Estudiantes precisa y se conecta con el
o es completamente apropiado para las La explicación del contenido por
conocimiento y la experiencia de
inapropiado para las culturas de los culturas o niveles de desarrollo de los parte del docente es minuciosa y
los estudiantes. Durante el
estudiantes o los niveles de estudiantes. clara, desarrollando
explicación del contenido, el
desarrollo. comprensión conceptual a
profesor se centra, como
través de un andamiaje
apropiado, sobre estrategias que los
claro y conexión con
estudiantes pueden usar cuando
intereses de los estudiantes.
trabajan de forma independiente e
Los estudiantes contribuyen a
invita a la participación intelectual de
ampliar el contenido
los estudiantes.
explicando conceptos a sus
compañeros y sugiriendo
estrategias que se pueden
utilizar.
46
DOMINIO 2: ENSEÑANZA (cont.)
La mayoría de las preguntas del

Algunas de las preguntas del maestro Las preguntas reflejan alto
Las preguntas del maestro son de bajo maestro provocan una respuesta
provocan una respuesta reflexiva, pero expectativas y son
desafío cognitivo o inapropiadas, lo reflexiva, y el maestro da suficiente
2b usando la mayoría son de bajo nivel, planteadas culturalmente y
que provoca una participación limitada tiempo para que los estudiantes
Cuestionamiento y en forma rápida. evolutivamente
de los estudiantes y la recitación en respondan. Todos los estudiantes
Discusión sucesión. Los intentos del adecuado. Estudiantes
lugar de participan en la discusión, y el
Técnicas maestro de involucrar a todos los formule muchas de las preguntas
discusión. Unos pocos estudiantes maestro se hace a un lado cuando
estudiantes en la discusión solo de alto nivel y asegúrese de que se
dominan la discusión.
tienen un éxito parcial. escuchen todas las voces.
adecuado.
Las actividades y asignaciones, los Los estudiantes, a lo largo de la

Las actividades y asignaciones, los
materiales y las agrupaciones de lección, son altamente
Las actividades y asignaciones, los materiales y las agrupaciones de
estudiantes están parcialmente intelectualmente involucrados en
materiales y las agrupaciones de estudiantes están totalmente
apropiado para los resultados de un aprendizaje significativo y hacer
estudiantes son inapropiados para los apropiado para los resultados de
aprendizaje o de los estudiantes contribuciones materiales a las
resultados de aprendizaje o las culturas aprendizaje y de los estudiantes.
2c participación culturas o niveles de comprensión, actividades, grupos de estudiantes
o los niveles de comprensión de los culturas y niveles de comprensión.
Estudiantes en lo que resulta en un nivel intelectual y materiales. La lección se adapta
estudiantes, lo que genera poca Todos los estudiantes están
Aprendiendo moderado. según sea necesario a las
participación intelectual. La lección no comprometidos en un trabajo de
compromiso. La lección tiene una necesidades de los individuos, y el
tiene una estructura claramente alto nivel de rigor. La estructura de
estructura reconocible pero no se
definida o tiene un ritmo deficiente. la lección es
mantiene completamente y está la estructura y el ritmo permiten
coherente, con el ritmo
marcada por incoherencias. la reflexión y el cierre del
adecuado.
ritmo estudiante.
47
DOMINIO 2: ENSEÑANZA (cont.)
La evaluación se utiliza de manera

La evaluación se usa ocasionalmente La evaluación se usa regularmente en la sofisticada en la enseñanza, a través de
La evaluación no se utiliza en la en la enseñanza, a través de un enseñanza, a través de la autoevaluación la participación de los estudiantes en el
enseñanza, ya sea a través del seguimiento del progreso del o la evaluación por parte de los establecimiento de los criterios de
seguimiento del progreso por parte del aprendizaje por parte del maestro y/o estudiantes, el seguimiento del progreso evaluación, la autoevaluación o la
profesor o de los alumnos, o los estudiantes. La retroalimentación a del aprendizaje por parte del maestro y/o evaluación por parte de los estudiantes,
2d Uso de retroalimentación adecuada a los estudiantes es desigual, y los los estudiantes, y la retroalimentación de el seguimiento del progreso tanto por
Evaluación estudiantes. Los estudiantes no son estudiantes conocen solo algunos de alta calidad para los estudiantes. Los parte de los estudiantes como del
conscientes de los criterios de evaluación los criterios de evaluación utilizados estudiantes son plenamente conscientes maestro, y retroalimentación de alta
utilizados para evaluar su trabajo, ni para evaluar su trabajo. Los de los criterios de evaluación utilizados calidad para los estudiantes de una
participan en la autoevaluación o la estudiantes ocasionalmente evalúan su para evaluar su trabajo y lo hacen con variedad de fuentes. Los estudiantes
evaluación por pares. . propio trabajo o el de sus compañeros. frecuencia. usan auto-
evaluación y seguimiento para
dirigir su propio aprendizaje.
El maestro aprovecha la
oportunidad para mejorar
aprendizaje, basándose en
El maestro se adhiere al plan de El maestro intenta modificar la un evento espontáneo o
la lección, incluso cuando un lección cuando es necesario y El docente promueve el intereses de los estudiantes, o
cambio mejoraría la lección o responder a las preguntas de aprendizaje exitoso de todos los ajusta y diferencia con éxito la
2e abordaría la falta de interés de los alumnos, con un éxito estudiantes, haciendo instrucción para abordar los
demostrando los estudiantes. El maestro hace moderado. El ajustes según sea necesario a los malentendidos individuales de
Flexibilidad y a un lado al estudiante. el maestro acepta planes de lecciones y los estudiantes. El
Sensibilidad preguntas; cuando los estudiantes responsabilidad por el éxito de los estudiante complaciente el maestro asegura la
experimentan dificultades, el estudiantes, pero sólo tiene un preguntas, necesidades y el éxito de todos los estudiantes
maestro culpa a los estudiantes oa repertorio limitado de intereses. mediante el uso de un extenso
su entorno familiar. estrategias a las que recurrir. repertorio de enseñanza
estrategias y solicitar
recursos adicionales de la
escuela o la comunidad.
Nota: Adaptado deMarco para la enseñanza(Danielson 2007).
48
Apéndice C: Actividades de instrucción, componentes principales
Nuestro análisis principal divide las doce actividades de instrucción en cuatro categorías
mutuamente excluyentes y exhaustivas (como en las tablas 1, 5 y 7). Una caracterización alternativa son
los componentes principales de los doce elementos de actividad. La tabla C1 del apéndice muestra los
detalles de los componentes principales, y la tabla C2 del apéndice usa los puntajes de los componentes
para predecir los puntajes de GCSE de los estudiantes de manera similar a la tabla 7.
Hay compensaciones entre los dos enfoques. Los pesos complejos en el enfoque de
los componentes principales capturan (potencialmente) dimensiones latentes más matizadas
de la práctica docente. La desventaja es que los componentes principales son más difíciles de
describir con palabras. Por lo tanto, advertimos que las conclusiones sustantivas no deberían
depender de la "corrección" de las etiquetas abreviadas que adjuntamos a los componentes
principales. Por el contrario, los cuatro grupos simples son sencillos de entender, pero usan
menos variación en cómo se correlacionan las actividades.
La puntuación de cada componente principal es un promedio ponderado de las doce
actividades. Los pesos se muestran en el cuadro C1 del apéndice. Los primeros cinco componentes
principales juntos explican un poco más de la mitad de la variación en los datos de las actividades de
instrucción; cada uno de los cinco explica individualmente del 9 al 13 por ciento. Por construcción, las
puntuaciones de los componentes principales no están correlacionadas entre sí.1
Usamos las siguientes etiquetas para las puntuaciones de los componentes principales,
aunque otros pueden elegir etiquetas alternativas. (1) “Interacción estudiante-maestro”. El puntaje
de este componente aumenta en la cantidad de tiempo de clase en el que el maestro y los
estudiantes interactúan.2(2) “Grupos más pequeños versus toda la clase”. Esta puntuación aumenta
en actividades individuales y de grupos pequeños, y disminuye en actividades de toda la clase. (3)
“Práctica versus instrucción”. Esta puntuación está aumentando en los estudiantes.
1Antes de estimar los componentes principales, primero cambiamos la escala de los datos del elemento de actividades. Los
observadores registran la frecuencia de una actividad en una escala de 0 a 4 con 0 "ninguna" del tiempo a 4 "tiempo completo"
durante la observación. Para cambiar la escala, dividimos cada uno de los doce elementos por la suma de los elementos. Así, los
ítems reescalados miden la proporción de toda la actividad registrada por el observador.
2Con fines expositivos, invertimos el signo de los componentes (1), (2) y (3).
49
evaluación y práctica, y disminución en la instrucción, especialmente instrucción individualizada. (4)
“Trabajo en grupo versus trabajo individual”. Este puntaje aumenta en el tiempo en que los
estudiantes interactúan con sus compañeros de clase y disminuye en el tiempo en que los
estudiantes trabajan solos o uno a uno con el maestro. (5) “Aprendizaje guiado por el maestro”.
Esta puntuación aumenta al medir la comprensión y ayudar a los estudiantes débiles, y el uso de la
pizarra, y disminuye en la discusión abierta, los niños que trabajan solos y las conferencias
unidireccionales.
Los componentes principales de las actividades de instrucción sí predicen los puntajes de las pruebas
de los estudiantes, como se muestra en la tabla C2 del apéndice. Para los GCSE ingleses, el cuarto componente
principal se destaca de los demás. El coeficiente para el componente cuatro es 0,05σ, mientras que todas las
demás estimaciones son inferiores a 0,01σ y están lejos de ser estadísticamente significativas. Nuestra etiqueta
abreviada para el componente cuatro es “trabajo en grupo versus trabajo individual”; está aumentando en
actividades donde los estudiantes interactúan con sus compañeros de clase y disminuyendo en actividades
donde los estudiantes trabajan solos o uno a uno con el maestro.
Tanto el enfoque de los componentes principales, en el cuadro C2 del apéndice, como el
agrupamiento más simple de actividades, en el cuadro 7, terminan en una conclusión sustantiva similar
para predecir los puntajes de las pruebas de inglés. Ambos enfatizan actividades donde los estudiantes
interactúan con sus compañeros de clase. Pero estas no son dos pruebas independientes, y la similitud
general no debería sorprender. Ambos enfoques combinan actividades basadas en la misma matriz de
correlación del cuadro 4. Aún así, las ponderaciones de los componentes principales, que se muestran en
el cuadro C1 del apéndice, son bastante diferentes del enfoque del cuadro 7, que pondera los elementos
por igual pero en grupos mutuamente excluyentes y exhaustivos.
Las puntuaciones del GCSE de Matemáticas se predicen, en primer lugar, por el tercer
componente principal. Nuestra etiqueta abreviada para este componente es "práctica versus
instrucción". Este patrón es consistente con el enfoque de grupos simples en la tabla 7. De hecho,
(i) el tercer componente “práctica versus instrucción” está correlacionado 0.81 con (ii) la diferencia
“práctica y evaluación” menos “instrucción personalizada” en el simple grupos
50
El quinto componente principal también predice los puntajes de matemáticas de los
estudiantes. Los coeficientes estimados para los componentes tercero y quinto son similares en
magnitud y precisión. El tercero explica el 11 por ciento de la variación en los datos del elemento de
actividad, pero el quinto explica casi tanto como el 8 por ciento. El quinto componente sugiere que
en los datos de actividades se esconde una perspectiva adicional potencial. Sin embargo, el quinto
componente principal es difícil de describir con palabras. Nuestro mejor intento de una descripción
parsimoniosa es "aprendizaje guiado por el maestro".
Para resumir, las actividades de instrucción que los maestros eligen usar en sus clases explican
en parte el crecimiento de los logros de los estudiantes. En matemáticas, los estudiantes obtienen
mejores calificaciones cuando dedican más tiempo a la práctica y evaluación de los estudiantes. En inglés,
los estudiantes puntúan más alto cuando pasan más tiempo trabajando y hablando con sus compañeros
de clase. Estos patrones son robustos a la forma en que combinamos actividades en grupos o
componentes. Nuestras conclusiones tampoco se basan en las descripciones abreviadas que usamos
para grupos o componentes.
51
Apéndice tabla C1—Componentes principales de las actividades de instrucción
Componente
1 2 3 4 5
(1) (2) (3) (4) (4)
Peso en componente
1. Discusión abierta entre los niños y el maestro - 0,43 0.12 0.05 0.27 - 0,45
2. Los niños están trabajando en grupos - 0.11 - 0,26 - 0.02 0,61 0.14
3. Enseñanza uno a uno 0.04 - 0.29 0,55 - 0,15 - 0.22
4. Pasar tiempo especial para ayudar a los estudiantes débiles - 0.10 - 0,20 0.51 - 0.22 0.42
5. Los niños están haciendo trabajos escritos solos 0.20 - 0,26 - 0,26 - 0,54 - 0,35
6. Medir la comprensión de los estudiantes - 0,32 - 0.19 - 0,54 - 0.09 0.19
7. Asignar tareas o trabajos de clase a los niños 0.38 - 0.08 - 0.22 0.12 0.22
8. Lectura o dictado 0.14 0.51 0.06 0.04 - 0,34
9. Niños copiando de la pizarra 0.29 0.48 0.09 0.03 0.14
10. Uso de la pizarra por parte del docente - 0.24 0.42 - 0.04 - 0,31 0.43
11. Uso de un libro de texto durante las actividades de enseñanza 0.39 - 0.06 0.07 0.27 0.15
12. Comprometidos en trabajos no docentes 0.44 - 0,12 - 0,14 0.01 - 0.07
valor propio 1.55 1.48 1.34 1.27 1.06

Proporción de variación explicada 0.13 0.12 0.11 0.11 0.09
Nota: Análisis de componentes principales del uso del tiempo de clase entre doce actividades de instrucción, utilizando una muestra de 2.687
observaciones. Cada una de las 2687 observaciones es la visita de un compañero observador a la clase del maestro .Los observadores registraron el uso
del tiempo en cinco categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4) tiempo completo. Antes del
análisis de componentes principales, primero volvimos a escalar los datos, dividiendo cada uno de los doce puntajes de 0 a 4 elementos por la suma de
los puntajes de los elementos de la observación. El cuerpo principal de la tabla informa las cargas de los componentes, donde las cargas son los pesos
asignados a cada elemento (filas) al calcular la puntuación de un componente determinado (columnas).
52
Apéndice tabla C2—Actividades de instrucción y puntajes de rendimiento de los estudiantes,
enfoque de componentes principales
(1) (2) (3) (4)

(A) Matemáticas
1. “Interacción alumno-profesor” 0.022 0.013 - 0,002 0,006
Más tiempo en el que el profesor y los alumnos interactúan (0.020) (0.009) (0.020) (0.008)
2. “Grupos más pequeños versus toda la clase” 0.019 0.007 0.008 0.006
Más tiempo en actividades individuales y de grupos pequeños, menos (0.015) (0.006) (0.015) (0.007)
tiempo en actividades de toda la clase
3. “Práctica vs instrucción” 0.039* 0.008 0.028+ 0.005
Más tiempo para la evaluación y práctica de los estudiantes, menos tiempo para (0.016) (0.006) (0.016) (0.006)
la instrucción, especialmente la instrucción individualizada
4. “Trabajo en grupo vs trabajo individual” - 0,014 0,001 -0,020 -0,001
Más tiempo en el que los estudiantes interactúan con sus compañeros de (0.014) (0.008) (0.013) (0.008)
clase, menos tiempo trabajando solos o uno a uno con el maestro
5. “Aprendizaje guiado por el maestro” 0,048** 0,019** 0,041** 0.017*
Más tiempo usando la pizarra y ayudando a los estudiantes, menos (0,014) (0,007) (0,013) (0.007)
tiempo trabajando solo y dando conferencias unidireccionales.
Eficacia educativa 0.071** 0.022*

(0.018) (0.009)
(B) Inglés
1. “Interacción alumno-profesor” - 0.009 0.012 -0.018 0.008 (0.013)
(0.008) (0.012) (0.007) 0.007 0.006
2. “Grupos más pequeños versus toda la clase” 0.001 0.003 (0.012) (0.007) (0.012)
(0.007) 0.006 0.007 0.002 0.005
3. “Práctica vs instrucción” (0.011) (0.006) (0.011) (0.006)
0,047** 0,022** 0,045** 0,023**
4. “Trabajo en grupo vs trabajo individual” (0,011) (0,006) (0,012) (0,006) 0,003
0,002 0,003 -0,000 (0,014) (0,009)
5. “Aprendizaje guiado por el maestro” (0,014) (0,009)
Eficacia educativa 0.044* 0.025*

(0.021) (0.011)
Estudiante covariables √ √
Estudiante efectos fijos √ √
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Todos los detalles de estimación son
los mismos que para la tabla 7 con una excepción: reemplazamos los cuatro grupos de actividades de instrucción con cinco puntajes de componentes
principales.
+ indica p<0,10, * 0,05 y ** 0,01
53

Teachers Class Time BRT - Nov 22.en - Es

Cargado por

Copyright:

Formatos disponibles

Teachers Class Time BRT - Nov 22.en - Es

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Teachers Class Time BRT - Nov 22.en - Es

Cargado por

Copyright:

Formatos disponibles

Traducido del inglés al español - www.onlinedoctranslator.

Simon Burgess, Universidad de Bristol

JEL n.° I21, J24

limitadas por las habilidades de enseñanza, pero no son sinónimo de habilidades.1

escuelas secundarias públicas (estatales) de Inglaterra. Específicamente, las clases de matemáticas e

con sus compañeros de clase o practican individualmente. Para nuestro estudio,

actividades estaban sucediendo sin juzgar la idoneidad o la calidad de la actividad. La lista de

Necesitamos interpretar este resultado cuidadosamente. A modo de comparación, observamos

maestros más hábiles eligen diferentes actividades de instrucción. Este tipo de

Kane et al. 2011, Taylor 2018, Aucejo et al. 2020).

observadores calificaron la calidad de la enseñanza que observaron utilizando una rúbrica

cuestionamiento y discusión” (ver tabla 2).

actividades de instrucción que elige un maestro predicen el rendimiento de sus alumnos

pero siguen siendo educativamente significativas y estadísticamente significativas en los niveles

En cuarto lugar, las calificaciones de efectividad de la instrucción de un maestro también predicen

interacción entre pares en inglés.

Lord 2014, Hodge, Little y Weldon 2021).

Este artículo hace dos contribuciones a la literatura. Nuestra principal contribución es

demostrar la relación entre la elección de actividades educativas de un maestro y el rendimiento de

son bastante diferentes a los de este documento.

rúbricas de observación (calificaciones de la eficacia de la instrucción) y las pruebas de los estudiantes.

puntajes de las pruebas de los estudiantes.

En la siguiente sección describimos a los maestros, estudiantes y escuelas en nuestro

estudio. La Sección 2 se enfoca en nuestras medidas de actividades educativas y efectividad

educativa, y las diferencias observadas en las elecciones y habilidades de los maestros. En la

de rendimiento de sus alumnos. Concluimos en la sección 4.

Estudiamos a maestros que trabajan en escuelas secundarias públicas (estatales) en

Inglaterra y enseñan matemáticas e inglés a estudiantes de 10 y 11 años (aproximadamente entre

nuevo programa de observación entre maestros. En cada uno de los tratamientos

algunos participaron en ambos sentidos. Las escuelas fueron asignadas aleatoriamente a

tratamiento o control, y los maestros fueron asignados aleatoriamente a roles de observador y

vinculadas a esos puntajes.

puntajes de exámenes anteriores de los estudiantes, datos demográficos y medidas de exposición a la

pobreza en sus familias y vecindarios.

parte seleccionada al azar y en parte autoseleccionada.

proporciona alguna información sobre la autoselección de maestros en nuestra muestra.

2. Medidas de prácticas docentes

pruebas de los estudiantes.

maestros recibieron capacitación sobre la rúbrica y otros aspectos del programa.

2.1 Actividades de instrucción

o la adecuación de la actividad. La lista completa de doce actividades se muestra en la tabla 1,

fueron adaptados del proyecto SchoolTELLS (Kingdon, Banerji y Chaudhary 2008).

matemáticas e inglés. La correlación entre sujetos en la frecuencia media de actividades es de 0,96. La

inglés de los estudiantes de la misma manera, como mostramos en la sección 3.

Algunos grupos de actividades de instrucción están correlacionados. La Tabla 4 muestra la

actividades, sugiere una oportunidad para alguna reducción de dimensión.

Nuestro análisis se centra en cuatro grupos de actividades de instrucción. Primero, un

actividades 8-11, que involucran lectura tradicional y otra instrucción directa.

estudiantes de manera muy diferente en matemáticas en comparación con las de inglés.

La simplificación implica compensaciones. Nuestra agrupación divide las doce

actividades en categorías mutuamente exclusivas y exhaustivas que son relativamente

sencillas. La contrapartida es que estos grupos simples ignoran la variación en cómo se

correlacionan las actividades dentro y entre grupos. Para complementar el agrupamiento

del análisis de componentes principales para la reducción de dimensiones.

2.2 Eficacia de la instrucción

las descripciones de “efectivo” como ejemplo. La rúbrica completa se proporciona en el apéndice B.

Los maestros difieren en la efectividad de la instrucción, según la calificación de sus

específicas, juzgadas contra un estándar normativo definido por la rúbrica.

La Figura 2 muestra un histograma de calificaciones a nivel de elemento en el panel superior,