Teachers Class Time BRT - Nov 22.en - Es
Teachers Class Time BRT - Nov 22.en - Es
Teachers Class Time BRT - Nov 22.en - Es
com
Uso del tiempo de clase por parte de los maestros y rendimiento de los estudiantes†
noviembre 2022
Estudiamos las elecciones de los maestros sobre cómo distribuir el tiempo de clase en diferentes
actividades educativas, por ejemplo, lectura, discusión abierta o práctica individual. Nuestros datos
provienen de escuelas secundarias en Inglaterra, específicamente clases anteriores a los exámenes GCSE.
Los estudiantes obtienen mejores calificaciones en matemáticas cuando su maestro dedica más tiempo
de clase a la práctica y evaluación individual. Por el contrario, los estudiantes obtienen una puntuación
más alta en inglés si hay más discusión y trabajo con los compañeros de clase. La distribución del tiempo
de clase predice los puntajes de las pruebas independientemente de la calidad de la instrucción del
maestro durante las actividades. Estos resultados sugieren oportunidades para mejorar el rendimiento
de los estudiantes sin cambios en las habilidades de los maestros.
†
Diputado: [email protected] . Rawal: [email protected] . taylor:
[email protected] . En primer lugar, agradecemos a la Fundación Nuffield por el generoso apoyo
financiero de este análisis y a la Fundación Education Endowment por el apoyo del experimento original
que recopiló los datos. Gracias por los comentarios y consejos a Anna Vignoles, Ellen Greaves, Hans
Sievertsen, Julie Cohen y Matthew Burgess, y al Departamento de Educación por acceder a la Base de
datos nacional de alumnos.
Las elecciones y habilidades de los maestros afectan la vida de sus estudiantes. Los estudiantes
asignados a maestros más efectivos aprenden más rápido y, como resultado, obtienen un mayor éxito en
la edad adulta. Sin embargo, aunque la evidencia muestra continuamente diferencias en las
contribuciones de los maestros a los resultados de sus alumnos, la evidencia sobre por qué esas
contribuciones difieren sigue siendo escasa. En particular, todavía sabemos poco sobre el papel de las
prácticas de instrucción. Aquí, "prácticas" es una abreviatura de las elecciones que hacen los maestros
sobre cómo enseñar, y la medida en que llevan a cabo con éxito esas elecciones. Las prácticas están
En este artículo examinamos datos novedosos sobre las prácticas de los docentes, combinados
con las puntuaciones de las pruebas posteriores de sus alumnos. Estudiamos a profesores y alumnos de
inglés previas a los exámenes del Certificado General de Educación Secundaria (GCSE) generalmente se
toman a los 16 años. Los datos sobre las prácticas se recopilaron durante las observaciones en el aula
realizadas por otros maestros que trabajan en la misma escuela. Describimos varios resultados
empíricos, algunos nuevos para la literatura sobre la economía de los docentes y la enseñanza.
Nuestro enfoque principal son las elecciones de los maestros sobre cómo distribuir el tiempo de clase
en diferentes actividades educativas. Primero, los maestros toman decisiones diferentes. Algunos maestros
pasan gran parte del tiempo de clase utilizando la instrucción directa tradicional, incluidas las conferencias y el
uso de libros de texto, mientras que otros maestros dedican más tiempo de clase a los estudiantes que trabajan
1Jackson, Rockoff y Staiger (2014) revisan la literatura sobre docentes. Los maestros y las escuelas no son
únicos en este sentido. Como Syverson (2011) revisa, la evidencia de muchos sectores e industrias
muestra grandes diferencias en la productividad entre empresas, plantas, etc., pero las causas de esas
diferencias solo se comprenden parcialmente. Algunas causas potenciales intuitivas, como las "prácticas
de gestión", reciben menos atención en la literatura porque son difíciles de medir y probar (cuasi)
experimentalmente (sobre la gestión, consulte Bloom y van Reenen 2007, Bloom et al. 2013 y Bloom et al.
2015 para escuelas). Las prácticas docentes son igualmente difíciles de medir y de manipular
(cuasi-)experimentalmente.
1
los observadores del salón de clases registraron cuál de las doce actividades de instrucción usó el
maestro y durante cuánto tiempo de clase. Los observadores simplemente registraron qué
actividades, que se muestra en la tabla 1, incluye cosas como "exposición o dictado", "enseñanza
uno a uno" y "discusión abierta entre los estudiantes y el maestro". A modo de ejemplo, más de un
tercio de los docentes de nuestros datos utilizaron la actividad "discusión abierta..." durante la
mayor parte o todo el tiempo de clase, pero una cuarta parte de los docentes no utilizaron ninguna
"discusión abierta...". diferentes actividades, esas opciones no están relacionadas en gran medida
con la materia que se enseña (inglés o matemáticas) o con las características de los estudiantes en
la clase.
En segundo lugar, las elecciones de los maestros son (potencialmente) importantes para el
rendimiento de sus alumnos. Los estudiantes obtienen mejores calificaciones en los exámenes de matemáticas
cuando su maestro dedica más tiempo de clase a la práctica y evaluación individual. En la clase de matemáticas
típica (promedio), el maestro asigna "parte del tiempo" a la evaluación y la práctica. En una clase en la que el
profesor dedica "la mayor parte del tiempo" a la práctica y la evaluación, las puntuaciones del GCSE son 0,08σ
más altas que las de la clase típica (σ = desviaciones estándar de la puntuación de la prueba del alumno). Para
los exámenes de inglés, por el contrario, los estudiantes obtienen mejores puntajes cuando pasan más tiempo
trabajando y hablando con sus compañeros de clase, con ganancias previstas similares en magnitud a las
matemáticas.
que los documentos innovadores sobre prácticas de gestión y desempeño empresarial (Bloom y van
Reenen 2007, Bloom et al 2013) tienen la misma estructura que este documento: preguntar a los agentes
(gerentes/profesores) sobre sus acciones (prácticas de gestión). /uso del tiempo en el aula) y relacione
esto con los resultados (desempeño de la empresa/rendimiento de los alumnos). El problema tanto para
esos documentos como para este documento es hasta qué punto podemos controlar los factores de
confusión que afectan la medida de resultado. En nuestro caso, la principal preocupación se omite en las
habilidades del maestro: los estudiantes aprenden más porque sus maestros son más hábiles y los
2
la preocupación por las variables omitidas a nivel docente limita las afirmaciones causales en muchos
estudios de docentes, incluso cuando los estudiantes se asignan aleatoriamente a los docentes (p. ej.,
De hecho, nuestros datos nos permiten recorrer un largo camino hacia la eliminación de
este problema porque tenemos una medida de la eficacia de la instrucción de los maestros. Los
detallada, el Marco para la Enseñanza (Danielson 2007). Estas calificaciones de eficacia educativa
miden una combinación de habilidades y esfuerzo en diez tareas de enseñanza, juzgadas contra un
estándar normativo definido por la rúbrica. Por ejemplo, una de las diez tareas es “usar técnicas de
El control de la eficacia de la instrucción del maestro nos da nuestro tercer resultado: las
independientemente de sus habilidades de enseñanza. Encontramos los mismos patrones: el tiempo para
la práctica individual y la evaluación beneficia los puntajes de matemáticas, y la interacción entre pares
beneficia los puntajes de inglés. Las estimaciones puntuales son de un cuarto a un tercio más pequeñas,
convencionales. Estos resultados sugieren que, independientemente de las habilidades o el esfuerzo del
maestro, algunos enfoques de la instrucción en el aula tienen más éxito que otros para promover el
aprendizaje de los estudiantes. Este resultado es quizás la contribución más novedosa de este artículo. El
supuesto identificador de una interpretación causal es que nuestra medida de la eficacia de la instrucción
del maestro captura las habilidades del maestro que están correlacionadas con sus elecciones de
actividades de instrucción y el rendimiento de los estudiantes. Incluso si persiste algún grado de sesgo de
variable omitida, nuestras estimaciones tienen un argumento causal mucho más sólido que las
estimaciones existentes que omiten por completo las habilidades de los docentes.
puntajes de rendimiento más altos. Un estudiante asignado a un maestro del cuartil superior, medido por
índices de eficacia, obtendrá una puntuación de aproximadamente 0,08σ más alta que un estudiante similar
asignado a un maestro del cuartil inferior. Esa diferencia es aproximadamente de la misma magnitud que la
3
diferencia predicha por el uso que hacen los maestros del tiempo de clase para practicar matemáticas o para la
Estas relaciones entre las prácticas de los maestros y los puntajes de los exámenes de los
estudiantes son significativas desde el punto de vista educativo y económico. Una mejora de 0,08σ es
aproximadamente un tercio de la desviación estándar en las contribuciones totales de los docentes a las
puntuaciones del GCSE (Slater, Davies y Burgess 2011). Las mejoras en las puntuaciones del GCSE
también predicen los ingresos futuros y la asistencia a la universidad (Mcintosh 2006, Hayward, Hunt y
sus alumnos, incluso condicionado a su eficacia educativa. Muchos artículos miden las diferencias
entre los profesores en con qué eficaciaellos hacen su trabajo; Las calificaciones de las rúbricas de
observación en el aula son bastante comunes (ver Jackson, Rockoff y Staiger 2014 para una
revisión). Pocos documentos tienen medidas que puedan distinguir entre lo que los maestroshacer
en el trabajo decon qué eficaciaellos lo hacen. Los ejemplos más cercanos a este artículo, de los que
tenemos conocimiento, son Aslam y Kingdon (2011) y Taylor (2018). Ambos documentos distinguen
entre las actividades de instrucción y las habilidades de los docentes, y ambos usan esas medidas
para predecir los puntajes de los exámenes de los estudiantes, pero las medidas y los escenarios
Esta primera contribución tiene implicaciones importantes para los docentes y los administradores de
docentes que trabajan para mejorar la escolarización. A menudo, el enfoque en las escuelas, y entre los
investigadores, es mejorar las habilidades de los docentes. A menudo, esas habilidades son difíciles de aprender,
como manejar el mal comportamiento de los estudiantes o hacer preguntas efectivas en clase. Los resultados de
este artículo sugieren, por ejemplo, que los estudiantes aprenderían más matemáticas si los maestros
simplemente dedicaran más tiempo de clase a la práctica individual, incluso sin un cambio en las habilidades de
los maestros.
Una segunda contribución son las nuevas estimaciones de la correlación entre las calificaciones de las
4
puntuaciones. Varios estudios anteriores reportan la misma correlación, y nuestras estimaciones son
similares en magnitud (por ejemplo, Kane et al. 2011, Kane y Staiger 2012, Kane et al. 2013). Aún así,
nuestras estimaciones son novedosas en algunos aspectos. Primero, son de escuelas secundarias en
Inglaterra. Las estimaciones existentes provienen casi en su totalidad de escuelas primarias y secundarias
de los Estados Unidos; una excepción es Araujo y coautores (2016) que estudian las clases de jardín de
infantes en Ecuador. En segundo lugar, los observadores de nuestro estudio tenían poca formación en
comparación con estudios anteriores. Los observadores suelen recibir mucha más capacitación, que a
menudo incluye pruebas para asegurar la confiabilidad entre evaluadores. En tercer lugar, las
calificaciones de las rúbricas pueden depender de las actividades de instrucción utilizadas durante la
visita del observador. Podemos controlar las actividades de instrucción al estimar la correlación con los
Sección 3 examinamos la relación entre las prácticas de los docentes y los puntajes de las pruebas
1. Configuración y muestra
14 y 16 años). Nuestra medida del rendimiento estudiantil son los exámenes GCSE, que los
estudiantes toman al final del año 11. Nuestras medidas de prácticas docentes, tanto actividades
educativas como eficacia educativa, provienen de observaciones en el aula realizadas por maestros
compañeros de trabajo.
Los datos de observación del salón de clases se recopilaron como parte de un experimento de
campo previo en los años escolares 2014-15 y 2015-16. Los detalles completos y los resultados del
experimento se describen en Burgess, Rawal y Taylor (2021). Las escuelas de tratamiento comenzaron un
5
escuelas, algunos maestros siempre fueron los observadores, algunos siempre los observados, y
observado. La Sección 2 describe los datos recopilados en las observaciones entre pares. Si bien los
maestros se calificaron entre sí, el programa no implicó ningún incentivo (formal) ni consecuencias
Todos los datos de los estudiantes provienen de la Base de datos nacional de alumnos (NPD) del
gobierno del Reino Unido, incluidos los puntajes de los estudiantes individuales de los exámenes del
Certificado general de educación secundaria (GCSE). Al final del año 11, los estudiantes toman los
exámenes GCSE en varias materias, pero en este documento solo usamos puntajes de matemáticas e
inglés. Los exámenes GCSE son importantes para los estudiantes; por ejemplo, los puntajes influyen en
las admisiones a la universidad. Y los GCSE predicen ganancias futuras (Mcintosh 2006, Hayward, Hunt y
Lord 2014, Hodge, Little y Weldon 2021). Además de los puntajes de GCSE, los datos de NPD brindan
El NPD no recopila datos que vinculen a los estudiantes con sus maestros específicos. Durante el
experimento de observación entre pares, las escuelas proporcionaron listas de clases que usamos para vincular
a estudiantes y maestros. Las listas utilizan códigos de identificación de maestros enmascarados que,
lamentablemente, no podemos vincular con ningún otro dato sobre maestros individuales.
Nuestra muestra de estudio incluye 251 maestros en 32 escuelas y poco más de 7,000
estudiantes que fueron enseñados por esos maestros y para quienes tenemos los puntajes de las
pruebas GCSE. Para matemáticas tenemos 5.211 alumnos y 136 profesores, y para inglés 4.301 y
1202. Los datos de observación en el aula fueron recopilados por 231 maestros compañeros
diferentes.
La selección en esta muestra involucró tres pasos. Primero, las escuelas se ofrecieron como voluntarias para
participar en el nuevo experimento del programa de observación entre pares. el equipo de investigación
2Esto se debe a que es más probable que los maestros de matemáticas sean observados, no porque tengamos puntajes
diferenciales en los exámenes de los estudiantes.
6
contactó a casi todas las escuelas secundarias públicas (estatales) de alta pobreza en Inglaterra y las
invitó a participar en el experimento.3Las escuelas no fueron seleccionadas en base a los puntajes de las
pruebas de los estudiantes. En segundo lugar, la mitad de las escuelas de voluntarios fueron asignadas
aleatoriamente al programa de tratamiento. En tercer lugar, dentro de cada una de las escuelas de
tratamiento, se seleccionó una muestra aleatoria de maestros para observarlos y calificarlos. Cuarto, los
maestros elegían si participar o no. Por lo tanto, nuestra muestra de 32 escuelas y 251 docentes es en
La Tabla 3 proporciona una descripción de nuestra muestra. Las escuelas invitadas a participar en el
experimento fueron seleccionadas intencionalmente por tener altos índices de pobreza, y esa selección inicial se
refleja en las filas de IDACI y comidas escolares gratuitas de la tabla 3. Poco más del 40 por ciento de los
estudiantes son, o alguna vez han sido, elegibles para recibir alimentos gratuitos. comidas escolares,
sustancialmente más altas que el promedio nacional. La comparación entre las columnas de la tabla 3
Las observaciones en el salón de clases revelaron diferencias significativas entre los maestros tanto en
las actividades de instrucción que los maestros eligieron usar en clase como en las calificaciones basadas en
rúbricas de la efectividad de la instrucción de los maestros. En esta sección describimos la variación en las
prácticas y la eficacia. En la siguiente sección relacionamos las medidas de los maestros con los puntajes de las
Los datos de observación se recopilaron durante casi 2700 visitas a las aulas, donde un
observador calificó a uno de sus compañeros maestros. Las visitas solían durar entre 15 y 20
minutos. El maestro típico (mediano) fue observado ocho veces durante dos años (IQR 4-15). El
maestro típico fue puntuado por tres compañeros observadores diferentes (IQR 2-5). Todos los
3Para este propósito, las “escuelas de alta pobreza” eran aquellas escuelas donde el porcentaje de estudiantes elegibles para
comidas escolares gratuitas estaba por encima de la media de Inglaterra.
7
Sin embargo, la capacitación fue breve en comparación con la capacitación que han recibido los
observadores en otros estudios y entornos (p. ej., Kane et al. 2011, Kane et al. 2013).
Para medir las opciones de actividades educativas de los maestros, se les dio a los
observadores una lista de actividades y se les pidió que registraran la frecuencia con la que se
usaba cada actividad. Es importante destacar que los observadores pares registraron solo la
frecuencia de la actividad durante su visita; no se pidió a los observadores que evaluaran la calidad
incluidas cosas como “discusión abierta entre los niños y el maestro” y “uso de la pizarra por parte
del maestro”. Los observadores podían elegir entre cinco opciones: nada (0), muy poco (1), algunas
veces (2), la mayor parte del tiempo (3), tiempo completo (4). La lista de actividades y el instrumento
Los profesores toman decisiones bastante diferentes sobre cómo pasar el tiempo de clase. La
Figura 1 muestra las doce diferentes actividades de instrucción y la frecuencia de su uso. Por ejemplo, en
más de un tercio de las clases, los observadores registraron “discusiones abiertas entre los niños y el
maestro” durante la mayor parte o la totalidad del tiempo de clase. Sin embargo, en una cuarta parte de
las clases, la "discusión abierta..." era muy rara o estaba completamente ausente. Los maestros estaban
divididos de manera similar sobre "los niños que hacen el trabajo escrito solos". Un ejemplo contrastante
es el uso de un libro de texto, que se registró como raro o ausente en casi nueve de cada diez clases.
Los patrones de las actividades de instrucción son bastante similares en las clases de
figura A1 del apéndice muestra la figura 1 por separado por tema. Sin embargo, esta similitud en el uso
del tiempo no significa que las actividades contribuyan a los puntajes de los exámenes de matemáticas e
matriz de correlación para las doce actividades. Algunas actividades pueden ser complementarias
8
insumos para el aprendizaje de los estudiantes, mientras que otras actividades pueden ocurrir
simultáneamente por razones prácticas. Examinar las correlaciones, junto con la sustancia de las
grupo que llamamos “interacción entre estudiantes y compañeros”, combinando las actividades 1 y
2, que involucran a los estudiantes interactuando entre sí (y con el maestro). Segundo, “instrucción
personalizada”, combinando las actividades 3-4, que involucran atención personalizada del maestro
a los estudiantes. Tercero, “práctica y evaluación”, que combina las actividades 5 a 7, que implican
la práctica y la evaluación de los estudiantes. Cuarto, “instrucción directa”, que combina las
La Tabla 5 describe las elecciones de los maestros usando estos cuatro grupos de actividades. El grupo
de actividades más común es “interacción entre estudiantes” con una media de 1,7, donde un 2 es “parte del
tiempo” en una escala de 0 “nada” a 4 “tiempo completo”. El menos común es la “instrucción directa” con una
media de 1,2. En la sección 3, mostramos que estos cuatro tipos de actividades predicen las calificaciones de los
simple, mostramos en el Apéndice C que los resultados del documento son robustos al uso
los observadores usando una rúbrica estructurada conocida comoMarco para la enseñanza(
Danielson 2007, FFT). La rúbrica es ampliamente utilizada por los sistemas escolares y en la
investigación (por ejemplo, Kane et al. 2011, Taylor y Tyler 2012, Kane et al. 2013, Bacher-Hicks et al.
9
2017). Los maestros fueron calificados en diez tareas de instrucción separadas (o "estándares" en la
jerga de FFT), que se enumeran en la columna de la izquierda de la tabla 2. Para cada tarea, la
rúbrica incluye descripciones detalladas de los comportamientos observados que deben calificarse
como " enseñanza “altamente efectiva”, “efectiva”, “básica” e “ineficaz”. En la tabla 2 reproducimos
Los observadores pares asignaron una puntuación del 1 al 12 a cada uno de los diez elementos de la rúbrica.
En la mayoría de los entornos, la rúbrica FFT se califica del 1 al 4 correspondiente a las cuatro
descripciones. En este estudio, los observadores fueron capacitados para usar 1-3 para "ineficaz",
4-6 para "básico", 7-9 para "eficaz" y 10-12 para "altamente eficaz". Así, por ejemplo, un observador
que sintiera que el maestro era "efectivo" podría elegir una puntuación de 7, 8 o 9, donde 7 sugiere
"efectivo" pero más cercano a "básico" y 9 sugiere "efectivo" pero más cercano a "altamente".
eficaz."
compañeros de trabajo. Para ser claros, en este contexto, la "eficacia de la instrucción" es una medida de
las acciones observables de un maestro en el aula. Si bien usamos la palabra "eficacia", estas
calificaciones también podrían describirse como medidas de "desempeño laboral". Las calificaciones
reflejan una combinación de las habilidades y el esfuerzo de un maestro aplicado a tareas de enseñanza
agrupando las diez tareas. El puntaje más común es 10 de 12, otorgado en casi el 25 por ciento de las
calificaciones; pero las puntuaciones de 8, 9, 11 y 12 tienen cada una entre el 10 y el 15 por ciento de las
4Estas diez tareas puntuadas (o estándares) se dividen en dos "dominios" de "ambiente del aula" e
"instrucción". Estos dos dominios se califican durante las observaciones en clase, y durante el
experimento de evaluación por pares solo se calificaron estos dos dominios. La rúbrica FFT también
incluye varios estándares en otros dos dominios, "planificación" y "evaluación", que se califican en base a
conversaciones con el maestro y una revisión de los materiales.
10
El sesgo en la figura 2 refleja en parte el sesgo de indulgencia, que es una característica común
de las calificaciones de desempeño laboral de los docentes (Weisberg et al. 2009, Kraft y Gilmour 2017) y
en muchas otras ocupaciones (Prendergast 1999). El sesgo de indulgencia puede ser más probable en
nuestro entorno donde los observadores y los observados trabajaron juntos en la misma escuela como
compañeros. Alternativamente, la naturaleza de bajo riesgo de las observaciones de los pares puede
haber hecho que las calificaciones resultantes sean más precisas. Y la escala de 12 puntos les dio a los
evaluadores una forma de diferenciar entre la enseñanza "altamente efectiva". Al final, mientras que las
calificaciones se agrupan en la parte superior de la escala en nuestros datos, hay más variación de lo que
es típico de las observaciones en el aula y mucho menos efecto techo de lo que es típico.5
Para cada una de las diez tareas de instrucción, la tabla 6 informa la calificación media y la
desviación estándar. Los observadores calificaron a los maestros más alto, en promedio, por "manejo del
comportamiento de los estudiantes" (media 9.4) y más bajo por "uso de la evaluación" (media 8.5). En
general, los maestros fueron calificados como más efectivos en las tareas del entorno del salón de clases
que en las tareas de instrucción. El “uso de la evaluación” también mostró las mayores diferencias en la
efectividad entre docentes (desviación estándar 2.2). Los maestros fueron más similares en "comunicarse
Las calificaciones de efectividad de la instrucción de un maestro en todas las tareas están fuertemente
correlacionadas. La correlación promedio en la calificación entre dos tareas cualesquiera es 0,70, con un rango
de 0,55 a 0,86. La matriz completa de correlaciones por pares se muestra en el cuadro A1 del apéndice. La
correlación entre tareas refleja en parte el hecho de que las verdaderas habilidades y esfuerzos subyacentes
están correlacionados. De hecho, 0,70 puede subestimar la correlación en las habilidades o el esfuerzo, ya que
se observa a los docentes brevemente y con poca frecuencia al introducir el error de medición clásico. La
correlación también surge en parte porque las calificaciones de las diez tareas
5La figura A2 del apéndice muestra un histograma de los mismos datos que el panel A de la figura 2, pero donde las
calificaciones del 1 al 12 se colapsan en la escala más común del 1 al 4. Los efectos de sesgo y techo son, como era de
esperar, mucho más fuertes.
11
son dados por un observador. Sin embargo, utilizando solo la variación dentro del observador, la
correlación por pares promedio sigue siendo 0,60, con un rango de 0,44 a 0,79.
En la práctica, entonces, las calificaciones de las rúbricas miden principalmente una dimensión
general de la eficacia de la instrucción. La tabla A2 del apéndice muestra los resultados de un análisis de
efectivamente el promedio simple de los diez elementos de la tarea, y ese promedio simple explica las
tres cuartas partes de la variación en las calificaciones a nivel de elemento. A modo de comparación, el
primer componente principal de los elementos de actividades de instrucción explica solo el 13 por ciento
de los datos de actividades. Este patrón de correlaciones entre calificaciones coincide con estudios
instrucción: el promedio simple de las diez calificaciones de la rúbrica FFT. El panel inferior de la
figura 2 muestra un histograma de estos puntajes promedio, con un puntaje promedio para cada
Una nota final sobre la medición de las prácticas docentes. Las diferencias entre los
profesores pueden reflejar en parte las diferencias en los estudiantes a los que enseñan. Los
maestros pueden elegir diferentes actividades de instrucción para estudiantes con diferentes
necesidades académicas. O los estudiantes con diferentes necesidades pueden ser asignados
Dupas y Kremer 2011, Ballatore y Sestito 2017, Aucejo et al. 2020, Graham et al. 2021).
Alternativamente, los juicios de los observadores del aula pueden verse influenciados por los
6En tres estudios previos en escuelas de EE. UU., las calificaciones de los diez ítems de FFT están correlacionadas entre 0,72 y 0,88
(Kane y Staiger 2012, Ho y Kane 2013, Gitomer et al. 2014, ICPSR nd, comunicación personal de Andrew Ho, 3 de mayo de 2019).
Kane et al. (2011) reporta resultados de componentes principales similares. Sin embargo, en nuestros datos, los niveles de
calificación son consistentemente más altos en todos los elementos, alrededor de 0,9 puntos en la escala de 4 puntos, y nuestras
calificaciones tienen una variación más alta, alrededor de un 30 por ciento más grande.
12
las características de los estudiantes (puntajes de exámenes anteriores, exposición a la pobreza, etc.) y las
del apéndice).
Pasamos ahora a la relación entre las prácticas docentes y el rendimiento de los estudiantes. Como
detallamos en esta sección, los estudiantes obtienen mejores calificaciones en matemáticas cuando su maestro
asigna más tiempo de clase a la práctica y evaluación de los estudiantes. Por el contrario, los estudiantes
obtienen mejores calificaciones en inglés cuando los maestros dedican más tiempo a que los estudiantes
trabajen y hablen entre ellos en clase. Estas relaciones, entre las actividades de instrucción en clase y el
rendimiento de los estudiantes, se mantienen incluso controlando la eficacia de la instrucción del maestro. Los
estudiantes también obtienen puntajes más altos cuando su maestro tiene una calificación más alta en la
efectividad de la instrucción.
3.1 Estimación
Nuestra estrategia de estimación comienza con un modelo estadístico convencional de los puntajes de las
inglés) impartido por el profesor en el año escolar previo a los GCSE.7el vector
varios controles adicionales: estudiante 's propios puntajes de exámenes anteriores en matemáticas e inglés;
7Estrictamente hablando el índice en y es redundante porque, en nuestros datos, cada estudiante es
asignado a un solo profesor por asignatura y así = ( ).mantenemos el índice para facilitar la exposición. Los puntajes
de los estudiantes están estandarizados (media 0, sd 1) por materia y año escolar dentro de nuestra muestra de análisis.
13
las medias de clase y las desviaciones estándar de los dos puntajes de prueba anteriores,
Nuestras estimaciones preferidas de también dan cuenta de las diferencias entre los observadores. Sobre la
efectos fijos, , controla las diferencias entre los observadores en sus expectativas, prácticas,
experiencia, etc.9Para estimar la especificación 2, primero creamos un nuevo conjunto de datos con
dónde es el número de observadores que puntuaron maestro .A estos nuevos datos nos
pareja de maestros, ,se le da el mismo peso independientemente del número de observadores que calificaron
al maestro .A lo largo del informe, informamos estimaciones de error estándar robustas de clúster, donde los
permitimos todos y los términos sean diferentes según el tema. Efectos fijos del observador, ,
siguen siendo sujetos cruzados para nuestros resultados principales, pero esos resultados son robustos para el
uso de efectos fijos observador por sujeto (equivalentemente, estimando 2 por separado por sujeto).
Los diferentes maestros eligen distribuir el tiempo de clase de diferentes maneras (clase,
discusión en grupo, práctica individual, etc.) y esas diferentes actividades de instrucción explican en parte
las diferencias en los puntajes de las pruebas de los estudiantes. Como las estimaciones en la tabla
8Los puntajes de las pruebas anteriores son puntajes de Key Stage 2 (KS2). Las otras características son el género, alguna vez
elegible para comidas escolares gratuitas, puntaje IDACI, mes de nacimiento y el año en que el estudiante tomó los GCSE.
También incluimos un indicador de si la escuela está en Londres.
9Estas diferencias de los observadores pueden incluir, por ejemplo, diferencias entre los observadores en su
sentido de lo que constituye "medir la comprensión de los estudiantes" o "trabajo no docente", o los umbrales
entre "algunas veces" y "la mayor parte del tiempo".
10Cuando observa más de una vez, usamos las medidas o puntajes promedio de en . Similarmente,
para en la ecuación 1 usamos el promedio de todos los observadores.
14
En el panel A de 7 columnas 1, los estudiantes obtienen una puntuación más alta en los GCSE de
matemáticas cuando el enfoque de su maestro incluye más tiempo para la práctica y la evaluación
individuales. Aumentar el tiempo para "práctica y evaluación" en una desviación estándar predice
puntajes de prueba de matemáticas 0.068σ más altos. En la clase de matemáticas típica (promedio), el
maestro asigna "parte del tiempo" a la evaluación y la práctica. En una clase en la que el profesor dedica
"la mayor parte del tiempo" a la práctica y la evaluación, esperaríamos que las puntuaciones fueran
aproximadamente 0,08σ más altas que las de la clase típica.11Por el contrario, las otras actividades de
Sin embargo, para los GCSE de inglés, los estudiantes obtienen una puntuación más alta cuando el tiempo de
clase incluye una mayor interacción del estudiante con sus compañeros de clase. El coeficiente de "interacción entre
estudiantes y compañeros" es 0.053σ para predecir los puntajes de las pruebas de inglés (tabla 7, columna 1, panel B),
aproximadamente tan grande como lo es "práctica y evaluación" para matemáticas. Pero otras actividades no son
fuertes predictores de los puntajes de inglés, de hecho, más tiempo en las otras actividades puede conducir a puntajes
la desviación estándar entotalcontribuciones de los maestros a los puntajes de las pruebas de los
asignado a un maestro de primer año o un maestro de quinto año (ver Jackson, Rockoff y Staiger
2014 para una revisión reciente). Una ganancia de 0.08σ también es similar a la ganancia de
11Como se muestra en la tabla 5, la media matemática para "práctica y evaluación" es 1,73, donde 2 es "parte del
tiempo". La desviación estándar es 0,086, por lo que un cambio de un punto de escala de 2 "algunas veces" a 3 "la mayor
parte del tiempo" sería aproximadamente 0,068σ/0,86 = 0,08σ.
12Slater, Davies y Burgess (2011) estiman que la desviación estándar de las contribuciones de los maestros a las
puntuaciones del GCSE es de 0,272 desviaciones estándar de los estudiantes. Esta estimación proviene de escuelas
secundarias de inglés y cursos GCSE, como en nuestro estudio actual, aunque la muestra de Slater, Davies y Burgess
(2011) es más amplia. Para obtener un resumen general de las estimaciones sobre la distribución del valor agregado de
los docentes, consulte Jackson, Rockoff y Staiger (2014) y Hanushek y Rivkin (2010), aunque muchas estimaciones de esas
estimaciones provienen de escuelas primarias y secundarias en los Estados Unidos. La estimación de 0,272 puede ser
mayor que otras estimaciones en parte porque los estudiantes suelen pasar dos años con su profesor de GCSE.
15
agregando 2-3 semanas de instrucción al año escolar (Sims 2008, Fitzpatrick,
Grissmer y Hastedt 2011, Aucejo y Romano 2016).
Las estimaciones en la columna 1 de la tabla 7 por sí solas no son suficientes para concluir que más
práctica y evaluación provocan puntuaciones más altas en matemáticas per se, o que una mayor interacción de
los estudiantes provoca puntuaciones más altas en inglés. Ciertamente, es plausible que los estudiantes
aprendan más o menos debido a cómo sus maestros distribuyen el tiempo de clase. Sin embargo, no podemos
descartar una explicación alternativa: que los estudiantes aprenden más o menos debido a otra cosa que hacen
sus profesores, y que esa otra cosa está simplemente correlacionada con la elección de actividades de
instrucción por parte del profesor. Esta preocupación por las variables omitidas a nivel docente también limita
las afirmaciones causales en otras investigaciones similares, incluso cuando los estudiantes se asignan
aleatoriamente a los docentes (p. ej., Kane et al. 2011, Taylor 2018, Aucejo et al. 2020).
maestro en esa actividad específica. Considere, por ejemplo, las “interacciones entre
estudiantes”, que incluyen debates abiertos entre la clase. Tal vez esta actividad contribuya a
profesores de inglés son más hábiles (o se esfuerzan más en) “usar técnicas de preguntas y
debate”. Quizás los profesores de matemáticas asignan más tiempo de clase a la “práctica y
"práctica y evaluación" se reduce aproximadamente un tercio a 0.047σ, pero sigue siendo significativa, y
no podemos rechazar el valor nulo de que no ha cambiado desde 0.068σ. La estimación puntual de
dieciséis
“instrucción directa” casi se duplica a 0.023σ. Esto sería consistente con que las clases sean más
productivas cuando el maestro es más hábil en matemáticas (ver, por ejemplo, Taylor 2018). Para el
inglés, al igual que para las matemáticas, la estimación del punto clave sobre la "interacción entre
estudiantes y compañeros" se reduce en aproximadamente una quinta parte, pero sigue siendo
significativa desde el punto de vista educativo. Los coeficientes negativos de “instrucción personalizada” y
Estos resultados sugieren que, independientemente de las habilidades o el esfuerzo del maestro,
algunos enfoques de la instrucción en el aula tienen más éxito que otros para promover el aprendizaje de los
estudiantes. Los resultados también sugieren que la naturaleza de esa actividad más efectiva puede depender
de la materia que se enseña. Este resultado es quizás la contribución más novedosa de este artículo a la
literatura. Son raras las investigaciones que combinan tanto las medidas de las actividades de instrucción como
las medidas de las habilidades del maestro para predecir los puntajes de las pruebas de los estudiantes. Los más
cercanos, de los que tenemos conocimiento, son Aslam y Kingdon (2011) y Taylor (2018).
Una segunda amenaza potencial para la interpretación causal proviene de las variables omitidas a
nivel de estudiante, que surgen de cómo los estudiantes son asignados a los maestros. Sin embargo, la amenaza
de las características de los estudiantes que no se observan es probablemente mucho menor que la amenaza de
las características de los maestros que no se observan. Nuestras estimaciones controlan los puntajes de las
pruebas anteriores de los estudiantes, la distribución de los puntajes anteriores de los compañeros, los
antecedentes de los estudiantes y los efectos fijos de la escuela. Una limitación es que nuestros puntajes de
exámenes anteriores son el examen Key Stage 2 tomado cinco años antes de los exámenes GCSE, no el año
escolar inmediatamente anterior. Evidencia bien conocida, de Kane y Staiger (2008), Chetty, Friedman y Rockoff
(2014) y otros, sugiere que es plausible suponer que las asignaciones de estudiantes a maestros son ignorables,
en el sentido de inferencia causal, condicional en resultados de exámenes de años anteriores. . Está menos claro
cómo se degradan los beneficios de los controles de puntuación retrasados con retrasos más largos, aunque
un trabajo reciente en Angrist et al. (en prensa) sugiere razones para el optimismo.
Como enfoque alternativo, las columnas con números pares en la tabla 7 usan efectos fijos de
estudiantes. Las estimaciones puntuales son más pequeñas, se reducen a la mitad o dos veces.
17
tercios Aún así, se mantiene el mismo patrón: las matemáticas se benefician del tiempo de clase para la práctica y
efectos fijos de los estudiantes proporcionan límites sobre la influencia del sesgo de la
variable omitida a nivel de los estudiantes, como el rendimiento no observado del año
entre 0,015σ y 0,047σ, por ejemplo. Las estimaciones de efectos fijos de los estudiantes serán
los estudiantes, solo si las asignaciones de estudiantes y maestros para matemáticas e inglés
realizan al mismo tiempo, por lo que la escuela dispone de la misma información para ambas
decisiones.13
Las calificaciones de efectividad de la enseñanza basadas en rúbricas también predicen los puntajes
de las pruebas GCSE de los estudiantes. En la columna 5 de la tabla 7, el coeficiente estimado de la puntuación
FFT es 0,077σ para matemáticas y 0,040σ para inglés. Imagine dos estudiantes: el primer estudiante está
asignado a un maestro del cuartil superior, según lo medido por la rúbrica FFT, y el segundo a un maestro del
cuartil inferior. El primer estudiante obtendrá una puntuación más de 0,10 σ más alta que el segundo estudiante
Varios estudios previos también informan la correlación entre los puntajes FFT de los maestros y los puntajes
de las pruebas de los estudiantes. Nuestras estimaciones de las escuelas secundarias inglesas están en línea con las
estimaciones existentes. Estudiantes de maestros y estudiantes más jóvenes en los Estados Unidos
13Rothstein (2010) argumenta convincentemente en contra del uso de efectos fijos de estudiantes para estudiar a los
maestros de escuela primaria, el escenario más común en la literatura. El requisito de que las escuelas usen la misma
información se viola fácilmente cuando la estrategia de efectos fijos de los estudiantes usa observaciones durante varios
años para un estudiante determinado.
18
Unidos, pero utilizando datos y regresiones similares, los artículos anteriores informan coeficientes
en la puntuación FFT de 0.08-0.09σ (Kane et al. 2011) y 0.05-0.11σ (Kane et al. 2013). La última cita
es del gran proyecto Métodos de Enseñanza Efectiva (MET, por sus siglas en inglés), que incluía
medir la enseñanza usando otras rúbricas de observación además de FFT, y en general las otras
rúbricas también predijeron puntajes de prueba de manera similar (Kane y Staiger 2012). Un
0.05-0.07σ para la rúbrica CLASS (Araujo et al. 2016). Por el contrario, las calificaciones
(relativamente) subjetivas de los maestros por parte de los líderes escolares son menos predictivas
de las calificaciones de los estudiantes (Jacob y Lefgren 2008, Rockoff y Speroni 2010, Rockoff et al.
2012).
Nuestras estimaciones se distinguen de dos maneras, incluso si son similares en magnitud a las
estimaciones anteriores. Primero, los observadores pares tenían poca capacitación en comparación con
estudios anteriores. En estudios anteriores, los docentes fueron observados y calificados por
someten a pruebas de confiabilidad antes de realizar las evaluaciones.14En segundo lugar, las
calificaciones de las rúbricas pueden depender de las actividades de instrucción utilizadas durante la
visita del observador. Por ejemplo, una calificación de las “técnicas de discusión y preguntas” de un
maestro puede ser más exacta o precisa si la clase dedica más tiempo a la discusión grupal. Podemos
controlar las actividades de instrucción. Compare las columnas 5 y 3 de la tabla 7. El coeficiente de las
14A veces, los evaluadores se conocen como "evaluadores de pares", pero "compañeros" se refiere al hecho de que el evaluador
había sido (recientemente) un maestro de clase. El rol de evaluador es un trabajo especializado distinto con una capacitación
sustancial.
19
análisis en la tabla 7, reemplazando los cuatro grupos de actividades con cinco puntajes de
componentes principales. Los resultados muestran los mismos patrones sustantivos que la tabla 7;
los patrones sustantivos no son un artefacto de cómo combinamos los datos de actividad. Por
que denominamos “trabajo en grupo versus trabajo individual”, aumenta en actividades en las que
los estudiantes interactúan con sus compañeros de clase y disminuye en actividades en las que los
crecimiento de los logros de los estudiantes depende de los resultados de los estudiantes.previologro.
Como se muestra en la tabla A4 del apéndice, la correlación—entre los puntajes de GCSE de los
estudiantes y las calificaciones de efectividad de los maestros—se reduce a medida que aumentan los
puntajes de las pruebas anteriores del estudiante. Este resultado de heterogeneidad apunta a una
literatura estrechamente relacionada: qué prácticas docentes mejoran mejor el rendimiento de los
estudiantes bien pueden depender de las características de los estudiantes en el aula (Lazear 2001,
Lazear 2006, Duflo, Dupas y Kremer 2011, Aucejo et al. 2020 , Graham et al. 2021). Sin embargo, en
contraste con las calificaciones de efectividad, la correlación entre las actividades de instrucción y los
puntajes de GCSE no cambia con el rendimiento previo de los estudiantes. Por ejemplo, en las clases de
inglés, la interacción entre estudiantes y compañeros no es más o menos efectiva para los estudiantes
4. Conclusión
Este artículo describe varios resultados que contribuyen a responder la pregunta en curso: ¿Qué
implica realmente la enseñanza efectiva? ¿O qué prácticas de enseñanza son importantes para el
rendimiento de los estudiantes? Estudiamos las prácticas docentes y los logros de los estudiantes en las
Nuestro enfoque principal son las elecciones de los maestros sobre cómo distribuir el
tiempo de clase en diferentes actividades educativas. Los observadores del aula registraron cuánto
20
discusión entre niños y maestra” y “uso de pizarra por parte de la maestra”. Los
En resumen, encontramos que las elecciones de actividades educativas de los maestros predicen
puntajes posteriores de rendimiento de sus estudiantes. En las clases de matemáticas, por ejemplo, los
estudiantes obtienen puntajes más altos con maestros que dan más tiempo para la práctica individual. En la
clase de matemáticas típica (promedio), el maestro asigna "parte del tiempo" a la evaluación y la práctica. En una
clase en la que el profesor dedica "la mayor parte del tiempo" a la práctica y la evaluación, las puntuaciones del
GCSE son 0,08σ más altas que las de la clase típica (σ = desviaciones estándar de la puntuación de la prueba del
alumno). Para los exámenes de inglés, por el contrario, más tiempo trabajando con compañeros de clase predice
Los educadores e investigadores bien podrían ser escépticos de que el simple uso del tiempo prediga
las puntuaciones de los estudiantes, ya que es probable que los maestros varíen en la eficacia con la que llevan a
cabo diferentes actividades. Nuestros datos, tanto con el uso del tiempo como con las medidas de efectividad,
brindan una rara oportunidad de probar la hipótesis de ese escéptico. Cuando controlamos las calificaciones de
eficacia de la instrucción, el uso del tiempo de clase aún predice el rendimiento de los estudiantes. La
implicación práctica es que los estudiantes probablemente ganarían (o perderían) con los cambios en las
también predicen el rendimiento de los estudiantes. Un estudiante asignado a un maestro del cuartil superior,
medido por índices de eficacia, obtendrá una puntuación de aproximadamente 0,08σ más alta que un estudiante
similar asignado a un maestro del cuartil inferior. Las observaciones en el aula y las rúbricas no son nuevas para
las escuelas ni para los investigadores en educación. Aún así, nuestros datos son novedosos en algunos
aspectos. Lo más notable es que nuestros datos de observación fueron recopilados por compañeros maestros,
el observador y el observado eran compañeros de trabajo en la misma escuela, y los observadores recibieron
poca capacitación, mucha menos capacitación de la que a menudo se describe como necesaria para
observaciones "válidas" o "confiables". Al final, encontramos que las calificaciones de los pares sobre la eficacia
de la instrucción predicen al menos tan bien como se ha documentado en otros estudios. Par
21
la observación puede ser un enfoque factible y efectivo para aprender sobre las diferencias en la
Una forma de pensar en la magnitud de nuestras estimaciones es preguntarse qué significaría una
mejora de 0,08σ en las puntuaciones de GCSE para el futuro de un estudiante. De hecho, los puntajes de GCSE
son quizás más relevantes para el futuro de los estudiantes, en comparación con las pruebas a edades más
tempranas, porque los GCSE llegan al final de la educación obligatoria y también informan sobre las admisiones
a la universidad. En un nuevo análisis, Hodge, Little y Weldon (2021) estiman que un aumento de una desviación
estándar, 1σ, en los puntajes promedio de GCSE predice un aumento de alrededor del 20 por ciento en las
ganancias de por vida (VPN a los 16 años). Por lo tanto, a partir de 0,08σ, predeciríamos un aumento del 1,6 % en
los ingresos de por vida, o alrededor de 7500 libras esterlinas en valor actual a los 16 años.
22
Referencias
Angrist, J., Hull, P., Pathak, PA y Walters, C. (en prensa). “Valor escolar creíble-
agregado con loterías escolares suscritas”.Revista de Economía y
Estadística.
Aucejo, Esteban, Patrick Coate, Jane Cooley Fruehwirth, Sean Kelly y Zachary
Mozenter. (2020). "Efectos de coincidencia en el mercado laboral docente:
eficacia docente y composición del aula". Hoja de trabajo.
Aucejo, Esteban M., and Teresa Foy Romano. (2016). “Evaluar el efecto de
días de escuela y ausencias en el rendimiento de la puntuación de la prueba”,Revista de economía de la
educación 55, 70-87.
Aslam, Monazza y Geeta Kingdon. (2011). “¿Qué pueden hacer los maestros para educar a los alumnos?
¿logro?"Revista de Economía de la Educación, 30(3), 559-574
Bacher-Hicks, Andrew, Mark J. Chin, Thomas J. Kane y Douglas O. Staiger.
(2019). “Una evaluación experimental de tres medidas de calidad docente: valor
agregado, observaciones en el aula y encuestas de estudiantes”.Revista de Economía de
la Educación, 73, 101919.
Ballatore, Rosario María, and Paolo Sestito. (2016). “Tratar con el estudiante
heterogeneidad: estrategias de implementación del currículo y rendimiento estudiantil”. Banco
de Italia Temi di Discussione (Documento de trabajo) No. 1081.
23
Campbell, Shanyce L. y Matthew Ronfeldt. (2018). “Evaluación observacional
de maestros: ¿Midiendo más de lo que esperábamos?”Revista de investigación educativa
estadounidense, 55(6), 1233–1267.
24
ICPSR. (Dakota del Norte). “Medidas de Enseñanza Efectiva: 3c - Datos Base: Nivel de ítem
Puntuaciones observacionales, 2009-2011 Descripción de variables y frecuencias”.
ICPSR 34346.
Kane, Thomas J., Eric S. Taylor, John H. Tyler y Amy L. Wooten. (2011).
"Identificación de prácticas efectivas en el aula utilizando datos de rendimiento de los
estudiantes".Revista de Recursos Humanos, 46(3), 587-613.
25
Prendergast, C. (1999). “La provisión de incentivos en las empresas”.Diario de Economía
literatura, 37(1), 7-63.
Rockoff, Jonah E. y Cecilia Speroni. (2010). "Subjetivo y objetivo
evaluaciones de la eficacia docente”.Revista Económica Estadounidense, 100(2),
261-266.
Rockoff, Jonah E., Douglas O. Staiger, Thomas J. Kane y Eric S. Taylor. (2012).
“Información y evaluación de empleados: evidencia de una intervención
aleatoria en escuelas públicas”.Revista Económica Estadounidense, 102(7),
3184-3213.
Slater, Helen, Neil M. Davies y Simon Burgess. (2012). “¿Importan los maestros?
Midiendo la variación en la efectividad de los maestros en Inglaterra”.Boletín de
Oxford de Economía y Estadística, 74(5), 629-645.
Weisberg, D., Sexton, S., Mulhern, J., Keeling, D., Schunck, J., Palcisco, A. y
Morgan, K. (2009).El efecto widget: Nuestro fracaso nacional para reconocer y actuar
sobre las diferencias en la efectividad de los docentes.Nueva York; El Proyecto Nuevo
Maestro.
26
Medir la comprensión de los estudiantes 24 28 48
Lectura o dictado 52 35 13
0 20 40 60 80 100
Porcentaje de clases
Nota: Para cada actividad, la barra roja (izquierda) es la proporción de clases donde hubo “ninguna” o “muy poca” actividad. La barra azul
(derecha) es la proporción de clases en las que la actividad estaba ocurriendo "la mayor parte del tiempo" o "a tiempo completo". La barra
blanca (del medio) es "algunas veces". Las proporciones son de 2.687 observaciones, cada una de las cuales es la visita de un compañero
observador. a la clase del maestro .
27
(A) Puntuaciones a nivel de ítem
Nota: El panel A muestra un histograma de las 23 047 puntuaciones a nivel de ítem registradas en los diez ítems de la rúbrica. El panel B muestra un
histograma de 2687 puntajes promedio. Cada una de las 2687 observaciones es la visita de un compañero observador a la clase del maestro .El eje x es
el promedio simple de las puntuaciones de los diez ítems para una visita de observación dada, ignorando las puntuaciones de los ítems faltantes.
28
Tabla 1—Actividades de instrucción
Nota: Lista de actividades adaptada del proyecto SchoolTELLS (Kingdon, Banerji y Chaudhary 2008). La agrupación de
actividades en la columna de la derecha se describe en el texto.
29
Tabla 2—Estándares de la rúbrica y descripción asociada de “Efectivo”
1.b La cultura del salón de clases se caracteriza por altas expectativas para la
Establecer una cultura para el mayoría de los estudiantes y un compromiso genuino con la materia tanto
aprendizaje por parte del maestro como de los estudiantes, con el maestro
demostrando entusiasmo por el contenido y los estudiantes demostrando
orgullo por su trabajo.
1.c Se pierde poco tiempo de enseñanza debido a las rutinas del salón de clases
Gestión del aula y los procedimientos para las transiciones, el manejo de los útiles y el
Procedimientos desempeño de las tareas no docentes, que ocurren sin problemas. El
trabajo en grupo está bien organizado y la mayoría de los estudiantes se
involucran productivamente mientras trabajan sin supervisión.
1.d Los estándares de conducta parecen ser claros para los estudiantes, y el
Estudiante administrador maestro monitorea el comportamiento del estudiante contra esos
Comportamiento estándares. La respuesta del maestro al mal comportamiento de los
estudiantes es consistente, proporcionada, apropiada y respeta la dignidad
de los estudiantes.
30
Tabla 2 (cont.)—Estándares de la rúbrica y descripción asociada de “Efectivo”
Dominio 2. Instrucción
31
Tabla 3—Características descriptivas
Escuelas
con cualquier
Nota: Medias y desviaciones estándar (entre paréntesis) para las muestras descritas por los encabezados de las columnas.
32
Tabla 4—Correlaciones entre actividades de instrucción
(1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)
1. Debate abierto entre alumnos y profesor 1
2. Los estudiantes están trabajando en grupos. 0.19 1
3. Enseñanza uno a uno 0.01 0.11 1
4. Pasar tiempo especial para ayudar a los estudiantes débiles 0.08 0.14 0.39 1
5. Los estudiantes están haciendo trabajos escritos solos - 0.09 - 0,12 0,17 0,14 1
6. Medir la comprensión de los estudiantes 0.24 0.17 0.09 0.17 0.22 1
7. Asignar tareas o trabajos de clase a los estudiantes 0.08 0.14 0.09 0.14 0.20 0.23 1
8. Lectura o dictado - 0.09 - 0.11 - 0,04 -0,08 0,04 -0,02 0,12 1
9. Estudiantes copiando de la pizarra 0.00 - 0.06 - 0,01 0,01 0,07 0,03 0,12 0,31 1
10. Uso de la pizarra por parte del docente 0.05 - 0.08 - 0,03 0,00 0,00 0,13 0,09 0,29 0,33 1
11. Uso de un libro de texto durante las actividades de enseñanza - 0,04 0,04 0,07 0,05 0,10 0,04 0,15 0,10 0,19 0,04 0,00 0,07 0,08 0,05 1
12. Comprometidos en trabajos no docentes 0,20 0,08 0,26 0,07 0,13 0,05 0.20
Nota: Correlaciones del uso del tiempo de clase entre doce actividades de instrucción, netas de los efectos del observador. Cada una de las 2687 observaciones es la visita de un compañero
observador a la clase del maestro .Los observadores registraron el uso del tiempo en cinco categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4)
tiempo completo. Antes de estimar las correlaciones, primero calculamos observador 's media para cada elemento y restar esa media de todos los puntajes asignado para ese artículo.
33
Tabla 5—Actividades de instrucción
Nota: Medias y desviaciones estándar (columnas 5-7) para, y correlaciones entre (columnas 1-4), uso del tiempo de clase en cuatro grupos de
actividades de instrucción, descritos por etiquetas de fila. Esta tabla utiliza una muestra de 2687 observaciones. Cada una de las 2687
observaciones es la visita de un compañero observador a la clase del maestro .Cada una de las cuatro medidas (filas) es en sí misma el
promedio de varios puntajes de nivel de elemento registrados por observadores pares, como se describe en el texto. El uso del tiempo se mide
en categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4) tiempo completo.
34
Tabla 6—Clasificaciones de eficacia de la instrucción
Nota: Medias y desviaciones estándar (entre paréntesis), usando una muestra de 2687 observaciones en la columna 1. Cada una de las 2687
observaciones es la visita de un observador par a la clase del maestro .Las muestras de las columnas 2 y 3 son 1.510 y 1.177 respectivamente.
Para cada uno de los diez elementos enumerados anteriormente, los observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3
ineficaz, 4 a 6 básico, 7 a 9 eficaz y 10 a 12 muy eficaz. Los tres puntajes promedio anteriores son la media de los puntajes de nivel de elemento
relevantes, ignorando los puntajes faltantes.
35
Tabla 7—Actividades educativas y puntajes de rendimiento estudiantil
Actividades de instrucción
Instrucción directa 0.012 0.006 0.023 0.009
(0.016) (0.007) (0.015) (0.007)
Interacción entre estudiantes y compañeros 0.020 0.007 0.002 0.001
(0.013) (0.006) (0.014) (0.008)
Instrucción personalizada 0.004 0.003 0.003 0.003
(0.019) (0.008) (0.019) (0.008)
Práctica y evaluación 0,068** 0.023** 0.047* 0.015+
(0.019) (0.008) (0.019) (0.008)
(B) Inglés
Actividades de instrucción
Instrucción directa - 0.018 - 0.024+ - 0.009 - 0.019
(0.020) (0.013) (0.019) (0.012)
Interacción entre estudiantes y compañeros 0.053** 0.028** 0.043** 0.024**
(0.016) (0.009) (0.016) (0.009)
Instrucción personalizada - 0.021 - 0.011 - 0.026+ - 0.014
(0.013) (0.009) (0.014) (0.009)
Práctica y evaluación - 0.024 - 0.015 - 0.030+ - 0.021+
(0.016) (0.011) (0.017) (0.012)
Estudiante covariables √ √ √
Estudiante efectos fijos √ √ √
Nota: Estimaciones puntuales y conglomerados (profesor )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una
con la misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Cada columna
informa estimaciones de una sola regresión. La variable dependiente es un puntaje de prueba para el estudiante en tema (matemáticas o
inglés) medido en unidades de desviación estándar del estudiante. Las variables independientes clave, las filas en la tabla, son puntajes de
observación para el estudiante. 'profesor en tema ,dónde = ( ).Los puntajes de los maestros se miden en unidades de desviación estándar
del maestro. Maestro 'Las puntuaciones no varían entre los estudiantes, pero sí entre los observadores. quien determinaba las puntuaciones.
Los datos utilizados para ajustar cada regresión son estudiantes por profesor (sujeto equivalente )por observador ,pero cada uno el par se
pondera por igual, es decir, se pondera1/ dónde es el número de observadores Quien anoto
maestro .Todas las especificaciones incluyen observador efectos fijos y variables indicadoras por sujeto. Las “covariables del estudiante” incluyen
controles para el estudiante 's puntajes de exámenes anteriores en ambas materias, género, elegibilidad para comidas escolares gratuitas, puntaje
IDCACI, mes de nacimiento, año de examen y escuelas en Londres. Todas las especificaciones incluyen controles para la media de la clase y la desviación
estándar de las puntuaciones anteriores en ambas materias. Cuando falta una covariable, la completamos con cero e incluimos un indicador = 1 para
falta en la característica dada.
+ indica p<0,10, * 0,05 y ** 0,01
36
Apéndice A: Figuras y tablas adicionales
(A) Matemáticas
Lectura o dictado 50 36 15
0 20 40 60 80 100
Porcentaje de clases de matemáticas
(B) Inglés
Lectura o dictado 56 33 11
0 20 40 60 80 100
Porcentaje de clases de inglés
Nota: Para cada actividad, la barra roja (izquierda) es la proporción de clases donde hubo “ninguna” o “muy poca” actividad. La barra azul
(derecha) es la proporción de clases en las que la actividad estaba ocurriendo "la mayor parte del tiempo" o "a tiempo completo". La barra gris
(del medio) es "algunas veces". El panel A es para clases de matemáticas, y las proporciones son de 1510 observaciones, cada una de las cuales
es la visita de un compañero observador k a la clase de un profesor de matemáticas j. El panel B es para las clases de inglés y se basa en 1177
observaciones.
37
Apéndice figura A2—Distribución de calificaciones de efectividad de instrucción,
puntajes a nivel de ítem, escala de 4 puntos
Nota: Histograma de las 23 047 puntuaciones a nivel de elemento registradas en los diez elementos de la rúbrica. Esta figura muestra los mismos datos a
nivel de ítem que el panel A de la figura 2, excepto que la escala de puntajes de 12 puntos se ha reducido a una escala de 4 puntos: los puntajes 1-3 en el
panel A se convierten en puntajes de 1 en el panel B, 4-6 se convierten en 2, 7-9 se convierten en 3 y 10-12 se convierten en 4.
38
Tabla A1 del apéndice: correlaciones entre las calificaciones de eficacia de la instrucción
(1a) (1b) (1c) (1d) (1e) (2a) (2b) (2c) (2d) (2e)
1a. Crear un ambiente de respeto y compenetración 1
1b. Establecer una cultura para el aprendizaje 0.86 1
1c. Manejar los procedimientos del salón de clases 0.79 0.81 1
1d. Manejar el comportamiento de los estudiantes 0.79 0.80 0.82 1
1e. Organización del espacio físico 2a. 0.68 0.68 0.69 0.67 0.74 0.76 1 0.72 0.71 0.65 0.65 0.67
Comunicarse con los estudiantes 0.63 0.61 0.55 0.75 0.73 0.77 0.71 1 0.72 0.61 0.79 0.76
2b. Usar técnicas de cuestionamiento y discusión 2c. 0.62 0.65 0.63 0.59 0.58 0.66 0.68 0.72 0.70 1 0.71 0.66
Involucrar a los estudiantes en el aprendizaje 0.66 0.62 0.62 1
2d. Uso de la evaluación 1
2e. Demostrando flexibilidad y capacidad de respuesta. 1
Nota: Correlaciones de las calificaciones de eficacia de la instrucción basadas en rúbricas entre diez tareas, utilizando una muestra de 2687 observaciones. Cada una de las 2687 observaciones es la
visita de un observador par a la clase del maestro .Los observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3 ineficaz, 4 a 6 básica, 7 a 9 eficaz y 10 a 12 muy eficaz.
39
Tabla A2 del apéndice—Componentes principales de las calificaciones de la eficacia de la instrucción
Neto de observador
unidades originales efectos fijos
Componente Componente
1 2 1 2
(1) (2) (3) (4)
Peso en componente
1a. Crear un ambiente de respeto y compenetración 1b. 0.33 - 0,27 0.33 - 0,28
Establecer una cultura para el aprendizaje. 0.33 - 0,23 0.34 - 0,25
1c. Manejar los procedimientos del salón de clases 0.32 - 0,34 0.32 - 0,37
1d. Manejar el comportamiento de los estudiantes 0.32 - 0,37 0.32 - 0,38
1e. Organización del espacio físico 2a. Comunicarse 0.29 - 0,30 0.27 - 0,20
con los estudiantes 0.33 0.16 0.33 0.18
2b. Usar técnicas de cuestionamiento y discusión 2c. 0.30 0.44 0.30 0.44
Involucrar a los estudiantes en el aprendizaje 0.33 0.22 0.33 0.21
2d. Uso de la evaluación 0.30 0.39 0.29 0.41
2e. Demostrando flexibilidad y capacidad de respuesta. 0.31 0.33 0.31 0.32
Nota: Análisis de componentes principales de las calificaciones de eficacia educativa basadas en rúbricas entre diez tareas, utilizando una
muestra de 2687 observaciones. Cada una de las 2687 observaciones es la visita de un observador par a la clase del maestro .Los
observadores calificaron la eficacia en una escala del 1 al 12: 1 a 3 ineficaz, 4 a 6 básica, 7 a 9 eficaz y 10 a 12 muy eficaz. El cuerpo principal de
la tabla informa las cargas de los componentes, donde las cargas son los pesos asignados a cada elemento (filas) al calcular la puntuación de
un componente determinado (columnas). Las columnas 1-2 informan los componentes 1-2 utilizando índices de efectividad no ajustados,
según lo registrado por el observador .Las columnas 3 y 4 informan los componentes 1 y 2 utilizando índices de efectividad netos de los
efectos fijos del observador. Para las columnas 3-4, antes del análisis de componentes principales, primero calculamos el observador 's media
para cada elemento y restar esa media de todos los puntajes asignado para ese artículo.
40
Tabla A3 del apéndice—Características, actividades y calificaciones de los estudiantes
Clase
st.desv. Siempre libre
Nota: Estimaciones puntuales y conglomerados (profesor )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una con la
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Cada columna dentro de cada panel
informa los resultados de una regresión separada. Todos los detalles de la estimación son los mismos que para la tabla 7 con estas excepciones: La
variable dependiente, descrita en el encabezado de cada columna, es una característica de referencia del estudiante. o estudiante 's compañeros de
clase para la materia .Los únicos controles son los efectos fijos del observador y el tiempo en el "trabajo no docente" para los paneles A y C.
41
Apéndice tabla A4—Diferencias por puntajes de exámenes anteriores de los estudiantes
Nota: Estimaciones puntuales y conglomerados (profesor )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una con la
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Todos los detalles de la estimación
son los mismos que para la columna 5 de la tabla 7 con estas excepciones: Interactuamos con el maestro 's índice de eficacia de instrucción o uso de
actividades de instrucción con el estudiante 's puntaje de prueba anterior en materia ,recordar = ( ).En columnas con números pares, también
incluimos profesor efectos fijos
+ indica p<0,10, * 0,05 y ** 0,01
42
Apéndice B: Rúbrica de eficacia de la instrucción
43
DOMINIO 1: EL AMBIENTE DEL AULA (cont.)
Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)
44
DOMINIO 1: EL AMBIENTE DEL AULA (cont.)
Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)
45
DOMINIO 2: ENSEÑANZA
Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)
46
DOMINIO 2: ENSEÑANZA (cont.)
Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)
47
DOMINIO 2: ENSEÑANZA (cont.)
Componente Ineficaz (1-3) Básico (4-6) Efectivo (7-9) Altamente efectivo (10-12)
El maestro aprovecha la
oportunidad para mejorar
aprendizaje, basándose en
El maestro se adhiere al plan de El maestro intenta modificar la un evento espontáneo o
la lección, incluso cuando un lección cuando es necesario y El docente promueve el intereses de los estudiantes, o
cambio mejoraría la lección o responder a las preguntas de aprendizaje exitoso de todos los ajusta y diferencia con éxito la
2e abordaría la falta de interés de los alumnos, con un éxito estudiantes, haciendo instrucción para abordar los
demostrando los estudiantes. El maestro hace moderado. El ajustes según sea necesario a los malentendidos individuales de
Flexibilidad y a un lado al estudiante. el maestro acepta planes de lecciones y los estudiantes. El
Sensibilidad preguntas; cuando los estudiantes responsabilidad por el éxito de los estudiante complaciente el maestro asegura la
experimentan dificultades, el estudiantes, pero sólo tiene un preguntas, necesidades y el éxito de todos los estudiantes
maestro culpa a los estudiantes oa repertorio limitado de intereses. mediante el uso de un extenso
su entorno familiar. estrategias a las que recurrir. repertorio de enseñanza
estrategias y solicitar
recursos adicionales de la
escuela o la comunidad.
48
Apéndice C: Actividades de instrucción, componentes principales
Nuestro análisis principal divide las doce actividades de instrucción en cuatro categorías
mutuamente excluyentes y exhaustivas (como en las tablas 1, 5 y 7). Una caracterización alternativa son
los componentes principales de los doce elementos de actividad. La tabla C1 del apéndice muestra los
detalles de los componentes principales, y la tabla C2 del apéndice usa los puntajes de los componentes
para predecir los puntajes de GCSE de los estudiantes de manera similar a la tabla 7.
Hay compensaciones entre los dos enfoques. Los pesos complejos en el enfoque de
de la práctica docente. La desventaja es que los componentes principales son más difíciles de
describir con palabras. Por lo tanto, advertimos que las conclusiones sustantivas no deberían
principales. Por el contrario, los cuatro grupos simples son sencillos de entender, pero usan
actividades. Los pesos se muestran en el cuadro C1 del apéndice. Los primeros cinco componentes
principales juntos explican un poco más de la mitad de la variación en los datos de las actividades de
instrucción; cada uno de los cinco explica individualmente del 9 al 13 por ciento. Por construcción, las
Usamos las siguientes etiquetas para las puntuaciones de los componentes principales,
aunque otros pueden elegir etiquetas alternativas. (1) “Interacción estudiante-maestro”. El puntaje
estudiantes interactúan.2(2) “Grupos más pequeños versus toda la clase”. Esta puntuación aumenta
1Antes de estimar los componentes principales, primero cambiamos la escala de los datos del elemento de actividades. Los
observadores registran la frecuencia de una actividad en una escala de 0 a 4 con 0 "ninguna" del tiempo a 4 "tiempo completo"
durante la observación. Para cambiar la escala, dividimos cada uno de los doce elementos por la suma de los elementos. Así, los
ítems reescalados miden la proporción de toda la actividad registrada por el observador.
2Con fines expositivos, invertimos el signo de los componentes (1), (2) y (3).
49
evaluación y práctica, y disminución en la instrucción, especialmente instrucción individualizada. (4)
“Trabajo en grupo versus trabajo individual”. Este puntaje aumenta en el tiempo en que los
estudiantes interactúan con sus compañeros de clase y disminuye en el tiempo en que los
estudiantes trabajan solos o uno a uno con el maestro. (5) “Aprendizaje guiado por el maestro”.
Esta puntuación aumenta al medir la comprensión y ayudar a los estudiantes débiles, y el uso de la
pizarra, y disminuye en la discusión abierta, los niños que trabajan solos y las conferencias
unidireccionales.
Los componentes principales de las actividades de instrucción sí predicen los puntajes de las pruebas
de los estudiantes, como se muestra en la tabla C2 del apéndice. Para los GCSE ingleses, el cuarto componente
principal se destaca de los demás. El coeficiente para el componente cuatro es 0,05σ, mientras que todas las
demás estimaciones son inferiores a 0,01σ y están lejos de ser estadísticamente significativas. Nuestra etiqueta
abreviada para el componente cuatro es “trabajo en grupo versus trabajo individual”; está aumentando en
actividades donde los estudiantes interactúan con sus compañeros de clase y disminuyendo en actividades
agrupamiento más simple de actividades, en el cuadro 7, terminan en una conclusión sustantiva similar
para predecir los puntajes de las pruebas de inglés. Ambos enfatizan actividades donde los estudiantes
interactúan con sus compañeros de clase. Pero estas no son dos pruebas independientes, y la similitud
general no debería sorprender. Ambos enfoques combinan actividades basadas en la misma matriz de
correlación del cuadro 4. Aún así, las ponderaciones de los componentes principales, que se muestran en
el cuadro C1 del apéndice, son bastante diferentes del enfoque del cuadro 7, que pondera los elementos
Las puntuaciones del GCSE de Matemáticas se predicen, en primer lugar, por el tercer
componente principal. Nuestra etiqueta abreviada para este componente es "práctica versus
instrucción". Este patrón es consistente con el enfoque de grupos simples en la tabla 7. De hecho,
(i) el tercer componente “práctica versus instrucción” está correlacionado 0.81 con (ii) la diferencia
50
El quinto componente principal también predice los puntajes de matemáticas de los
estudiantes. Los coeficientes estimados para los componentes tercero y quinto son similares en
magnitud y precisión. El tercero explica el 11 por ciento de la variación en los datos del elemento de
actividad, pero el quinto explica casi tanto como el 8 por ciento. El quinto componente sugiere que
en los datos de actividades se esconde una perspectiva adicional potencial. Sin embargo, el quinto
componente principal es difícil de describir con palabras. Nuestro mejor intento de una descripción
Para resumir, las actividades de instrucción que los maestros eligen usar en sus clases explican
en parte el crecimiento de los logros de los estudiantes. En matemáticas, los estudiantes obtienen
mejores calificaciones cuando dedican más tiempo a la práctica y evaluación de los estudiantes. En inglés,
los estudiantes puntúan más alto cuando pasan más tiempo trabajando y hablando con sus compañeros
de clase. Estos patrones son robustos a la forma en que combinamos actividades en grupos o
componentes. Nuestras conclusiones tampoco se basan en las descripciones abreviadas que usamos
51
Apéndice tabla C1—Componentes principales de las actividades de instrucción
Componente
1 2 3 4 5
(1) (2) (3) (4) (4)
Peso en componente
1. Discusión abierta entre los niños y el maestro - 0,43 0.12 0.05 0.27 - 0,45
2. Los niños están trabajando en grupos - 0.11 - 0,26 - 0.02 0,61 0.14
3. Enseñanza uno a uno 0.04 - 0.29 0,55 - 0,15 - 0.22
4. Pasar tiempo especial para ayudar a los estudiantes débiles - 0.10 - 0,20 0.51 - 0.22 0.42
5. Los niños están haciendo trabajos escritos solos 0.20 - 0,26 - 0,26 - 0,54 - 0,35
6. Medir la comprensión de los estudiantes - 0,32 - 0.19 - 0,54 - 0.09 0.19
7. Asignar tareas o trabajos de clase a los niños 0.38 - 0.08 - 0.22 0.12 0.22
8. Lectura o dictado 0.14 0.51 0.06 0.04 - 0,34
9. Niños copiando de la pizarra 0.29 0.48 0.09 0.03 0.14
10. Uso de la pizarra por parte del docente - 0.24 0.42 - 0.04 - 0,31 0.43
11. Uso de un libro de texto durante las actividades de enseñanza 0.39 - 0.06 0.07 0.27 0.15
12. Comprometidos en trabajos no docentes 0.44 - 0,12 - 0,14 0.01 - 0.07
Nota: Análisis de componentes principales del uso del tiempo de clase entre doce actividades de instrucción, utilizando una muestra de 2.687
observaciones. Cada una de las 2687 observaciones es la visita de un compañero observador a la clase del maestro .Los observadores registraron el uso
del tiempo en cinco categorías ordenadas: (0) nada, (1) muy poco, (2) parte del tiempo, (3) la mayor parte del tiempo y (4) tiempo completo. Antes del
análisis de componentes principales, primero volvimos a escalar los datos, dividiendo cada uno de los doce puntajes de 0 a 4 elementos por la suma de
los puntajes de los elementos de la observación. El cuerpo principal de la tabla informa las cargas de los componentes, donde las cargas son los pesos
asignados a cada elemento (filas) al calcular la puntuación de un componente determinado (columnas).
52
Apéndice tabla C2—Actividades de instrucción y puntajes de rendimiento de los estudiantes,
enfoque de componentes principales
Actividades de instrucción
1. “Interacción alumno-profesor” 0.022 0.013 - 0,002 0,006
Más tiempo en el que el profesor y los alumnos interactúan (0.020) (0.009) (0.020) (0.008)
2. “Grupos más pequeños versus toda la clase” 0.019 0.007 0.008 0.006
Más tiempo en actividades individuales y de grupos pequeños, menos (0.015) (0.006) (0.015) (0.007)
tiempo en actividades de toda la clase
3. “Práctica vs instrucción” 0.039* 0.008 0.028+ 0.005
Más tiempo para la evaluación y práctica de los estudiantes, menos tiempo para (0.016) (0.006) (0.016) (0.006)
la instrucción, especialmente la instrucción individualizada
4. “Trabajo en grupo vs trabajo individual” - 0,014 0,001 -0,020 -0,001
Más tiempo en el que los estudiantes interactúan con sus compañeros de (0.014) (0.008) (0.013) (0.008)
clase, menos tiempo trabajando solos o uno a uno con el maestro
5. “Aprendizaje guiado por el maestro” 0,048** 0,019** 0,041** 0.017*
Más tiempo usando la pizarra y ayudando a los estudiantes, menos (0,014) (0,007) (0,013) (0.007)
tiempo trabajando solo y dando conferencias unidireccionales.
(B) Inglés
Actividades de instrucción
1. “Interacción alumno-profesor” - 0.009 0.012 -0.018 0.008 (0.013)
(0.008) (0.012) (0.007) 0.007 0.006
2. “Grupos más pequeños versus toda la clase” 0.001 0.003 (0.012) (0.007) (0.012)
(0.007) 0.006 0.007 0.002 0.005
3. “Práctica vs instrucción” (0.011) (0.006) (0.011) (0.006)
0,047** 0,022** 0,045** 0,023**
4. “Trabajo en grupo vs trabajo individual” (0,011) (0,006) (0,012) (0,006) 0,003
0,002 0,003 -0,000 (0,014) (0,009)
5. “Aprendizaje guiado por el maestro” (0,014) (0,009)
Estudiante covariables √ √
Estudiante efectos fijos √ √
Nota: Estimaciones puntuales y conglomerados (profesor )errores estándar corregidos de varias regresiones de mínimos cuadrados, cada una con la
misma muestra de estimación de 253 observaciones de maestros y 9,512 observaciones de estudiante por materia. Todos los detalles de estimación son
los mismos que para la tabla 7 con una excepción: reemplazamos los cuatro grupos de actividades de instrucción con cinco puntajes de componentes
principales.
+ indica p<0,10, * 0,05 y ** 0,01
53