0% encontró este documento útil (0 votos)
5 vistas1 página

02 Understanding The Data - Es

El vídeo presenta un conjunto de datos sobre precios de vehículos usados, abierto por Jeffrey C. Schlemmer, en formato CSV. Cada fila representa un vehículo y contiene 26 columnas, donde la primera fila no es un encabezado, y el atributo 26 es el precio, que se busca predecir a partir de otras características. Este conjunto de datos es de 1985, lo que puede hacer que los precios parezcan bajos, pero el enfoque principal es aprender a analizar los datos.

Cargado por

Lougmiri Mohamed
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como TXT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
5 vistas1 página

02 Understanding The Data - Es

El vídeo presenta un conjunto de datos sobre precios de vehículos usados, abierto por Jeffrey C. Schlemmer, en formato CSV. Cada fila representa un vehículo y contiene 26 columnas, donde la primera fila no es un encabezado, y el atributo 26 es el precio, que se busca predecir a partir de otras características. Este conjunto de datos es de 1985, lo que puede hacer que los precios parezcan bajos, pero el enfoque principal es aprender a analizar los datos.

Cargado por

Lougmiri Mohamed
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como TXT, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 1

En este vídeo, vamos a ver el conjunto de datos sobre los precios de los vehículos

usados. El conjunto de datos utilizado en este curso es un conjunto de datos


abierto por Jeffrey C. Schlemmer. Este conjunto de datos está en formato CSV, que
separa cada uno de los valores con comas, por lo que es muy fácil de importar en la
mayoría de las herramientas o aplicaciones. Cada línea representa una fila en el
conjunto de datos. En el laboratorio práctico de este módulo, podrás descargar y
utilizar el archivo CSV. ¿Notas algo diferente en la primera fila? A veces, la
primera fila es un encabezado, que contiene un nombre de columna para cada una de
las 26 columnas. Pero en este ejemplo, es solo otra fila de datos. Por lo tanto,
aquí está la documentación sobre lo que cada una de las 26 columnas representa. Hay
un montón de columnas y voy a ir a través de algunos de los nombres de columna,
pero también puede ver el enlace en la parte inferior de la diapositiva para ir a
través de las descripciones usted mismo. El primer atributo, simboling, corresponde
al nivel de riesgo de seguro de un automóvil. A los coches se les asigna
inicialmente un símbolo de factor de riesgo asociado a su precio. Entonces, si un
automóvil es más arriesgado, este símbolo se ajusta moviéndolo hacia arriba. Un
valor de más tres indica que el auto es arriesgado. Menos tres, eso es
probablemente bastante seguro. El segundo atributo, pérdidas normalizadas, es el
pago de pérdidas promedio relativo por año de vehículo asegurado. Este valor se
normaliza para todos los autos dentro de una clasificación de tamaño particular,
dos puertas pequeñas, vagones estación, especialidad deportiva, etc., y representa
la pérdida promedio por coche por año. Los valores oscilan entre 65 y 256. Los
otros atributos son fáciles de entender. Si desea consultar más detalles, consulte
el enlace en la parte inferior de la diapositiva. De acuerdo. Después de entender
el significado de cada característica, notaremos que el atributo 26 es el precio.
Este es nuestro valor objetivo o etiqueta en otras palabras. Esto significa que el
precio es el valor que queremos predecir a partir del conjunto de datos y los
predictores deben ser todas las demás variables enumeradas como simbolización,
normalized-loss, make, etc. Por lo tanto, el objetivo de este proyecto es predecir
el precio en términos de otras características del automóvil. Sólo una nota rápida.
Este conjunto de datos es en realidad de 1985. Por lo tanto, los precios de los
coches para los modelos pueden parecer un poco bajos. Pero ten en cuenta que el
objetivo de este ejercicio es aprender a analizar los datos.

También podría gustarte