0 calificaciones0% encontró este documento útil (0 votos)
5 vistas1 página
02 Understanding The Data - Es
El vídeo presenta un conjunto de datos sobre precios de vehículos usados, abierto por Jeffrey C. Schlemmer, en formato CSV. Cada fila representa un vehículo y contiene 26 columnas, donde la primera fila no es un encabezado, y el atributo 26 es el precio, que se busca predecir a partir de otras características. Este conjunto de datos es de 1985, lo que puede hacer que los precios parezcan bajos, pero el enfoque principal es aprender a analizar los datos.
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como TXT, PDF, TXT o lee en línea desde Scribd
0 calificaciones0% encontró este documento útil (0 votos)
5 vistas1 página
02 Understanding The Data - Es
El vídeo presenta un conjunto de datos sobre precios de vehículos usados, abierto por Jeffrey C. Schlemmer, en formato CSV. Cada fila representa un vehículo y contiene 26 columnas, donde la primera fila no es un encabezado, y el atributo 26 es el precio, que se busca predecir a partir de otras características. Este conjunto de datos es de 1985, lo que puede hacer que los precios parezcan bajos, pero el enfoque principal es aprender a analizar los datos.
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como TXT, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 1
En este vídeo, vamos a ver el conjunto de datos sobre los precios de los vehículos
usados. El conjunto de datos utilizado en este curso es un conjunto de datos
abierto por Jeffrey C. Schlemmer. Este conjunto de datos está en formato CSV, que separa cada uno de los valores con comas, por lo que es muy fácil de importar en la mayoría de las herramientas o aplicaciones. Cada línea representa una fila en el conjunto de datos. En el laboratorio práctico de este módulo, podrás descargar y utilizar el archivo CSV. ¿Notas algo diferente en la primera fila? A veces, la primera fila es un encabezado, que contiene un nombre de columna para cada una de las 26 columnas. Pero en este ejemplo, es solo otra fila de datos. Por lo tanto, aquí está la documentación sobre lo que cada una de las 26 columnas representa. Hay un montón de columnas y voy a ir a través de algunos de los nombres de columna, pero también puede ver el enlace en la parte inferior de la diapositiva para ir a través de las descripciones usted mismo. El primer atributo, simboling, corresponde al nivel de riesgo de seguro de un automóvil. A los coches se les asigna inicialmente un símbolo de factor de riesgo asociado a su precio. Entonces, si un automóvil es más arriesgado, este símbolo se ajusta moviéndolo hacia arriba. Un valor de más tres indica que el auto es arriesgado. Menos tres, eso es probablemente bastante seguro. El segundo atributo, pérdidas normalizadas, es el pago de pérdidas promedio relativo por año de vehículo asegurado. Este valor se normaliza para todos los autos dentro de una clasificación de tamaño particular, dos puertas pequeñas, vagones estación, especialidad deportiva, etc., y representa la pérdida promedio por coche por año. Los valores oscilan entre 65 y 256. Los otros atributos son fáciles de entender. Si desea consultar más detalles, consulte el enlace en la parte inferior de la diapositiva. De acuerdo. Después de entender el significado de cada característica, notaremos que el atributo 26 es el precio. Este es nuestro valor objetivo o etiqueta en otras palabras. Esto significa que el precio es el valor que queremos predecir a partir del conjunto de datos y los predictores deben ser todas las demás variables enumeradas como simbolización, normalized-loss, make, etc. Por lo tanto, el objetivo de este proyecto es predecir el precio en términos de otras características del automóvil. Sólo una nota rápida. Este conjunto de datos es en realidad de 1985. Por lo tanto, los precios de los coches para los modelos pueden parecer un poco bajos. Pero ten en cuenta que el objetivo de este ejercicio es aprender a analizar los datos.