Ensayo SQL For Data Science

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 3

SQL For Data Science

Luis Miguel Sanchez Orellano


Código: U20181A498
La ciencia de datos es un término moderno que abarca una gran cantidad de disciplinas
diferentes. Podemos pensar en la ciencia de datos como un campo que utiliza varias
herramientas, procesos, métodos y algoritmos para extraer conocimiento e información de los
datos, que se pueden almacenar de forma estructurada y no estructurada. Podemos decir también
que la ciencia de datos como bastante similar a la minería de datos. La ciencia de datos como
campo incluye todo lo que está asociado con la manipulación de datos: limpieza, preparación,
análisis, visualización, etc. La ciencia de datos combina numerosas habilidades que se pueden
usar para trabajar con datos, como programación, razonamiento, habilidades matemáticas y
estadísticas.

RECUPERACION DE DATOS CON SQL

 El SELECT: Se emplea para seleccionar los campos que quieren mostrarse en la consulta
donde admite dos modificaciones: ALL (por defecto) y DISTINCT.
ALL:  Extrae todos los registros que cumplan las condiciones, aunque estén repetidos. No es
necesario indicarlo porque es el valor por defecto.
DISTINCT: Omite los registros duplicados
Así como también tenemos distintas opciones como son:
 <lista de campos>
 FROM
 WHERE
 GROUP BY
 HAVING
 ORDER BY
La relación entre las distintas tablas se establece en la cláusula FROM que es la que nos indica
las tablas de las que se extraen los datos. No olvidemos que estamos en una BBDD relacional, y
que manejamos Tablas con relaciones entre ellas. Y la cláusula FROM dispone de una serie de
operadores para establecer las combinaciones entre tablas.
Así como también para la creación de tablas podemos decir que una de las ventajas principales
para crear tablas con T-SQL es la facilidad de replicar las tablas en otras bases de datos en
segundos. Además, podemos decir que al aplicar cambios a las tablas recién creadas sin tener
que crear nuevamente toda la tabla, como se haría en el diseñador.

Respecto al filtrado de datos, podemos explicar cual es la diferencia entre WHERE y HAVING.
La cláusula WHERE filtra los datos antes de agregarlos; afecta la cantidad de registros que
entran en la agregación. La cláusula HAVING filtra los datos después de agregarlos. Quizás se
pregunte si podemos agregar una función agregada como parte de un predicado en la cláusula
WHERE. Sin embargo, no debemos hacer esto porque el resultado de la función agregada no se
conoce cuando la cláusula WHERE filtra filas. ¿Podemos agregar una columna no agregada en
la cláusula HAVING? Sí, podemos, pero reduce la legibilidad de nuestras consultas.
Los SQL WILCARDS o COMODINES, se utilizan para sustituir cualquier otro carácter en una
cadena, es decir se utilizar con el operador SQL LIKE. Ya que el operador LIKE se utiliza en
una cláusula WHERE que permiten buscar patrones específicos en una columna; En el operador
LIKE hay 2 comodines utilizados juntos que son % y el subrayado.
Unas de las desventajas y que necesitamos aprender una nueva sintaxis si las subconsultas son
son bien conocidas y tradicionales. Esto se debe al rendimiento. Estamos trabajando con una
cantidad muy pequeña de datos, pero el agregado en ejecución sigue siendo el doble de rápido
que la subconsulta tradicional. Es útil tener en cuenta que nuestro único marco son conjuntos de
datos completos, lo que significa que no necesitamos correlacionar la subconsulta con la
consulta principal. Una subconsulta correlacionada puede hacer que la consulta principal se
ralentice aún más.
Para sacar provecho a una base de datos es dominar las queries completas que incluyen la unión
de tablas, pero hay que saber que no todas las uniones son iguales y como respuesta no da el
mismo resultado, una manera de entender es practicar, de tal forma es recomendable crear tablas
sencillas y lances las queries como forma de ver en vivo los resultados de cada tipo de join y así
entender para que casos te puede servir, de tal forma no hace falta de tener muchos campos, ni
muchos registros.
Por otra parte, Microsoft SQL Server también tenemos las funciones para poder trabajar con
cadenas de caracteres, las cuales están son algunas:

 Substring (cadena, inicio, longitud): Esta opción devuelve una parte de las cadenas
especificada como primer argumento, empezando por la función especificada del
segundo argumento y también de tantas características de longitud como indica el tercer
argumento.

 Srt (numero, longitud, cantidaddecimales): convierte números a caracteres; el primer


parámetro menciona el valor numérico a convertir, el segundo la longitud del resultado
y el tercero la cantidad de decimales, también mencionar que el 2do y 3ro son
opcionales y tienen ser positivos

 Stuff (cadena 1, inicio, cantidad, cadena 2): Inserta la cadena enviada como cuarto
argumento, en la posición indicada en el segundo argumento, esto reemplazando la
cantidad de caracteres indicadas por el tercer argumento en la cadena que es primer
parámetro.
Por lo mencionado anteriormente podemos aprender y adquirir nuevos conocimientos con las
herramientas que nos proporciona en SQL, los cuales nos permitirá un mayor desenvolvimiento
en el área profesional ya que dicha herramienta tiene mucha demanda en el mercado, debido a
que los datos SQL nos brinda la opción ideal para la informática, ya que encontramos muchos
sistemas de bases de datos flexibles, escalables, de alto rendimiento y buena funcionalidad que
con las opciones de sus herramientas nos permiten un mejor análisis.

Bibliografía
ADM. (24 de Febrero de 2020). Comandos SQL Para la Recuperación de Datos. Obtenido de
https://jesgargardon.com/blog/comandos-sql-para-la-recuperacion-de-datos/#Sintaxis
Álvarez, G. (08 de Julio de 2019). Crear Tablas en SQL Server con T-SQL. Obtenido de
https://www.kyocode.com/2019/07/crear-tablas-sql-server-t-sql/
Badia, A. (2020). SQL For Data Science. Louisville, KY, USA: Computer Engineering &
Computer Science.
chmel, M., & Vladimir, M. (2018). Hands-On Data Science with SQL Server 2017.

También podría gustarte