Proyecto BD1 Final

BIG DATA Y MACHINE LEARNING
Prevención e identificación de violencia familiar

Fecha: [31/05/2020]
Curso: Big Data y Machine Learning – Ciclo: 2020 -1

Página 1
Información del Proyecto
Ludeña Gavino Steven
Integrantes
Proyecto Prevención e identificación de violencia familiar

Fecha de preparación 31/05/2020
Capitulo II

Página 2
Caso de uso Prevención e identificación de violencia
familiar
Antecedentes
La violencia es un acto que facilita la dominación a un individuo, sometiendo a

quien la sufre y otorgándole superioridad a quien la ejerce. Es un problema que se
encuentra en todo el mundo y al no discriminar a la víctima como al perpetrador,
se ha convertido en un problema de salud pública, ya que no solo afecta en un
plano físico, sino también en uno psicológico. Por esto, a lo largo de los años se
han desarrollado medidas para localizar y minimizar los casos, ya sea por
organizaciones internacionales o proyectos del gobierno.
Por otro lado, al ser un fenómeno presente y sumando la reciente pandemia el

covid 19, muchos de familiares se encuentran encerrados con sus agresores,
ocasionando que aumente los casos de violencia familiar.
Escenario del problema a resolver
Las tecnologías de Big Data y Analítica pueden ayudar a predecir e identificar los
casos de violencia intrafamiliar. Al ser un problema que puede perjudicar a
muchos sectores de la población, la alerta de casos de violencia producidos en el
hogar es tomado como prioridad para el bienestar de la población, ya que no solo
es una problemática que afecta a los menores del hogar, sino que este fenómeno
puede ocurrir en cualquier ámbito donde una persona se pueda encontrar.
Objetivos generales y específicos
Por tal motivo, identificar y predecir la violencia familiar es una manera de combatir
los casos de violencia intrafamiliar que puedan suscitar durante el aislamiento de
Página 3
las personas debido a la reciente pandemia. En este caso en concreto, el objetivo
de este proyecto se llevará a cabo gracias la ayuda de la SIDPOL (Sistema de
denuncia policial), ya que posee registros diarios de manera virtual y presencial.
Además, se obtendrán publicaciones del ministerio de la mujer para tener un
amplio margen de información para atender este tipo de problemática, de esta
manera se buscará prevenir los posibles casos que puedan suceder en el ámbito
familiar.
Hipótesis
El problema de la violencia familiar puede abordarse desde muchos lugares,

además puede ser ocasionado por muchos factores que hasta pueden ser ajenos
al agresor. Existen instituciones encargadas de recolectar información y atender
los casos de persona maltratadas. Sin embargo, no todos los incidentes ocurridos
son tratados de la mejor manera, ya sea porque algunas denuncias no sean
tomadas en cuenta o porque no se les da la prioridad requerida. Además, no todos
los casos finalizan de una buena manera. Por ello, tener acceso a diferente data
ayudara a encontrar nuevas formas de atender esta problemática y prevenir que
ocurran estos casos. Por esta razón, se deberá definir la siguiente pregunta: “Que
sector poblacional tiene más posibilidades de sufrir violencia intrafamiliar “. La
pregunta se refiere a que se tendrá que analizar la información obtenida de los
registros anteriormente señalados otorgados por los miembros familiares, de esta
forma se tendrá un bagaje acerca de la violencia familiar y se aplicaran ciertas
medidas para prevenir que ocurran.
Estructura
Se tiene que contar con herramientas que nos facilitaran la recopilación de

información que responderá a la pregunta planteada, por eso se deberá
seleccionar una estructura de software capaz de almacenar y procesar una

Página 4
variedad de datos al instante. Por ello, se necesitará un buen procesamiento de
datos, que sea un software libre y seguro de fallos. Además, se requiere que
acepte una variedad de formatos de datos. Teniendo todas las consideraciones en
cuenta, se escogerá “ “ como estructura de software.
Supuestos y Restricciones
El plan que se tiene en consideración de llevar a cabo puede verse afectado en

algunas ocasiones por la información recolectada, como puede ser la mala
interpretación de los datos. La mala gestión de esta información puede entorpecer
el objetivo a seguir, agravando más la situación que corrigiéndola.
Algunas restricciones a considera pueden ser causadas por la familia, ya sea

porque no quiera dar de su parte para responder a las preguntas solicitadas o no
quiera dar la información necesaria a la institución.

Página 5
Variables del .CSV

Página 6
Variables con los que se tiene pensado trabajar
Limpieza de Datos
Se eliminan los NAN de todas las columnas y filas
Inicialmente teníamos más de 179571 registros, posterior a la limpieza de datos

nulos quedaron 1490

Página 7
Página 8
Página 9

Proyecto BD1 Final

Cargado por

Copyright:

Formatos disponibles

Proyecto BD1 Final

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Proyecto BD1 Final

Cargado por

Copyright:

Formatos disponibles

BIG DATA Y MACHINE LEARNING

Prevención e identificación de violencia familiar

Curso: Big Data y Machine Learning – Ciclo: 2020 -1

Proyecto Prevención e identificación de violencia familiar

Curso: Big Data y Machine Learning – Ciclo: 2020 -1

La violencia es un acto que facilita la dominación a un individuo, sometiendo a

Por otro lado, al ser un fenómeno presente y sumando la reciente pandemia el

Escenario del problema a resolver

Objetivos generales y específicos

El problema de la violencia familiar puede abordarse desde muchos lugares,

Se tiene que contar con herramientas que nos facilitaran la recopilación de

Curso: Big Data y Machine Learning – Ciclo: 2020 -1

El plan que se tiene en consideración de llevar a cabo puede verse afectado en

Algunas restricciones a considera pueden ser causadas por la familia, ya sea

Curso: Big Data y Machine Learning – Ciclo: 2020 -1

Curso: Big Data y Machine Learning – Ciclo: 2020 -1

Se eliminan los NAN de todas las columnas y filas

Inicialmente teníamos más de 179571 registros, posterior a la limpieza de datos

Curso: Big Data y Machine Learning – Ciclo: 2020 -1

También podría gustarte