Proyecto BD1 Final

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

BIG DATA Y MACHINE LEARNING

Prevención e identificación de violencia familiar


Fecha: [31/05/2020]

Curso: Big Data y Machine Learning – Ciclo: 2020 -1


Página 1
Información del Proyecto
Ludeña Gavino Steven
Integrantes

Proyecto Prevención e identificación de violencia familiar


Fecha de preparación 31/05/2020

Capitulo II

Curso: Big Data y Machine Learning – Ciclo: 2020 -1


Página 2
Caso de uso Prevención e identificación de violencia
familiar

Antecedentes

La violencia es un acto que facilita la dominación a un individuo, sometiendo a


quien la sufre y otorgándole superioridad a quien la ejerce. Es un problema que se
encuentra en todo el mundo y al no discriminar a la víctima como al perpetrador,
se ha convertido en un problema de salud pública, ya que no solo afecta en un
plano físico, sino también en uno psicológico. Por esto, a lo largo de los años se
han desarrollado medidas para localizar y minimizar los casos, ya sea por
organizaciones internacionales o proyectos del gobierno.

Por otro lado, al ser un fenómeno presente y sumando la reciente pandemia el


covid 19, muchos de familiares se encuentran encerrados con sus agresores,
ocasionando que aumente los casos de violencia familiar.

Escenario del problema a resolver

Las tecnologías de Big Data y Analítica pueden ayudar a predecir e identificar los
casos de violencia intrafamiliar. Al ser un problema que puede perjudicar a
muchos sectores de la población, la alerta de casos de violencia producidos en el
hogar es tomado como prioridad para el bienestar de la población, ya que no solo
es una problemática que afecta a los menores del hogar, sino que este fenómeno
puede ocurrir en cualquier ámbito donde una persona se pueda encontrar.

Objetivos generales y específicos

Por tal motivo, identificar y predecir la violencia familiar es una manera de combatir
los casos de violencia intrafamiliar que puedan suscitar durante el aislamiento de
Curso: Big Data y Machine Learning – Ciclo: 2020 -1
Página 3
las personas debido a la reciente pandemia. En este caso en concreto, el objetivo
de este proyecto se llevará a cabo gracias la ayuda de la SIDPOL (Sistema de
denuncia policial), ya que posee registros diarios de manera virtual y presencial.
Además, se obtendrán publicaciones del ministerio de la mujer para tener un
amplio margen de información para atender este tipo de problemática, de esta
manera se buscará prevenir los posibles casos que puedan suceder en el ámbito
familiar.

Hipótesis

El problema de la violencia familiar puede abordarse desde muchos lugares,


además puede ser ocasionado por muchos factores que hasta pueden ser ajenos
al agresor. Existen instituciones encargadas de recolectar información y atender
los casos de persona maltratadas. Sin embargo, no todos los incidentes ocurridos
son tratados de la mejor manera, ya sea porque algunas denuncias no sean
tomadas en cuenta o porque no se les da la prioridad requerida. Además, no todos
los casos finalizan de una buena manera. Por ello, tener acceso a diferente data
ayudara a encontrar nuevas formas de atender esta problemática y prevenir que
ocurran estos casos. Por esta razón, se deberá definir la siguiente pregunta: “Que
sector poblacional tiene más posibilidades de sufrir violencia intrafamiliar “. La
pregunta se refiere a que se tendrá que analizar la información obtenida de los
registros anteriormente señalados otorgados por los miembros familiares, de esta
forma se tendrá un bagaje acerca de la violencia familiar y se aplicaran ciertas
medidas para prevenir que ocurran.

Estructura

Se tiene que contar con herramientas que nos facilitaran la recopilación de


información que responderá a la pregunta planteada, por eso se deberá
seleccionar una estructura de software capaz de almacenar y procesar una

Curso: Big Data y Machine Learning – Ciclo: 2020 -1


Página 4
variedad de datos al instante. Por ello, se necesitará un buen procesamiento de
datos, que sea un software libre y seguro de fallos. Además, se requiere que
acepte una variedad de formatos de datos. Teniendo todas las consideraciones en
cuenta, se escogerá “ “ como estructura de software.

Supuestos y Restricciones

El plan que se tiene en consideración de llevar a cabo puede verse afectado en


algunas ocasiones por la información recolectada, como puede ser la mala
interpretación de los datos. La mala gestión de esta información puede entorpecer
el objetivo a seguir, agravando más la situación que corrigiéndola.

Algunas restricciones a considera pueden ser causadas por la familia, ya sea


porque no quiera dar de su parte para responder a las preguntas solicitadas o no
quiera dar la información necesaria a la institución.

Curso: Big Data y Machine Learning – Ciclo: 2020 -1


Página 5
Variables del .CSV

Curso: Big Data y Machine Learning – Ciclo: 2020 -1


Página 6
Variables con los que se tiene pensado trabajar

Limpieza de Datos

Se eliminan los NAN de todas las columnas y filas

Inicialmente teníamos más de 179571 registros, posterior a la limpieza de datos


nulos quedaron 1490

Curso: Big Data y Machine Learning – Ciclo: 2020 -1


Página 7
Curso: Big Data y Machine Learning – Ciclo: 2020 -1
Página 8
Curso: Big Data y Machine Learning – Ciclo: 2020 -1
Página 9

También podría gustarte