GithubHelp home page GithubHelp logo

rasff-predictions-dashboard's Introduction

RASFF-predictions-dashboard

Análisis de los datos escrapeados de RASFF portal y desarrollo de un modelo de predicción en varias etapas y de varias características de las posibles alertas futuras. Así mismo se implementan algunas figuras para el desarrollo de un dashboard interactivo con la información estadística de las alertas y de las propias predicciones.

Organización de los archivos:

El proyecto cuenta con las siguientes carpetas:

  • Dashboard
  • Dimensionality_reduction
  • Independence_test
  • Kohonen
  • Models
  • Preprocessing

Todos los archivos están pensados para ejecutarse linealmente, excepto los que contienen figuras desarrolladas con la librería Bokeh.

Dashboard

Archivos con las figuras para la implementación del dashboard.

Figuras desarrolladas con Bokeh: Diagramas y figuras interactivas desarrolladas con la librería Bokeh. Para la visualización de todos las figuras realizadas con Bokeh es necesario llevar a cabo los siguientes pasos:

  • Abrir Command Prompt
  • Acceder a la carpeta donde esta el notebook
  • Introducir el siguiente comando bokeh serve --show myapp.py cambiando myapp.py por el nombre del archivo que contiene la figura.
  • Se abrirá automáticamente en el navegador una pestaña con la siguiente dirección http://localhost:5006/myapp que contendrá la figura interactiva desarrollada.

Bar_chart_anual.ipynb: Diagramas de barras simples.

Bokeh_login_screen.ipynb: Posible pantalla de login muy simple pensada para mostrar resultados a clientes.

Dimensionality_reduction

MCA.ipynb: Uso del algoritmo multiple correspondence analysis(MCA) indicado para variables categóricas para probar la reducción de dimensionalidad.

Independence_test

Chi-squared_test.ipynb: Uso del test chi-squared indicado para variables categóricas, para analizar la interdependencia de las variables presentes en el dataset.

Kohonen

RASFF_Kohonen.ipynb: Uso de mapas auto-organizados(SOM) para el análisis de los datos.

RASFF_Kohonen_GEMA.ipynb: Uso de mapas auto-organizados(SOM) mediane la librería GEMA desarrollada por el CEIEC para el análisis de los datos.

Models

Categorical_embedding.ipynb: Modelos de clasificación principales. Hacen uso de capas de embedding para re-codificar cada una de las variables categóricas y despúes clasificarlas mediante capas dense o convolucionales 1d (en función de la etapa).

Baselines: Carpeta con todos los modelos baselines, ya sean algoritmos de machine learning clásicos, redes neuronales sin embedding o modelos con diferentes codificaciones de los datos.

Preprocessing

Carpeta con todos los notebooks que hay que ejecutar para preprocesar los datos en bruto obtenidos con el scraper. El número que hay al principio de cada archivo indica el orden de ejecución. Los datos en bruto (archivos .csv) obtenidos del scraper serán intruducidos en el archivo 0, el csv obtenido al ejecutar este archivo sera introducido en el archivo 1, y así sucesivamente.

Data_to_string.ipynb: Notebook diseñado para convertir cada alerta en una cadena de texto única, posiblemente útil para afrontar el problema como un problema de NLP en un futuro.

Opcional_preprocess.ipynb: Preprocesamiento opcional no terminado para intentar mejorar el rendimien to de los modelos.

Datasets:

Todos los datasets necesarios para a ejecución de los notebooks se encuentran en el Nas (Volumen 1)/carpeta RASFF_predictions.

Contact:

Responsible: Alberto Nogales ([email protected])
Supervisors : Alberto Nogales
Main developers: Rodrigo Díaz ([email protected])

rasff-predictions-dashboard's People

Stargazers

 avatar

Watchers

James Cloos avatar Rodrigo Díaz avatar CEIEC avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.