GithubHelp home page GithubHelp logo

jmcastagnetto / sunedu-licenciamiento Goto Github PK

View Code? Open in Web Editor NEW
0.0 2.0 1.0 349 KB

Datos de SUNEDU sobre licenciamiento de universidades en Perú

License: MIT License

R 100.00%
sunedu peru r opendata universidades

sunedu-licenciamiento's Introduction

Datos de licenciamiento de Universidades (SUNEDU, Perú)

Los datos combinan la información que se tenía en Abril del 2020 en datos abiertos (https://www.datosabiertos.gob.pe/dataset/sunedu-estado-licenciamiento-universidades), con la extracción manual ("scraping") de las tablas que muestran el avance de licenciamiento (https://www.sunedu.gob.pe/avances-licenciamiento/, descargado el 2021-01-14)

Los datos originales se guardan en los archivos:

  • Datos abiertos:
    • orig/Licenciamiento Institucional_6.csv (datos)
    • orig/Licenciamiento Institucional - Diccionario_0.pdf (documentación)
  • Extracción manual:
    • orig/20210114-tablas-licenciamiento-sunedu.csv

Los datos originales se combinaron generando el archivo proc/sunedu-datos-combinados-crudo.csv, el cual fue procesado usando OpenRefine (ver operaciones en: proc/openrefine-operations.json) para generar el archivo proc/sunedu-datos-combinados-crudo-csv-openrefine-editado.csv

De este último se ha generado dos archivos que consolidan la información:

  • datos/sunedu-licenciamiento-20210114.csv
  • datos/sunedu-licenciamiento-20210114.rds (formato RDS)

Estos datos tienen la siguiente estructura:

> skimr::skim(sunedu)
── Data Summary ────────────────────────
                           Values
Name                       sunedu
Number of rows             147   
Number of columns          12    
_______________________          
Column type frequency:           
  character                8     
  numeric                  4     
________________________         
Group variables            None  

── Variable type: character ───────────────────────────────────────────────────────────────────────────
  skim_variable          n_missing complete_rate   min   max empty n_unique whitespace
1 nombre                         0         1        16    76     0      147          0
2 gestion                        0         1         7     7     0        2          0
3 departamento                   0         1         3    13     0       25          0
4 provincia                      4         0.973     3    23     0       48          0
5 distrito                       4         0.973     3    22     0       82          0
6 estado                         2         0.986    17    37     0        3          0
7 grupo                          2         0.986     7     7     0        9          0
8 nota_estado_abril_2020         4         0.973     7    55     0        7          0

── Variable type: numeric ─────────────────────────────────────────────────────────────────────────────
  skim_variable          n_missing complete_rate   mean    sd    p0   p25   p50    p75   p100 hist 
1 codigo                         4         0.973  75.0  43.7    1    36.5  77   112.   149    ▇▇▇▇▇
2 latitud                        4         0.973 -11.3   3.23 -18.0 -12.5 -12.1  -9.10  -3.59 ▂▂▇▃▂
3 longitud                       4         0.973 -76.0   2.67 -80.7 -77.1 -77.0 -74.7  -69.2  ▃▇▂▂▁
4 periodo_licenciamiento         4         0.973   4.08  3.16   0     0     6     6     10    ▅▁▇▁▁

sunedu-licenciamiento's People

Contributors

jmcastagnetto avatar

Watchers

 avatar  avatar

Forkers

gilmar-py

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.