GithubHelp home page GithubHelp logo

charisa / appr-2015-16 Goto Github PK

View Code? Open in Web Editor NEW

This project forked from jaanos/appr-2015-16

0.0 3.0 0.0 531 KB

Repozitorij z gradivi za predmet Analiza podatkov s programom R v študijskem letu 2015/16

License: MIT License

R 69.29% TeX 30.71%

appr-2015-16's Introduction

Analiza podatkov s programom R, 2015/16

Avtor: Sara Korat

Repozitorij z gradivi pri predmetu APPR v študijskem letu 2015/16.

Analiza spreminjanja cen življenjskih potrebščin

Cene na trgu se vsakodnevno spreminjajo. Zakaj se spreminjajo, je odvisno od velikega števila dejavnikov. V tem projektu se bom bolj osredotočila na statistiko - kako se spreminjajo. Katerim dobrinam in storitvam se cene dvigujejo, katerim se znižujejo. Nekaterim cene nihajo iz meseca v mesec, pri drugih so spremembe na letni ravni. Prav tako so nihanja cen ponekod večja, drugod manjša. Prav tako bom analizirala, katerim dobrinam oz. storitvam se cene najbolj spreminjajo.

Vire bom v večini črpala iz Statističnega urada republike Slovenije. Mednarodni podatki za cene življenjskih potrebščin: http://www.numbeo.com/cost-of-living/rankings_by_country.jsp

Program

Glavni program in poročilo se nahajata v datoteki projekt.Rmd. Ko ga prevedemo, se izvedejo programi, ki ustrezajo drugi, tretji in četrti fazi projekta:

  • obdelava, uvoz in čiščenje podatkov: uvoz/uvoz.r
  • analiza in vizualizacija podatkov: vizualizacija/vizualizacija.r
  • napredna analiza podatkov: analiza/analiza.r

Vnaprej pripravljene funkcije se nahajajo v datotekah v mapi lib/. Podatkovni viri so v mapi podatki/. Zemljevidi v obliki SHP, ki jih program pobere, se shranijo v mapo ../zemljevidi/ (torej izven mape projekta).

Spletni vmesnik

Spletni vmesnik se nahaja v datotekah v mapi shiny/. Poženemo ga tako, da v RStudiu odpremo datoteko server.R ali ui.R ter kliknemo na gumb Run App. Alternativno ga lahko poženemo tudi tako, da poženemo program shiny.r.

Potrebni paketi za R

Za zagon tega vzorca je potrebno namestiti sledeče pakete za R:

  • knitr - za izdelovanje poročila
  • rmarkdown - za prevajanje poročila v obliki RMarkdown
  • shiny - za prikaz spletnega vmesnika
  • DT - za prikaz interaktivne tabele
  • maptools - za uvoz zemljevidov
  • sp - za delo z zemljevidi
  • digest - za zgoščevalne funkcije (uporabljajo se za shranjevanje zemljevidov)
  • httr - za pobiranje spletnih strani
  • XML - za branje spletnih strani
  • extrafont - za pravilen prikaz šumnikov (neobvezno)

appr-2015-16's People

Contributors

jaanos avatar charisa avatar

Watchers

James Cloos avatar  avatar  avatar

appr-2015-16's Issues

Plotly

Moj RStudio mi nikakor ne prikaže zemljevida, katerega naj bi. Poskusila sem tudi z direktno kodo iz interneta, pa ta ne deluje. Izpiše mi le naslov in pa številčno skalo.
Imam inštalirane vse potrebne pakete.
(Primer iz interneta je v mapi vizualizacija - test.)

Združevanje tabel

To, kar ste mi danes pomagali (zadnjih nekaj vrstic v "uvod"-u), sicer dela, ampak mi ne izpiše držav. Zato sem v s dodala še "Country", kar pa noče prepoznati kot pravilno dodajanje. Kaj naj naredim, da mi v tabeli sk izpiše še države?

Graf

Pri novi razpredelnici osnovne_dobrine imam probleme z risanjem histograma. Na x ordinati želim imeti dobrine/storitve, na y ordinati pa njihove vrednosti po stolpcu november2015/oktober2015. Ne želi pravilno izpisati podatke, v večini vrže Error: ggplot2 doesn't know how to deal with data of class numeric.

(skoraj) končan projekt

Ali lahko, prosim, preverite, če mi projekt deluje (vse sem napisala v datoteki porocilo.Rmd, namesto projekt.Rmd).

Spremenila bom samo še besedilo v poročilu.

Hvala

Poročilo in grafi

Poročila ti ne prevede, ker imaš dva bloka kode z istim imenom uvoz. Poleg tega imaš pri drugem parameter echo = razpredelnice - tukaj R potem pričakuje spremenljivko z imenom razpredelnice, ki pa je nimaš. Če hočeš bloku kode dati ime razpredelnice, potem napiši {r razpredelnice} - po potrebi pa lahko echo nastaviš na TRUE ali FALSE.

Graf poskušaš risati z barplot in aes, kar pa ne bo šlo, saj funkcija barplot ne prihaja iz knjižnice ggplot2. Za risanje grafov bo najbolje nekoliko preoblikovati razpredelnico osnovne_dobrine:

meseci <- names(osnovne_dobrine)
dobrine <- factor(row.names(osnovne_dobrine))
dobrine.meseci <- factor(meseci, levels = meseci, ordered = TRUE) %>%
  lapply(. %>% {data.frame(Dobrina = dobrine, Mesec = ., Indeks = osnovne_dobrine[[.]])}) %>%
  bind_rows()

Tako bo razpredelnica dobrine.meseci imela tri stolpce - sedaj lahko narišemo npr. gibanje indeksov skozi mesece (ki so urejen faktor - po potrebi lahko spremeniš imena, da se bo lepše izpisovalo):

ggplot(data = dobrine.meseci, aes(x = Mesec, y = Indeks, group = Dobrina, color = Dobrina)) +
  geom_line() + theme(axis.text.x = element_text(angle = 90, vjust = 0.5))

theme tukaj poskrbi, da se oznake izpišejo navpično. Če bi želela imeti stolpčni diagram z več stolpci za vsak mesec, bi potem lahko geom_line() nadomestila z geom_bar(stat="identity", position="dodge").

Markdown

Imena spremenljivk na x osi so predolga, zato se v pdf-ju prekrivajo (medtem ko v Plot Zoom-u se ne). Je kakšna opcija, da vseeno ohranim celotna imena, mogoče samo, da se izpišejo postrani ali v dveh vrsticah?

  1. tabela ne izpiše podatkov za zadnji stolpec v pdf-ju. Lahko to nekako popravim?

Warnings-i v poročilu

Pri knit-anju PDF-ja mi v poglavju Vizualizacija za vsak zemljevid napiše še warningse, ki pa se jih na noben način ne morem znebiti. Je možno, da mi ne izpiše teh zadev?

Podatki

V opisu projekta manjkajo povezave do podatkov. Glede na to, da navajaš Statistični urad, lahko podatke od tam izvoziš v CSV, te pa daj v repozitorij (temu je namenjena mapa podatki/).

Potrebno bo sicer najti še kakšne podatke v kakšni drugi obliki (HTML, XML, JSON) - tako lahko poskusiš najti npr. še kakšne podatke za tujino.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.