GithubHelp home page GithubHelp logo

modul2_probstat_5025211014's Introduction

Modul2_Probstat_5025211014

Alexander Weynard Samsico

5025211014

Catatan: Mungkin terdapat beberapa library yang harus diinstall terlebih dahulu

Nomor 1

a. Carilah Standar Deviasi dari data selisih pasangan pengamatan tabel diatas

Pertama-tama kita masukan data dari soal sebagai berikut

x <- c(78, 75, 67, 77, 70, 72, 78, 74, 77)
y <- c(100, 95, 70, 90, 90, 90, 89, 90, 100)

Kemudian mencari mengambil data selisih pasangan

diff <- x - y

Mencari Standar Deviasi dengan fungsi berikut

sd(diff)

Sehingga didapatkan:
image

b. carilah nilai t (p-value)

Kita dapat menggunakan fungsi t.test() untuk mencari nilai t(p-value) pada perbandingan pasangan tersebut

t.test(y, x, paired = TRUE)

Sehingga ditemukan nilai t/p-value = 0,00006003
image

c. tentukanlah apakah terdapat pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴 jika diketahui tingkat signifikansi 𝛼 = 5% serta H0 : “tidak ada pengaruh yang signifikan secara statistika dalam hal kadar saturasi oksigen , sebelum dan sesudah melakukan aktivitas 𝐴”

p-value tersebut lebih kecil daripada a = 0.05, maka berarti berada pada area penolakan H0, sehingga ada pengaruh yang signifikan

Nomor 2

Untuk nomor 2, ini kita perlu library BSDA

library(BSDA)

a. Apakah Anda setuju dengan klaim tersebut?

setuju, karena sangat memenuhi dengan sampel acak menunjukkan rata-rata 23.500 kilometer dan standar deviasi 3900 kilometer pada pencarian estimasi

b. Jelaskan maksud dari output yang dihasilkan!

Mari kita melakukan pengujian t dengan tsum.test() dengan alternative sebagai greater (lebih dari)

tsum.test(mean.x = 23500, s.x = 3900, n.x = 100, 
        alternative = "greater", mu = 20000, 
        var.equal = TRUE, conf.level = 0.95)

image Dengan confidence interval 95 percent, bahwa rata-rata berada pada mu > 22852.45. Oleh karena itu, dengan interval itu, bahwa mobil dikemudikan rata-rata lebih dari 20.000 kilometer per tahun diterima.

c. Buatlah kesimpulan berdasarkan P-Value yang dihasilkan!

Hipotesa null ditolak karena p value lebih kecil daripada level signifikan = 0.05, hipotesa alterative diambil bahwa rata-rata lebih dari 20.000 kilometer per tahun

Nomor 3

Nomor 3 ini juga memerlukan:

library(BSDA)

a. H0 dan H1

H0 : μ1 - μ2 = 0
H1 : μ1 - μ2 ≠ 0

μ1 = rata-rata saham di Bandung μ2 = rata-rata saham di Bali

b. Hitung Sampel Statistik

Mencari sampel statistik dapat dilakukan sebagai berikut

tsum.test(mean.x = 3.64, s.x = 1.67, n.x = 19, 
        mean.y = 2.79, s.y = 1.32, n.y = 27, 
        alternative = "two.sided", mu = 0,
        var.equal = TRUE, conf.level = 0.95)

image

c. Lakukan Uji Statistik (df =2)

Untuk melakukan uji, kita perlu library mosiac untuk plot statistiknya

library(mosaic)

Kemudian kita plotkan sebagai berikut dengan df yang diketahui:

plotDist(dist = 't', df = 2, xmin = NULL, xmax = NULL, col = "#ff0000")

uji t didapatkan = 1.9267 (menurut 3b) image

d. Nilai Kritikal

Kita dapat mencari nilai kritikal dengan fungsi qt() dengan df = 44

qt(p = 0.05 / 2, df = 44, lower.tail = TRUE)
qt(p = 0.05 / 2, df = 44, lower.tail = FALSE)

Ada dua karena two-tail
image

e. Keputusan

Tidak menolak H0

Karena nilai t berada di antara nilai kritikal

f. Kesimpulan

Tidak adanya bukti cukup bahwa tidak ada perbedaan pada rata-rata saham Bandung dan Bali

Nomor 4

a. Buatlah masing masing jenis spesies menjadi 3 subjek "Grup" (grup 1,grup 2,grup 3). Lalu Gambarkan plot kuantil normal untuk setiap kelompok dan lihat apakah ada outlier utama dalam homogenitas varians.

Kita perlu menconvert data file dari link tersebut ke dalam program sebagai berikut

my_data <- read.table("onewayanova.txt", h = TRUE)
attach(my_data)

Perlu diingat readtable berupa path sehingga perlu disesuaikan.
Kemudian kita membagi-bagi setiap speies ke dalam masing-masing group, sebagai berikut

my_data$Group <- as.factor(my_data$Group)
my_data$Group <- factor(my_data$Group, labels = c("Kucing Oren", "Kucing Hitam", "Kucing Putih")) # nolint

grup1 <- subset(my_data, Group == "Kucing Oren")
grup2 <- subset(my_data, Group == "Kucing Hitam")
grup3 <- subset(my_data, Group == "Kucing Putih")

Gambar plot menggunakan qqnorm dan qqline untuk setiap kelompok sebagai berikut

qqnorm(grup1$Length)
qqline(grup1$Length)

image

qqnorm(grup2$Length)
qqline(grup2$Length)

image

qqnorm(grup3$Length)
qqline(grup3$Length)

image

b. carilah atau periksalah Homogeneity of variances nya , Berapa nilai p yang didapatkan? , Apa hipotesis dan kesimpulan yang dapat diambil ?

Untuk menguji Homogeneity of variances, kita dapat menggunakan barlett.test

bartlett.test(Length ~ Group, data = my_data)

image

Didapatkan p-value sebesar 0.8054
Hipotesis:

H0 : σ1 = σ2 = σ3
H1 : satupun yang tidak sama antara σ1, σ2, atau σ3

σ1 mewakilkan varians group 1
Kesimpulan

p-value lebih dari 0.05, sehingga hipotesis 0 diterima bahwa varians seluruh grup sama 

c. Untuk uji ANOVA, buatlah model linier dengan Panjang versus Grup dan beri nama model tersebut model 1.

menggunakan fungsi lm() (model linier)

model1 = lm(Length ~ Group, data = my_data)
anova(model1)

image

d. Dari Hasil Poin C , Berapakah nilai-p ? , Apa yang dapat Anda simpulkan dari H0?

Berdasarkan C, nilai p = 0.0013
karena p < 0.05, maka menolak H0, bahwa terbukti ada perbedaan rata-rata panjang antara ketiga spesies

e. Verifikasilah jawaban model 1 dengan Post-hooc test TukeyHSD , dari nilai p yang didapatkan apakah satu jenis kucing lebih panjang dari yang lain? Jelaskan.

Menggunakan fungsi TukeyHSD()

TukeyHSD(aov(model1))

image

Jika kita lihat melalui p-value adj, bahwa 
adanya perbedaan rata-rata panjang antar Kucing Hitam dan Kucing Oren karena di bawah 0.05 level significant
adanya perbedaan rata-rata panjang antar Kucing Putih dan Kucing Hitam karena di bawah 0.05 level significant
Jika dilihat dari diff, bahwa Kucing Oren lebih panjang daripada Kucing Hitam, 
Kucing Putih lebih panjang daripada Kucing Hitam
dan Kucing Oren lebih panjang daripada Kucing Putih namun tidak signifikan 

f. Visualisasikan data dengan ggplot2

Kita perlu library ggplot2

library(ggplot2)

Kemudian kita buat

ggplot(data = my_data, mapping = aes(x = Group, y = Length)) + geom_boxplot(fill = "grey", colour = "black") + scale_x_discrete() + xlab("Treatment Group") + ylab("Length")

image

Nomor 5

Untuk nomor 5 ini, diperlukan library berikut

library(multcompView)
library(ggplot2)
library(dplyr)

a. Buatlah plot sederhana untuk visualisasi data

Kita masukan file ke program

GTL <- read.csv("GTL.csv")

Mengingat bahwa read path perlu disesuaikan Kemudian gambar plot dengan qplot

qplot(x = Temp, y = Light, geom = "point", data = GTL) + facet_grid(.~Glass, labeller = label_both)

image

b. Lakukan uji ANOVA dua arah untuk 2 faktor

melakukan uji ANOVA antara 2 faktor dengan fungsi aov()

GTL$Glass <- as.factor(GTL$Glass)
GTL$Temp <- as.factor(GTL$Temp)

anova <- aov(Light ~ Glass*Temp, data = GTL)
summary(anova)

image

c. Tampilkan tabel dengan mean dan standar deviasi keluaran cahaya untuk setiap perlakuan (kombinasi kaca pelat muka dan suhu operasi)

Tabel dibuat dengan menggunakan summarise() dan arrange() antara Glass dan Temp

summaryData <- group_by(GTL, Glass, Temp) %>%
  summarise(mean = mean(Light), sd = sd(Light)) %>%
  arrange(desc(mean))
print(summaryData)

image

d. Lakukan uji Tukey

Menggunakan TukeyHSD()

TukeyHSD(anova)

image image

e. Gunakan compact letter display untuk menunjukkan perbedaan signifikan antara uji Anova dan uji Tukey

Menggunakan fungsi multicompLetters4() untuk menunjukkan perbedaan

cldTemp <- multcompLetters4(anova, tukey)
print(cldTemp)

image

Kemudian diupdate summaryData sebelumnya dengan cld

cld <- as.data.frame.list(cldTemp$'Glass:Temp')
summaryData$CLD <- cld$Letters
print(summaryData)

image

modul2_probstat_5025211014's People

Contributors

weynard02 avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.