GithubHelp home page GithubHelp logo

Pecah data master csv about indonesia HOT 13 CLOSED

laravolt avatar laravolt commented on July 3, 2024
Pecah data master csv

from indonesia.

Comments (13)

nafiesl avatar nafiesl commented on July 3, 2024 1

I see. Boleh saya bantu split file villages.csv nya ya mas?
Mudah2an pas weekend besok saya bisa buat Pull Request.

from indonesia.

darkcyber avatar darkcyber commented on July 3, 2024

dipecah bagaimana mas maksudnya?

from indonesia.

uyab avatar uyab commented on July 3, 2024

@darkcyber dipecah jadi satu kota satu file. Atau bisa lebih kecil lagi, satu kecamatan satu file. Jadi kalau mau ngecek data di suatu wilayah bisa langsung buka di github, dan karena bentuknya csv bisa langsung cantik https://help.github.com/articles/rendering-csv-and-tsv-data/

from indonesia.

darkcyber avatar darkcyber commented on July 3, 2024

maaf mas masih bingung maksudnya, mohon diperjelas dengan contohnya (1 file namanya apa, isinya apa saja). soalnya saya cek di github aman aman saja, bisa di preview dengan mudah.

from indonesia.

uyab avatar uyab commented on July 3, 2024

image

from indonesia.

uyab avatar uyab commented on July 3, 2024

Bandingkan dengan provinsi yang sedikit datanya:

image

Cuma perlu direncanakan dulu gimana struktur filenya, ada masukan @darkcyber ?

from indonesia.

darkcyber avatar darkcyber commented on July 3, 2024

Menurut saya dari segi database memang posisi sekarang paling pas (rapi), wajar data kelurahan se-Indonesia banyak.

Efeknya memang tidak bisa di view langsung di github karena batasan ukuran. Tapi kalau diubah di perkecil efeknya file semakin banyak dan masih bingung dengan schema nya bagaimana yang pas.

Kalau dibandingan file master dipecah versus tetap seperti sekarang? mana yang paling baik ya mas? alasannya kenapa? Terima Kasih

from indonesia.

darkcyber avatar darkcyber commented on July 3, 2024

tapi saya pikir pecah file rasanya tidak berpengaruh di sisi database deh, kan nanti yang input ke DB dari sisi Migrationnya, jadi ada file kelurahan untuk tiap kota (jumlah sesuai total kota di indonesia isinya adalah kelurahan) file name bisa villages-surabaya, villages-malang, dst nanti di sisi database tetap masuknya ke table villages.

artinya pecah file hanya berguna untuk github saja.

from indonesia.

uyab avatar uyab commented on July 3, 2024

Yes, tidak berpengaruh terhadap skema database. Ini hanya untuk memudahkan view dan proses editing kalau diperlukan.

Struktur yang saya bayangkan:

  • provinces.csv
  • 11
    • cities.csv (list kota di provinsi 11 [Aceh] saja)
    • 1101 (folder)
    • 1102
      • districts.csv (list kecamatan di kota 1102 saja)
      • 1101010
        • villages.csv (list desa di kecamatan 1101010 saja)
      • 1101020
  • 12

from indonesia.

darkcyber avatar darkcyber commented on July 3, 2024

Berarti kalau di buat path seperti berikut ya mas?

  • Folder 11
    • File cities.csv (list kota provinsi 11 [Aceh] saja)
    • Folder 1101
      • File districts.csv (list kecamatan di kota 1101 saja)
      • Folder 1101010
        • File villages.csv (list kelurahan/desa di kecamatan 1101010 saja)

dan seterusnya. begitu kah mas maksudnya?

from indonesia.

uyab avatar uyab commented on July 3, 2024

yup, bisa bantu implementasi @darkcyber ?

from indonesia.

nafiesl avatar nafiesl commented on July 3, 2024

Mas @uyab, saya mau usul juga, misal tanpa folder, struktur file di dalam folder csv seperti ini bagaimana mas?

provinces.csv (tetap)
cities.csv (tetap)

districts_11.csv
districts_12.csv
districts_13.csv
...
districts_91.csv
districts_94.csv

villages_1101.csv
villages_1102.csv
villages_1103.csv
...
villages_9435.csv
villages_9436.csv
villages_9471.csv

Jadi:

  1. provinces.csv dan cities.csv tetap.
  2. Untuk districts.csv di-split berdasarkan kode provinsinya (2 digit), total akan ada 34 file districts_**.csv.
  3. Untuk villages.csv di-split berdasarkan kode kab./kotanya (4 digit), total akan ada ~514 file villages_****.csv.

Tapi nanti di folder resources/csv akan ada ~577 file csv. 😃

from indonesia.

uyab avatar uyab commented on July 3, 2024

@nafiesl Ini sekarang tinggal file villages.csv saja yang tidak bisa kebuka di github. Mungkin fokus ke situ saja.

Random cek dari wikipedia, provinsi dengan penduduk terbesar di Indonesia punya 5000an desa. Jumlah segitu sepertinya masih bisa ditampilkan oleh github, karena file districts.csv dengan 7094 data juga masih bisa ditampilkan dengan baik.
image

Berdasar info di atas, usulanku struktur file-nya seperti ini:

  • provinces.csv (tetap)
  • cities.csv (tetap)
  • districts.csv (tetap)
  • villages (folder)
    • 11.csv
    • 12.csv
    • dst...

Jadi maksimal cuma ada 3 + 35 files.

from indonesia.

Related Issues (20)

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.