GithubHelp home page GithubHelp logo

ksic's Introduction

Introductions

KSIC (Korea Standard Industry Code) dataset and using in Python.

KSIC 한국표준산업분류 데이터셋

KSIC (Korea Standard Industry Code), 한국표준산업분류

생산단위(사업체단위, 기업체단위 등)가 주로 수행하는 산업 활동을 그 유사성에 따라 체계적으로 유형화한 표준 코드이다. 코드는 대분류(알파벳 1자리), 중분류(2자리), 소분류(3자리), 세분류(4자리), 세세분류(5자리) 종류가 있다. 금융감독원 전자공시(DART)에서 회사(종목)의 산업분류에 소분류(3자리)를 사용하고 있다.

통계청 한국표준산업분류코드(KSIC)

코드의 내용과 항목을 상세하게 보려면,

(2018년 9월 현재) 9차 개정안이 주로 사용되고 있다(전자공시 등)

  • KSIC 9차 개정(2008년) - 항목수 1,931개
  • KSIC 10차 개정(2017년) - 항목수 2,000개

Dataset

KSIC 9차 https://github.com/FinanceData/KSIC/raw/master/KSIC_09.csv.gz

  • 1,931 rows
  • 2 columns

KSIC 10차 https://github.com/FinanceData/KSIC/raw/master/KSIC_10.csv.gz

  • 2,000 rows
  • 2 columns

Usage

import pandas as pd

url = 'https://github.com/FinanceData/KSIC/raw/master/KSIC_09.csv.gz'

df_ksic = pd.read_csv(url, dtype='str')
df_ksic.head(10)
Industy_code Industy_name
0 01 농업
1 011 작물 재배업
2 0111 곡물 및 기타 식량작물 재배업
3 01110 곡물 및 기타 식량작물 재배업
4 0112 채소, 화훼작물 및 종묘 재배업
5 01121 채소작물 재배업
6 01122 화훼작물 재배업
7 01123 종자 및 묘목 생산업
8 0113 과실, 음료용 및 향신용 작물 재배업
9 01131 과실작물 재배업
10 01132 음료용 및 향신용 작물 재배업
11 0114 기타 작물 재배업
12 01140 기타 작물 재배업
13 0115 시설작물 재배업
14 01151 콩나물 재배업
15 01152 채소, 화훼 및 과실작물 시설 재배업
16 01159 기타 시설작물 재배업
17 012 축산업
18 0121 소 사육업
19 01211 젖소 사육업

코드 패딩

중분류(2자리)~세세분류까지(5자리) 코드인데 뒤쪽에 0으로 채워서 사용하는 경우가 더 편리한 경우가 있다. 다음과 같이 pad 하여 사용할 수 있다.

df_ksic['Industy_code'] = df_ksic['Industy_code'].str.pad(width=5, side='right', fillchar='0')
df_ksic.head(10)
Industy_code Industy_name
0 01000 농업
1 01100 작물 재배업
2 01110 곡물 및 기타 식량작물 재배업
3 01110 곡물 및 기타 식량작물 재배업
4 01120 채소, 화훼작물 및 종묘 재배업
5 01121 채소작물 재배업
6 01122 화훼작물 재배업
7 01123 종자 및 묘목 생산업
8 01130 과실, 음료용 및 향신용 작물 재배업
9 01131 과실작물 재배업
2018 FinanceData.KR

ksic's People

Contributors

financedata avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.