GithubHelp home page GithubHelp logo

analyzekorean's Introduction

AnalyzeKorean

  • 한국어에서의 된소리되기 현상과 장단의 관계
  • 현대 한국어에서는 거의 소멸되었지만, 한국어에는 장음이 존재한다.
  • 장음은 첫 글자에만 적용되며, 해당 음이 원래 길이보다 약간 길게 발음된다.
  • 한편, 한국어에는 된소리되기 현상이 있다. 해당 현상은 일부 경우를 제외하면 대단히 불규칙적으로 나타나는 현상으로, 사잇소리현상과는 관계없이 일어나는 경우도 매우 많다.
  • 그런데, 사실 단어 중간에 등장할 때, 된소리와 예사소리의 음운상 차이는 크지 않다. 단어 중간에서는 동일 발음을 할 때 그 길이가 길면 예사소리, 짧으면 된소리로 들린다. 예를 들어 '아가'라는 발음을 녹음한 뒤, ㅏ 에서 ㄱ으로 넘어가는 부분을 약간 잘라내고 이어붙여 들어보면 '아까'처럼 들린다.
  • 따라서, 단어의 첫 음절에 장음이 나올 경우 상대적으로 두 번째 음절에서 된소리되기가 일어나기 어렵고, 단어의 첫 음절에 단음이 나올 경우 상대적으로 두 번째 음절에서 된소리되기가 일어나기 쉬운 게 아닐까 생각했고, 이를 검증하기 위한 조사를 수행하였다.

Methods

  • 단어는 http://stdweb2.korean.go.kr/search/View.jsp?idx=1 과 같은 페이지에서, 번호를 1번부터 519012까지 바꿔 가며 긁었고, 519012까지의 번호 중 7730개의 번호가 누락되어 총 표제어의 개수는 511282개였다.
  • 단어 수집: stdweb_crawler.py (Python 2, BeautifulSoup 4 필요)
    • 수집 결과: output.txt
  • 분석: 나머지 네 개의 *.py (Python 2 필요)
    • 분석 결과: 나머지 네 개의 *.txt

Results

  • 첫 소리가 장음인 두 음절 이상의 단어에서 두 번째 글자에 된소리되기가 일어나는 경우는 1624개였고, 된소리되기가 일어날 수 있음에도 불구하고 일어나지 않는 경우는 45567개였다.
  • 첫 소리가 단음인 두 음절 이상의 단어에서 두 번째 글자에 된소리되기가 일어나는 경우는 26986개였고, 된소리되기가 일어날 수 있음에도 불구하고 된소리되기가 일어나지 않는 경우는 180916개였다.
  • 영가설을 '장음과 단음에 관계없이 된소리되기의 발생 비율은 전체 표제어의 평균과 같다'로 놓고 카이 제곱 검정을 해 보면 카이 제곱 값이 약 3120으로, 유의확률(p-value)은 0.0000001 이하로 99.99999% 이상의 신뢰도가 나온다. 즉 첫 음절의 장음과 두 번째 음절의 된소리되기는 관계가 있는 것이 확실하다.
  • 이후 추가적인 조사를 수행하였다.
  • [상ː대접](상대를 귀하게 대하는 대접), [상때접](품질이 좋지 아니하여 허드레로 쓰는 대접)과 같이, 철자가 동일한데도 첫 글자가 장음일 때는 두 번째 글자가 평음으로, 첫 글자가 단음일 때는 두 번째 글자가 경음으로 발음되는 경우를 세 보았다.
  • ‘가법, 간대, 경구, 경수, 고가, 경조, 공수, 과법, 광점, 권장, 권수, 근수, 기구, 단가, 단자, 단수, 도법, 돌-상, 동가, 망조, 매수, 명가, 문구, 밤-밥, 부권, 산대, 산병, 상술, 서자, 소가, 성자, 소점, 신병, 안가-하다, 앙기, 언권, 양자, 연자, 연장, 영조, 염가, 염증, 원수, 장대, 장구, 전과, 장수, 전구, 조법, 제수, 정자, 준법, 중질, 중대, 주점, 중-대문, 총계, 평자, 향궤, 호가-하다, 경기, 공격, 공가, 대수, 무가, 말다, 문수, 봉장, 보세, 부수, 사-조, 사법, 산수, 시구, 신격, 엄격, 안가, 연가, 연구, 영자, 염세, 의자, 이자, 일다, 자수, 장조, 점괘, 장기, 전적, 주자, 주가, 중병, 준상, 통계, 회계, 호가, 상-대접’의 97단어가 있었다.
  • 한편, 반대로 철자가 동일한데도 첫 글자가 장음일 때는 두 번째 글자가 경음으로, 첫 글자가 단음일 때는 두 번째 글자가 평음으로 발음되는 경우는 전혀 없었다.
  • 뭔가 굉장히 흥미롭다(?)

analyzekorean's People

Contributors

hletrd avatar

Watchers

 avatar  avatar  avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.