λ¬Έλ§₯μ μ μ¬λ μΈ‘μ (STS:Semantic textual similarity)
- STS λ°μ΄ν°μ μ νμ©νμ¬ λ ν μ€νΈκ° μΌλ§λ μ μ¬νμ§ νλ¨νλ NLP Task
- μΌλ°μ μΌλ‘ λ κ°μ λ¬Έμ₯μ μ λ ₯νκ³ , μ΄λ¬ν λ¬Έμ₯μμ΄ μΌλ§λ μλ―Έμ μΌλ‘ μλ‘ μ μ¬νμ§λ₯Ό νλ¨
- μ μ¬λ μ μμ ν¨κ» λ λ¬Έμ₯μ μ μ¬ν¨μ μ°Έκ³Ό κ±°μ§μΌλ‘ νλ¨νλ μ°Έκ³ μ 보λ κ°μ΄ μ 곡νμ§λ§, μ΅μ’ μ μΌλ‘ 0κ³Ό 5μ¬μ΄μ μ μ¬λ μ μλ₯Ό μμΈ‘νλ κ²μ λͺ©μ
- μλλ κ° λ°μ΄ν°μ κ°μμ Label μ μμ μλ―Έμ λλ€.
- μ΄ λ°μ΄ν° κ°μ : 10,974 λ¬Έμ₯ μ
- Train(νμ΅) λ°μ΄ν° κ°μ: 9,324
- Test(νκ°) λ°μ΄ν° κ°μ: 1,100
- Dev(κ²μ¦) λ°μ΄ν° κ°μ: 550
- Label μ μ: 0 ~ 5μ¬μ΄μ μ€μ
- 5μ : λ λ¬Έμ₯μ ν΅μ¬ λ΄μ©μ΄ λμΌνλ©°, λΆκ°μ μΈ λ΄μ©λ€λ λμΌν¨
- 4μ : λ λ¬Έμ₯μ ν΅μ¬ λ΄μ©μ΄ λλ±νλ©°, λΆκ°μ μΈ λ΄μ©μμλ λ―Έλ―Έν μ°¨μ΄κ° μμ
- 3μ : λ λ¬Έμ₯μ ν΅μ¬ λ΄μ©μ λλ΅μ μΌλ‘ λλ±νμ§λ§, λΆκ°μ μΈ λ΄μ©μ 무μνκΈ° μ΄λ €μ΄ μ°¨μ΄κ° μμ
- 2μ : λ λ¬Έμ₯μ ν΅μ¬ λ΄μ©μ λλ±νμ§ μμ§λ§, λͺ κ°μ§ λΆκ°μ μΈ λ΄μ©μ 곡μ ν¨
- 1μ : λ λ¬Έμ₯μ ν΅μ¬ λ΄μ©μ λλ±νμ§ μμ§λ§, λΉμ·ν μ£Όμ λ₯Ό λ€λ£¨κ³ μμ
- 0μ : λ λ¬Έμ₯μ ν΅μ¬ λ΄μ©μ΄ λλ±νμ§ μκ³ , λΆκ°μ μΈ λ΄μ©μμλ 곡ν΅μ μ΄ μμ
- κ° λ°μ΄ν°λ³ Label μ μλ μ¬λ¬λͺ μ μ¬λμ΄ μμ μ μ κΈ°μ€μ ν λλ‘ νκ°ν λ λ¬Έμ₯κ°μ μ μλ₯Ό νκ· λΈ κ°
![]() κΉν¨μ° | ![]() μμ ν | ![]() μ무ν | ![]() μ΄μΉμ§ | ![]() ν©μ§μ |
Github νμ΄μ§
λ‘ λμ΄κ°λλ€