krikit / annie Goto Github PK
View Code? Open in Web Editor NEW2016 국어 정보 처리 시스템 - 지정 분야: 개체명 인식 시스템 개발 및 적용
2016 국어 정보 처리 시스템 - 지정 분야: 개체명 인식 시스템 개발 및 적용
dev.json 파일을 정답으로 하여 평가하는 스트립트 작성
3음절이고 품사가 NNP인 단일 형태소의 인명 여부를 word2vec과 svm을 이용해 분류기를 만든다.
기본 자질
현재 형태소를 포함 좌/우 3개씩 총 7개의 형태소 (50 * 7 = 350개의 자질)
안녕하세요.
한국어 오픈소스 NER 을 찾다가 오게되었는데요.
혹시 라이센스 알수있을까요...
라이센스가 가능하다면 개조해서 업무에 사용가능할지 테스트 해보고 싶은데요.
감사합니다.
날짜 및 시간 패턴을 gazette에 우선하여 적용
메일로 문의를 주신 분이 계셔서 여러 분들과 공유해도 괜찮을 내용이라 이슈로 등록합니다.
아래는 메일 내용입니다.
안녕하세요. 선생님. 자연어처리 관련하여 공부하고 있는 학생입니다.
다름이 아니라 git에 올려주신 개체명 인식기를 실행해보고자 합니다.
개체명 인식용 데이터가 업로드 되어 있는 구글 드라이브 주소를 알 수 있을까요??
부탁드리겠습니다. 감사합니다.
dev.json 파일과 IOB 태깅한 결과를 이용하여 JSON 객체에 'NE' 키의 값을 태깅한 결과로 대체하여 출력
제공된 gazette 파일만 이용하여 단순 매칭에 의해 개체명을 태깅하는 베이스라인 시스템 작성
안녕하세요 :)
공개하신 개체명 인식기를 실행해보고 싶은데요,
실행 예에서 지정한 dev.json 파일을 못 찾아서 죄송하게도 이렇게 issue를 올리게 되었습니다.
혹시 포멧이라도 알려주시면 한번 실행해 보고 싶은데요....
받을 수 있을까요?? 아니면... 제가 잘 못 찾은 걸까요;;;
평가 프로그램에서 개체명 카테고리(타입) 별로 정확도 및 재현율을 출력하도록 수정
안녕하세요. 귀하의 annie의 배포를 감사드립니다.
질문이 있는데요, json 형식을 어떻게 만들어야 하나요?
json 형식의 예시를 알려주셨으면 좋겠습니다.
좋은 하루 되세요.
cqasys_annie.bash
As Is:
형태소를 조합하여 gazette 조회를 위한 키를 생성할 때 중간에 공백을 무조건 삽입
To Be:
무조건 삽입하지 않고 어절 경계에만 공백을 삽입하도록 개선
word2vec 파일(wikiCorpus_word2vector.hr)을 읽어들여 검색이 빠른 사전 구조로 저장
OOV에 대응하기 위해 품사별로 벡터를 모아서 평균 값을 저장
특이점
평가 프로그램에서 시스템이 오류가 난 문장을 케이스 별로 출력하도록 옵션을 추가
한국어 유일의 NER 모듈이라 할수있습니다.
그에비해 documentation이 부족하고, 어떻게 자신의 프로젝트에 적용시킬수있는지에 대한 내용이 없습니다.
학습 코퍼스로부터 날짜(DT) 및 시간(TI) 엔티티들에 대해 숫자를 전부 0으로 축약한 패턴 형태의 사전을 구축
svm을 이용한 인명 분류기를 적용하여 태깅하는 스크립트 작성
JSON 코퍼스를 읽어들여 CRF 학습이 가능한 포맷으로 출력
학습 코퍼스에서 인명(PS)에 대해 아래 분포(히스토그램)를 추출
markdown으로 작성해서 grip으로 랜더링한 다음 pdf로 export
발표 자료 작성
안녕하세요. annie를 사용해보고 싶은데 아쉽게도 형식에 맞는 마땅한 코퍼스를 찾지 못해서 문의드립니다.
혹시 dev.json/train.json 에 들어갈 수 있는 국립국어원 개체명 코퍼스 혹은 기타 개체명 코퍼스를 공유해주실 수 있으실까요?
감사합니다.
A declarative, efficient, and flexible JavaScript library for building user interfaces.
🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.
TypeScript is a superset of JavaScript that compiles to clean JavaScript output.
An Open Source Machine Learning Framework for Everyone
The Web framework for perfectionists with deadlines.
A PHP framework for web artisans
Bring data to life with SVG, Canvas and HTML. 📊📈🎉
JavaScript (JS) is a lightweight interpreted programming language with first-class functions.
Some thing interesting about web. New door for the world.
A server is a program made to process requests and deliver data to clients.
Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.
Some thing interesting about visualization, use data art
Some thing interesting about game, make everyone happy.
We are working to build community through open source technology. NB: members must have two-factor auth.
Open source projects and samples from Microsoft.
Google ❤️ Open Source for everyone.
Alibaba Open Source for everyone
Data-Driven Documents codes.
China tencent open source team.