Привет!
Спасибо что согласились взяться за решения нашей задачи!
Суть того что нужно сделать - попробовать какой-либо подход для решения NER задачи на наших данных(см. папку /data)
Целевая метрика - micro-average span-level F1 score на тестовой части данных (test.conll). Имплементацию метрики можно взять в репозитории seqeval либо использовать встроенную в flair.
Мы хотим чтобы каждый из вас попробовал какой-либо подход для решения задачи, предоставил код его реализации и обученную модель(если таковая будет), а так же посчитал и сообщил значение метрики на тестовой части данных.
В идеале, вам необходимо сделать форк этого репозитория, добавить в него папочку с своим кодом/моделями/описанием и сделать пул-реквест к этому репозиторию. Но если с этим будут какие-то проблемы - можно передать любым другим способом(отправить мне(@daniil) в телеграме, например)
Для того, чтобы вы могли начать эксперименты с минимальными усилиями мы подготовили несколько базовых вариантов решений, они находятся в папке /baselines.
Вот тут список: