GithubHelp home page GithubHelp logo

devamitta / exporter Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 2.0 9.16 MB

exporting dictionary data base into stardict format (currently integrated into DPD exporter)

Home Page: https://github.com/digitalpalidictionary/dpd-db/tree/main/exporter

JavaScript 1.72% CSS 7.73% HTML 27.92% Python 60.31% Mako 0.93% Shell 1.40%

exporter's Introduction

dps-exporter

This is an old version; the new version has been integrated into the DPD exporter:

https://github.com/digitalpalidictionary/dpd-db/tree/main/exporter

Description

Exporting dps into various formats

Download the latest Pali-Russian Dictionary from here

Ищите свежее обновление Палийско-Русского Словаря здесь

Usage

To install in a local environment run:

python3 -m venv env
. env/bin/activate
pip3 install -e .

To run an example:

export DPS_DIR=examples/
./exporter.py run-generate-html-and-json
./exporter.py run-generate-goldendict

exporter's People

Contributors

bergentroll avatar devamitta avatar bdhrs avatar

Watchers

 avatar

exporter's Issues

русификация грамматических деталей

Сейчас словарь имеет в основном английское содержание и лишь одну русскую колонку, которая содержит перевод слов в контексте.
image
Вся грамматическая информация приводится на английском.
Чтобы полностью русифицировать словарь нужен код для замены грамматических терминов из abbreviations.csv
так как основная база будет на английском поэтому нужно чтобы код менял грамматические сокращения на соответствующие русские лишь перед выгрузкой в Golden Dict формат.
Задачи:

  • использовать общепринятые сокращения для всех слов имеющих в столбце ru-abbrev.
  • создать код, который будет заменять эти сокращения в столбцах [POS]; [Grammar]; [Neg]; [Verb]; [Trans]; [Case]; [Base]

необходимо учитывать что внутри данной программы содержание столбца [POS] влияет на создание словаря. см. ссылку

примеры исходных csv здесь

dps на английском

Появилась необходимость создавать третий тип словаря - dps на английском. - точно такой же как dps только без колонки русского языка и русификации POS

Дублируются файлы примеров CSV

В директориях examples/ и examples/spreadsheets/ находятся одинаковые файлы dps-full.csv и sbs-pd.csv. Дубли могли появиться после слияния с веткой, в которой CSV-файлы перенесены в поддиректорию spreadsheets/.

Когда файлы примеров находятся по пути examples/spreadsheets/, можно запустить скрипт так:

export DPS_DIR=examples/
./exporter.py run-generate-html-and-json && ./exporter.py run-generate-goldendict

Предложение: удалить файлы examples/*.csv.

онлайн словарь

Создать простой интерфейс поиска и загрузить базу словаря в сеть, в том форме в котором сейчас словарь доступен для Golden Dictionaty. Чтобы можно было онлайн искать слова и иметь доступ к последним обновлениям без какой-либо установки локально.
image

test for sbs

need to make a test for sbs pd:

all what have anything in chapter 1 chapter 2 or chapter 3 need to have index not empty; and other way around.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.