GithubHelp home page GithubHelp logo

hda-technical / dancebooks Goto Github PK

View Code? Open in Web Editor NEW
8.0 3.0 11.0 23.33 MB

Historical dance bibliography

Home Page: https://bib.hda.org.ru

License: Other

TeX 90.53% Python 7.11% CSS 0.33% HTML 0.83% JavaScript 0.53% Shell 0.35% Makefile 0.15% VBScript 0.17%
dance history bibliography python3

dancebooks's Introduction

dancebooks's People

Contributors

dependabot[bot] avatar georgthegreat avatar lenchik avatar mityafil avatar rkond avatar yumayolla avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar

dancebooks's Issues

Написание дат

Если год издания установлен неточно, его нужно брать в квадратные скобки.

Поле «дата добавления книжки»

Такое поле действительно нужно.
Первоначальную информацию можно вытащить из git blame.

Поле нужно рендерить в библиографии и разрешить поиск по нему.

Autosuggest keywords

Based on existing keywords, a handle should be created which suggested keywords on a model: the following keywords are often used with the given ones.

Spme consideration of the implementation is required.

Поле origauthor

Нужно добавить поле, содержащее имя автора на языке оригинала (если переводили с русского на английский или наоборот).

Поле должно использоваться для поиска по автору.

Умная функция сравнения строк

Искать книги сейчас довольно сложно.
Нужно написать «умную» функцию сравнения строк, которая бы:

  1. выкидывала пунктуацию
  2. конвертировала все буквы в casefold
  3. возможно, применяла бы дополнительные конвертации (чтобы Yrol был irol).

Обработка тега crossref

Тег crossref используется в статьях для указания ссылки на родительскую запись.
Если такой тег встречен, нужно сливать словари параметров в одну кучу.

Вопрос по установке

Приветствую! Имеется ли инструкция по установке и пользованию данным проектом? После установки, возможна ли будет загрузка книг из библиотек, не касающихся танцевальной тематики?

Полнотекстовый поиск

Очень пригодился бы полнотекстовый поиск.
Нужно добавить отдельную переключалку формочек и дополнительное поле в BibItem (сджоинить всё через пробел?).

Use yandex.disk REST API to generate download links

A handler
/bib/book//download should be implemented

Handler should validate if request.url matches book[id].filename url and redirect client to Yandex.Disk via REST API, based on book[id].filename.

Special case is needed for multivolume books.

dance.golderforests.ru links should be replaced with the new ones.

Возможность скрывать часть информации

На всякий случай нужно реализовать возможность скрывать или показывать часть информации из выдачи.

Реализация такая: сделать ручку, которая будет выставлять волшебную куку, проверять куку при каждом запросе.

Скрипт для валидации базы данных

Теперь, когда мы сматчили записи в базе с именами файлов, у нас есть возможность валидировать не только модель данных (что делалось и раньше на стороне библатеха), но и сами данные.

Нужно реализовать скрипт для подобной валидации.

Магия фронтенда

  1. Хорошо бы запрашивать languages и keywords отдельным запросом. Это улучшит читаемость шаблонов.
  2. Хорошо бы сделать кнопочку «очистить» в форме поиска.
  3. Хорошо бы реализовать отправку сообщений об ошибке (видимо, прямиком мне на почту).

biblatex

Стоит подумать над переходом с bibtex на biblatex.

Drop bibtex support

bibtex/bibtex8 уже разложились, пахнут и не поддерживают нормальной разметки в соответствующих файлах. Модификация их сложна и запутанна.

Вариантов два: либо оставить всё, как есть, либо официально дропнуть поддержку морально устаревшего софта.

Я за второе.

Markup annotations in markdown

Currently, annotations are marked up in LaTeX.
Task can be splitted into:

  1. Implementation of python-markdown plugin for replacing \parencite command (it looks like systax [book_id_here] will be appropriate
  2. Replacing of annotations output algorithm
  3. Replacing of annotations content

Parsing library in C++

A parsing library should be implemented using C++11 and libiconv for encoding stuff.
I'll post the details here.

Поиск по исходному файлу

Нужно добавить индекс по исходному файлу и формочку поиска по нему.

Полезно, чтобы давать ссылку на «все книжки с проблемами».
Кажется, это единственное полезное применение.

Выбор орфографии

Многие языки (в частности, французский и русский) эволюционировали с момента издания книг. Нужно определить, в какой орфографии оформлять информацию о таких книгах: в оригинальной или в современной.

The Full English Project

English Folk Dance and Song Society презентовало проект "The Full English", в рамках которого было оцифровано гигантское количество коллекций английской народной песни и английского народного танца.

http://www.vwml.org/browse/browse-collections-full-english

Нужно разобраться с коллекцией, выделить оттуда танцевальные источники и внести их в библиографию.

Издатели / Авторы

Рауль-Ожер Фёйе и Жак Дезе сейчас всюду значатся авторами книг (хотя зачастую они были только издателями).
Эту проблему следует исправить.

Provide algorithm for surname detection

We have to handle complex cases properly:

  1. Виктор Васнецов -> Васнецов
  2. Pablo Minguet e Yrol -> Minguet e Yrol
  3. C. J. von Feldtenstein -> Feldtenstein
  4. A. D. -> A. D.

Though bibliography is written in python at the time, I would suggest implementing this in C++.
And I am not sure that there no solution for this problem yet.

(natbib+bibtex): Написание года

Если есть несколько источников одного года, к ним справа приписывается латинская буква.
Эта же самая буква появляется в годе издания книги. Там ее быть не должно.

Коды по каталогам FL и LM

В поле note некоторых барочных книг внесены коды по каталогам Francine Lancelot и Little-Marsch.

Нужно внести эти коды для всех книг, имеющихся в каталогах.

polishhook

У меня не получилось корректно вставить символ http://ru.wikipedia.org/wiki/%C4%98 в файл polish.bib.
Необходимо разобраться: треубемый функционал предоставляют пакеты wsuipa (пакет со шрифтами) и mathscinet (проблема с кодировками - данный символ экспортируется только для кодировок T1 и OT1

Поддержка бибтеха

Библиография реализована в виде пакета.
Сделаны два пакета (для natbib+bibtex8 и для biblatex+biber соответственно).

Нужно решить, критична ли нам работа в связке natbib+bibtex8. Отказ от поддержки устаревших технологий сильно облегчит жизнь (и решить несколько насущных проблем из списка багов).

Кастомная сортировка

Сейчас (это, кажется, совпадение) книжки в выдаче сортируются по полю source.
Нужно предусмотреть интерфейсное решение для кастомной сортировки.

Поддержка польского языка

biblatex не поддерживает польский язык.
Нужно найти файл polish.lbx, протестировать его на работособность и добавить его в репозиторий.

Музыковедческие журналы

У меня лежат подборки музыковедческих журналов:
Journal of Musicology
Anuario Musical

Нужно решить, стоит ли вносить их в библиографию.

Индексы

Для ускорения работы фильтрации и удобства реализации некоторых фич, нужно предусмотреть создание индексов (по аналогии с sql-индексами) в парсере.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.