GithubHelp home page GithubHelp logo

haoess / hidden-kosmos Goto Github PK

View Code? Open in Web Editor NEW
4.0 4.0 2.0 48.38 MB

Hidden Kosmos — Reconstructing Alexander von Humboldt's »Kosmos-Lectures«

License: Creative Commons Attribution 4.0 International

Perl 0.41% Shell 0.01% XSLT 0.03% Makefile 0.09% HTML 99.41% CSS 0.05%

hidden-kosmos's People

Contributors

cthomasdta avatar haoess avatar mhug avatar

Stargazers

 avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar

Forkers

mhug cthomasdta

hidden-kosmos's Issues

Liste der editorischen Kommentare in Ms. Germ. qu. 2124

Bitte eine Liste extrahieren, möglichst mit Kontext, aller <note>s mit @type="editorial" aus http://www.deutschestextarchiv.de/nn_msgermqu2124_1827, in denen "Hamel/Tiemann (Hg.) 1993" vorkommt. Dann haben wir einen Überblick, was alles und wie viel in dieser Edition vermurkst wurde. Diese Liste kann direkt veröffentlicht werden.

Z.B. http://www.deutschestextarchiv.de/nn_msgermqu2124_1827/29:

[...] (wie<lb/><hi rendition="#aq"><persName ref="http://d-nb.info/gnd/118684310">Fourier</persName></hi> in einem<note resp="#CT" type="editorial">Hamel/Tiemann (Hg.) 1993, S. 67: "seinem".</note> tiefsinnigen Werke [...]

hidden-kosmos/lists/: mit Zitat Titel der Vorträge; Titel der Seite entsprechend ändern

cf. http://www.deutschestextarchiv.de/kosmos/gliederung:

  • Zit. aus Virmond 2011/Verzeichniß 1827 voranstellen;
  • Titel der Seite entsprechend ändern

Virmond 2011, S. 485; vgl. auch Verzeichniß 1827, S. 6 (darauf kann man dann auch verlinken!) :

1827ws207 Physische Erdbeschreibung, mit Prolegomenen über Lage, Gestalt und Naturbeschaffenheit der Gestirne, Hr. Dr. Alex. v. Humboldt Mitgl. d. Königl. Akad. d. Wissenschaften Mittw. u. Sonnab. v. 12–1 Uhr öffentlich. | Publice geographiam physicam tradet, eique prolegomena de situ, forma et indole siderum praemittet, d. Mart. et Sat. h. XII–I. | {400; «ich glaube» 300 bis 400 Hörer; 3.11.–26.4.; «ich habe den letzten Monat täglich gelesen»} [Daneben trug Humboldt Donnerstags vom 6. 12. bis zum 27. 3. um 12 Uhr in der benachbarten Singakademie zweistündig vor doppelt zahlreichem, auch weiblichem Publikum eine vereinfachte Version vor.]

Gesamtzahlen in der Spalte "Vorkommen" bitte Farben umdrehen

Gesamtzahlen

in der Spalte "Vorkommen" bitte Farben umdrehen: z. B. Rudolphi: soll sein: "6 + 3 + 3 (12)" erst grün, dann rot. Im Moment ist das uneinheitlich: Die Zahlen sind rot-->grün, die Pfeile sind grün-->rot; aber Uni (grün) sollte immer zuerst, da der Kurs an der Uni früher gestartet wurde.

hidden-kosmos/sessions/: Zeichen- und Tokenzahlen berechnen

bitte für die einzelnen Dokumente = Stunden in hidden-kosmos/sessions/ auch die Zeichen- und Tokenzahlen berechnen, merke grad, dass das interessant wäre!

Dokumente mit Häkchen an- oder abwählbar

  • default: alle angewählt
  • dann kann ich einzelne Dokumente abwählen
  • idealerweise bleibt die Gesamtliste aber immer gleich, d.h. alle möglichen Personen werden angezeigt und bei denen, die in den gewählten Dokumenten/dem gewählten Dokument nicht vorkommen, wird in der Spalte "Vorkommen" angezeigt: "[keine Vorkommen in dem/den gewählten Dokument(en)]"

BEACON-Dateien und Gesamtlisten: Alle Dokumente und auch jedes Einzeldokument

  • BEACON-Dateien für "Alle Dokumente" und auch jedes Einzeldokument, diese enthalten GND-Nummern und Anzahl der Vorkommen
  • Gesamtliste: Diese enthält alle GND-Nummern und auch die anderen @ref-Werte sowie die Anzahl der nicht-identifizierten Personen (= persName ohne @ref)

==> so kann ich z.B. herausfinden, welche 4 Personen in hufeland_privatbesitz_1829 fehlen, die in nn_msgermqu2124_1827 vorhanden sind (unique Personen: 276 (+ 4 ohne @ref) vs. 280 (+ 5 ohne @ref))

Aktualisieren der Liste 'auf Knopfdruck'

Aktualisieren der Liste 'auf Knopfdruck'

  • wäre schön, aber wenn es zu kompliziert ist, nicht zwingend
  • Wenn ich also was in DTAQ nachtagge, dann kann ich gleich die Liste aktualisieren, d.h. dein Skript läuft neu über die Daten
  • Datierung (siehe enstpr. Issue) aktualisiert sich auch

Umgang mit <note>

Umgang mit <note>

unterscheiden <persName> in <note> im Original und in <note type="editorial">:

Spalte "Name" umbenennen in "Name (Ansetzungsform der GND)"

Spalte "Name"

Personenliste: Spalte "Vorkommen" sollte in 9 Unterspalten + 1 Spalte = Anzahl der Gesamttreffer geteilt sein, so dass man auch die Fehlstellen sieht

  • feste Reihenfolge der Dokumente, diese legen wir noch fest
  • dann immer eine feste Spalte je Dokument, so dass man immer sieht, wo was fehlt.
  • Beispiel:

Parrot, Friedrich von (1791–1841) || 5 + 4 + 5 + 3 + 1 (18)

Soll sein:
Parrot, Friedrich von (1791–1841) || 0 | 0 | 5 | 4 | 5 | 0 | 3 | 0 | 1 (18)

--> man sieht also, dass im 1., 2., 6. und 8. Dokument der Name fehlt (und kann sich auch die einzelnen Dokumente nach Häufigkeit sortieren lassen, statt jetzt nur nach Gesamthäufigkeit.)

Markup innerhalb der Vorlageform: <del>, <gap>, -<lb/> usw. ignorieren

Markup innerhalb der Vorlageform

<del>, <gap>, -<lb/> usw. ignorieren

  • <del>: siehe z. B. "gGaus" und "Achgardh" in der aktuellen Liste, <del> muss auch ignoriert werden: <persName resp="#CT" ref="http://d-nb.info/gnd/118643959">A<subst><del rendition="#s" hand="#pencil">ch</del><add place="superlinear" hand="#pencil">g</add></subst>ard<metamark/><add place="intralinear">h</add></persName>
  • <persName> innerhalb von <del> ignorieren, wenn also die erwähnte Person komplett gestrichen wurde, sollte sie auch nicht in der Liste auftauchen. In msgermqu2345 (das noch nicht drin ist) gibt es davon viele Beispiele, bei Parthey nur 2, z. B. http://www.deutschestextarchiv.de/parthey_msgermqu1711_1828/777: <subst><del rendition="#s"><persName resp="#SB" ref="http://d-nb.info/gnd/116208503">Blumenbach</persName></del><add place="superlinear"><persName resp="#SB" ref="http://d-nb.info/gnd/118517252">Buffon</persName></add></subst>

Das alles ist scheinbar schon berücksichtigt:

  • -<lb/> innerhalb von <persName> ignorieren, jedenfalls sofern nur Trennung am Zeilenende, nicht bei "Gay-Lussac") usw. innerhalb der Vorlageformen, das scheint schon zu klappen
  • <gap> innerhalb von <persName> ignorieren, z. B. <persName resp="#SB" ref="http://d-nb.info/gnd/11864811X">Al<subst><del rendition="#ow"><gap reason="illegible" unit="chars" quantity="2"/></del><add place="across">fo</add></subst>ns</persName> das scheint schon zu klappen
  • alles innerhalb von <unclear> auch mitnehmen, das scheint aber zu klappen
  • alles innerhalb von <supplied> aber mitnehmen, kommt bisher zwar nur 1x vor, bei Libelt, der noch nicht drin ist: <persName resp="#CT" ref="http://d-nb.info/gnd/11876196X"><supplied reason="damage" cert="high" resp="#CT">Schroe-</supplied><lb/> ter</persName>

normalisierte HTML-Fassungen

*.norm.xml ist für Kollation usw. absolut klasse. Unbedingt beibehalten.

ABER: das Voyant-(Norm-)XML ist für andere Dinge besser.
Hintergrund: Es gibt leider ein Problem mit dem aus den *.norm.xml (via https://raw.githubusercontent.com/haoess/dta-tools/master/stylesheets/dtabf.xsl) erzeugten HTML: Dieses enthält beispielsweise noch Text in <del>; dieser wird zwar entsprechend als gestrichen formatiert/dargestellt, von Tools wie Copyfind aber als normaler Text behandelt.
Lösung: HTML erzeugen aus Voyant-(Norm-)XML (wofür ja all diese Dinge schon berücksichtigt und entfernt wurden). Vorgehen am Beispiel von http://www.deutschestextarchiv.de/book/download_normxml/parthey_msgermqu1711_1828:

Das wäre dann perfekt für CopyFind et al. Diskutieren wir dann gerne später weiter!

hidden-kosmos/sessions/

Bitte Dateinamen so ändern, dass zumindest der dtadirname, evtl. auch "session" drin enthalten ist. Danke!

Personen vernetzen: BEACON

Personen vernetzen: BEACON hin und zurück

  • alle, die in der Spalte "Name" vorkommen, sollen anklickbar sein (für die anderen macht es wohl keinen Sinn?) und dann kommt eine Art 'Gesamtübersicht' zu dieser Person:
  1. da kann man dann auch differenzierter zeigen, in welcher Stunde sie in welchem Dokument Uni vs. Sing-Akademie vorkommen und auch einen KWIC-Index des Vorkommens einbinden
  2. da kann man dann verweisen auf WP, WS, ABD/NDB, Porträtindex, und andere hilfreiche Angebote.

Dokumente bitte noch differenzieren (Uni vs. Singakademie)

Dokumente

  • bitte noch differenzieren durch "[Kosmos-Vorträge an der Berliner Universität]" und "[Kosmos-Vorträge an der Sing-Akademie]", gern auch als eine Art Fußnote einmal für alle: alle grünlichen=Uni, alle rötlichen=Singakademie o. Ä.
  • und bitte oben bei "Dokumente" den dtadir-Name als Link auf die Nachschrift umsetzen.

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.