GithubHelp home page GithubHelp logo

maxprofs-llcio / guldkorpus Goto Github PK

View Code? Open in Web Editor NEW
0.0 1.0 0.0 14.81 MB

error-nginx.github.io

Home Page: https://docs.python.org/3.14/index.html

Python 45.59% XSLT 52.62% Emacs Lisp 1.39% CSS 0.40%

guldkorpus's Introduction

Guldkorpus - Transskriptionsregler

1) Generelt:

  • Vi transskriberer i rentekst-format (dvs .txt i hvilken som helst teksteditor eller .docx i Word). Hvis man arbejder i Word kan der dog ikke bruges formateringsfunktionerne, dvs. kursivering, farver, …

  • Brug en MUFI-kompatibel font, fx Andron Scriptor Web eller Junicode (kan downloades her: http://folk.uib.no/hnooh/mufi/fonts/index.html).

  • Vi transskriberer kun på faksimilært niveau.

  • En linje i diplomet bliver gengivet med en linje i transskriptionen. Efter hver linie sættes dobbelt linjeskift (2 x return).

  • Interpunktuationstegn transskriberes som de forekommer i diplomet (fx ”.”, ”,” og ”/”), men et punktum der er skrevet lidt højere (en so-kaldt punctus elevatus) gengives som almindeligt punktum.

  • Ord bliver separeret af mellemrum. Hvis noget er skrevet som to ord, der burde være ét, bruges ”=” (fx ”Hellig=ånd”, ”konge=magten”, ). Hvis noget er skrevet sammen, men burde behandles som to ord, indsættes ”==” (fx ”e==foruden”, ”før==sagt”, ”at==i”).

  • Noter med kommentarer, fx når man har spørgsmål eller har lagt mærke til noget særligt, skrives indenfor …, fx ”BS: Need to double check this! Really!

2) Bogstavsformer mm.:

  • Vi skelner mellem langt s/rundt s, almindeligt r/r-rotunda og bevarer ligaturer, der deler en minim eller downstroke eller får en anderledes bogstavform (fx ligaturer af a+v, a+e, a+a, s+t, c+t, p+p, f+f, k+langt s, h+langt s), + bevarer vi rundt d????
  • Vi markerer n og m, der har en højre descender. Der skelnes dog ikke mellem forskellige typer, men bruges hovedformen ”right descender” (dvs.  (&nrdes;) og  (&mrdes;)) (SKAL AFPRØVES OG ER MÅSKE IKKE RELEVANT)
  • Der skelnes mellem store bogstaver, små bogstaver, small capitals og enlarged letters (fx ”E” vs. ”e” vs. ”ᴇ” (&escap;) vs. ”” (&eenl;).
  • Unciale bogstaver opmærkes, fx  (&Eunc;),  (&eunc;) og  (&Munc;).
  • Initialer bliver som udgangspunkt behandlet som store bogstaver.
  • Diakritiske tegn skal transskriberes på alle vokaler + y (inkl. ligaturer). Dvs. der skelnes mellem ”ı” (ı), ”i”, ”í”, ”ï” og ”” (&idblac;) mellem ”y”, ”ẏ” (&ydot;), ”ý” (ý), ”ÿ” (ÿ), ”” (&ydblac;) o.s.v. Skelnes mellem kodes streg over u og u uden streg?
  • Det er lige meget om man vil sætte MUFI tegn ind med det sammen, eller om man hellere vil bruge entiteter for særtegn. MUFI character listen findes her: http://folk.uib.no/hnooh/mufi/specs/MUFI-Alphabetic-3-0.pdf

3) Abbreviaturer:

  • Forkortelsestegn transskriberes som forkortelsestegn, dvs. ikke opløst, og i deres `standard form’ (se fil ”Forkortelser.pdf”). Hvilket tegn bruger vi for et rigtigt ampersand (og/et)? Og hvordan opmærkes d med en lille krølle nedenfor for at indikere afsluttende e?
  • So vidt muligt skrives basistegnet, dvs. bogstaven på skrivelinien, først og så forkortelsestegnet bagefter (også hvis de er skrevet sammen i diplomet), dvs. ”a”+”&bar;” og ikke ”ā”, ”h”+”&bar;” og ikke ”&hstroke;”. De eneste undtagelser er ”&pflour;” and ”&slongflour;”, fordi de pågældende forkortelsestegn p.t. ikke eksisterer som separate tegn (se også filen ”Forkortelser.pdf”).
  • Forkortelsestegn der principielt også kunne fortolkes som almindelige tegn, fx punktum, markeres når de forekommer som forkortelsestegn med hjælp af parenteser rundt omkring (fx ”A(.)D(.)” for Anno Domino).
  • Hvis et tegn kunne stå for både forkortelsestegn og sig selv, angives det med særtegnes ”·” (·) (fx ”NN skal betale 10 m(.)s·” for ”NN skal betale 10 mark sølv.”)

4) Ændringer og problematiske læsninger:

  • Tilføjelser (både af skriveren selv og senere tilføjelser) sættes indenfor …. Med hjælp af ”hand” og ”place” markører i den første del af mark-up’en kan det tillægges flere informationer om tilføjelsen, fx skriveren har først glemt a’et i ordet datter og senere tilføjet det ovenfor: ”datter, eller en senere tilføjelse i nedre margen: ”Denne gård er nu eget af mig, Jens Andersen. Flere oplysninger kan findes i kapitel 9.2.1 af Menota håndbogen v.3 (http://www.menota.org/HB3_ch9.xml).
  • Udslettede bogstaver eller ord markæres på lignende måde med , som også kan specificeres med ”hand” og ”rend”. Et ord, der blev streget over af skriveren selv, for eksempel, markeres således: ord. (Se også kapitel 9.2.2 i Menota håndbogen v.3 (http://www.menota.org/HB3_ch9.xml).
  • Beskadiget tekst, som er fuldstændig forsvundet og ikke kan rekonstrueres, markæres med .... Indenfor sættes lige så mange 0-tal som der vurderes mangler, fx ”00000”.
  • Suppleret tekst sættes indenfor …. Der kan angives en grund med hjælp af ”reason”, der kan være ”illegible” eller ”omitted”, fx ”Maria. Alternativt kan også skrives ”Mar[ia]” (hvis det er ulæseligt) eller ”Mar⟨ia⟩” (hvis bogstaverne aldrig blev skrevet). Hvad gør vi i tilfælde af et ord, der er skrevet over 2 linier (og der er ikke indikeret bindestreg eller lignende)?
  • Svært læselig tekst, bogstaver som kun delvis er synlige, eller noget som ikke kan bestemmes med sikkerhed sættes indenfor …, fx ”Første”. Alternativt kan her anvendes tuborgklammer: ”F{ø}rste”.
  • If there is too much text, i.e. a scribe repeated a word or parts of a word withput noticing and deleting it, the word(s) are palced inside of , e.g. ”ett offentligt be beseglet bref” =======

Guldkorpus

Liste af diplomer i korpuset

  • LI, 1 (1263, latin)
  • LI, 23 (1258, latin)
  • LI, 24 (latin)
  • LIX, 27 (1399, nedertysk)
  • LX, 18 (1406, nedertysk)
  • LX, 22 (1408, dansk)
  • LX, 28 (1412, dansk)
  • LXI, 11 (1432, dansk)
  • LXI, 12 (1433, dansk)
  • LXI, 17 (1437, latin)
  • LXI, 21 (1439, dansk)
  • LXI, 24 (1442, svensk)
  • LXIV, 4 (1507, dansk)
  • LXIV, 14 (1523, dansk)
  • LXIV, 15 (1527, svensk)

guldkorpus's People

Contributors

torekris avatar werronense avatar sdvrie avatar filologen avatar beesteg avatar dittechristensen avatar amhansen avatar

Watchers

 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.