<!--+ Common attributes
    |    Every element has an xml:lang attribute.
    +-->
<!ENTITY % common.att '
  xml:lang NMTOKEN #IMPLIED'>

<!-- =============================================================== -->
<!-- Document -->
<!-- =============================================================== -->
<!ELEMENT document (header, body)>
<!ATTLIST document 
           id CDATA #IMPLIED
  %common.att; >


<!ELEMENT header (title,
            genre+, author+, 
            translator*, translated_from*,
            year?, place?, publChannel?, collection?,
            wordcount?, availability?, 
            submitter?, multilingual?, origFileName?, 
            metadata, version? )>

<!ELEMENT title (#PCDATA)>

<!-- translated_from is optional -->
<!-- this is the "unless" thingie again: If translated-from is
empty, then no translator.-->
<!ELEMENT translated_from EMPTY >
<!ATTLIST translated_from  
%common.att; >


<!-- scheme="dewey" code="44444" -->
<!-- scheme should be dewey or uit or whatever -->
<!ELEMENT genre EMPTY >
<!ATTLIST genre
            scheme  CDATA         #IMPLIED
            code    CDATA         #IMPLIED
    >

<!ELEMENT author (person | unknown)>
<!ELEMENT translator (person | unknown)>

<!ELEMENT person EMPTY >
<!ATTLIST person
            firstname CDATA         #REQUIRED
            lastname  CDATA         #REQUIRED
            born      CDATA         #IMPLIED
            sex       (m|f|unknown)   "unknown"
            nationality CDATA  #IMPLIED
    >

<!ELEMENT unknown EMPTY>

<!ELEMENT collection (#PCDATA) >

<!ELEMENT year  (#PCDATA)>
<!ELEMENT place (#PCDATA)>
<!ELEMENT publChannel (publication|unpublished)>
<!ELEMENT publication (publisher, ISBN?, ISSN? )> <!-- etc -->

<!ELEMENT unpublished EMPTY>
<!ELEMENT publisher (#PCDATA)>
<!ELEMENT ISBN (#PCDATA)>
<!ELEMENT ISSN (#PCDATA)>

<!ELEMENT wordcount (#PCDATA)>

<!ELEMENT availability (free|license)>
<!ELEMENT free EMPTY>
<!ELEMENT license EMPTY>
<!ATTLIST license
    type  (standard|other) "standard"
>

<!-- indicates whether all relevant metadata is filled -->
<!ELEMENT metadata (complete|uncomplete)>
<!ELEMENT complete EMPTY>
<!ELEMENT uncomplete EMPTY>

<!ELEMENT origFileName (#PCDATA)>
<!ELEMENT multilingual (language)+>
<!ELEMENT language EMPTY>
<!ATTLIST language
%common.att; >

<!-- Version information of the different conversion tools -->
<!ELEMENT version (XSLtemplate?, XSL?, commonXSL?, convert2xml?, add_hyph_tags?, docbook2corpus2?, xhtml2corpus?)>
<!ELEMENT XSLtemplate (#PCDATA)>
<!ELEMENT XSL (#PCDATA)>
<!ELEMENT commonXSL (#PCDATA)>
<!ELEMENT convert2xml (#PCDATA)>
<!ELEMENT add_hyph_tags (#PCDATA)>
<!ELEMENT docbook2corpus2 (#PCDATA)>
<!ELEMENT xhtml2corpus (#PCDATA)>


<!ELEMENT submitter EMPTY >
<!ATTLIST submitter
            name   CDATA     #REQUIRED
            email  CDATA     #REQUIRED>

<!ENTITY % text.ent "list|table|p|pre">
<!ELEMENT body (section|(%text.ent;))*>
<!ELEMENT section (section|(%text.ent;))*>

<!ELEMENT list (p*, list?)> <!-- type="listitem" -->
<!ELEMENT table (row*)>
<!ELEMENT row (p+)> <!-- type="tablecell" -->

<!ELEMENT p (#PCDATA | em | hyph | table |s )* >
<!ATTLIST p type ( title | listitem | text | tablecell ) "text"
  %common.att; >

<!ELEMENT em (#PCDATA | hyph)*>
<!ATTLIST em type ( bold | italic | underline | delimited ) "italic" >

<!ELEMENT hyph EMPTY>
<!ELEMENT pre (#PCDATA)>
<!ELEMENT s (#PCDATA)>
<!ATTLIST s 
           id CDATA #IMPLIED
>