<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type='text/xsl' href='/oai/static/oai2.xsl' ?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-06-11T16:29:44Z</responseDate>
  <request verb="GetRecord" metadataPrefix="oai_ddi25" identifier="d5f944163516c4d5794f5a1d9be9f7e0c5736e8bf8a21b5d86f27aa7427f3b24">https://datacatalogue.cessda.eu/oai-pmh/v0/oai</request>
  <GetRecord>
    <record>
    <header>
      <identifier>d5f944163516c4d5794f5a1d9be9f7e0c5736e8bf8a21b5d86f27aa7427f3b24</identifier>
      <datestamp>2026-06-02T14:06:25Z</datestamp>
      <setSpec>language:sv</setSpec>
    </header>
      <metadata>
        <codeBook xmlns="ddi:codebook:2_5" version="2.5" xsi:schemaLocation="ddi:codebook:2_5 http://www.ddialliance.org/Specification/DDI-Codebook/2.5/XMLSchema/codebook.xsd">
    <docDscr>
      <citation>
        <titlStmt>
          <titl xml:lang="sv">The Uppsala Russian Corpus</titl>
        </titlStmt>
        <prodStmt>
          <producer xml:lang="en" abbr="SND">Swedish National Data Service</producer><producer xml:lang="sv" abbr="SND">Svensk nationell datatjänst</producer>
        </prodStmt>
        <holdings xml:lang="en" URI="https://doi.org/">Landing page</holdings>
      </citation>
    </docDscr>
  <stdyDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="sv">The Uppsala Russian Corpus</titl>
        <parTitl xml:lang="en">The Uppsala Russian Corpus</parTitl>
        <IDNo xml:lang="en" agency="SND">ext0071-1-1</IDNo>
      </titlStmt>
      <rspStmt>
        <AuthEnty affiliation="Department of Language and Linguistics, University of Tromsø" xml:lang="en">Lönngren, Lennart
        </AuthEnty><AuthEnty affiliation="Institutionen för språkvetenskap, Universitetet i Tromsö" xml:lang="sv">Lönngren, Lennart
        </AuthEnty><AuthEnty xml:lang="en">Department of Modern Languages, Uppsala University
        </AuthEnty><AuthEnty xml:lang="sv">Institutionen för moderna språk, Uppsala universitet
        </AuthEnty>
      </rspStmt>
      <prodStmt>
        <prodDate xml:lang="en"/>
      </prodStmt>
      <distStmt>
        <distrbtr abbr="SND" URI="https://snd.gu.se" xml:lang="en">Swedish National Data Service</distrbtr><distrbtr abbr="SND" URI="https://snd.gu.se" xml:lang="sv">Svensk nationell datatjänst</distrbtr>
        <distDate xml:lang="en" date="2020-11-25">2020-11-25</distDate>
      </distStmt>
      <verStmt>
      </verStmt>
      <holdings xml:lang="en" URI="https://doi.org/">Landing page</holdings>
    </citation>
    <stdyInfo>
      <subject>
        <topcClas xml:lang="en" vocab="Standard för svensk indelning av forskningsämnen 2011">Languages and Literature</topcClas><topcClas xml:lang="sv" vocab="Standard för svensk indelning av forskningsämnen 2011">Språk och litteratur</topcClas><topcClas xml:lang="en" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=MediaCommunicationAndLanguage.LanguageAndLinguistics">Language and linguistics</topcClas><topcClas xml:lang="sv" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=MediaCommunicationAndLanguage.LanguageAndLinguistics">Språk och lingvistik</topcClas><topcClas xml:lang="en" vocab="Standard för svensk indelning av forskningsämnen 2011">Humanities and the Arts</topcClas><topcClas xml:lang="sv" vocab="Standard för svensk indelning av forskningsämnen 2011">Humaniora och konst</topcClas><topcClas xml:lang="en" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=MediaCommunicationAndLanguage">MEDIA, COMMUNICATION AND LANGUAGE</topcClas><topcClas xml:lang="sv" vocab="CESSDA Topic Classification" vocabURI="https://vocabularies.cessda.eu/vocabulary/TopicClassification?code=MediaCommunicationAndLanguage">MEDIA, KOMMUNIKATION OCH SPRÅK</topcClas>
      </subject>
      <abstract xml:lang="en">The Uppsala Corpus (Upsal'skij korpus russkix tekstov) consists of some 600 Russian texts with a total of one million running words (word tokens), equally divided between informative and literary prose. The informative texts are from between 1985 and 1989, while the literary texts, whose vocabulary does not date as quickly, cover a longer period, 1960-88. The corpus does not include poetry or drama.  Within the given frameword, considerable effort has been made to ensure as representative and varied a corpus as possible. The informative texts are drawn from 25 different subject areas: economics, foreign affairs / foreign policy, ideology / domestic policy, party matters, Soviet society, social issues, defence, education, law, history, culture, linguistics, medicine / health care, psychology, environment / ecology, agriculture, engineering, information technology, space research, energy, biology, geology / geography, physics, chemistry and sport. Certain areas which were felt to be more important are represented by a larger volume of texts.  The literary half of the corpus comprises work by the following 40 authors: Abramov, Ajtmatov, Astaf'ev, Baklanov, Bek, Belov, Bitov, Bondarev, Dubov, Ganin, Gladyshev, Granin, Grekova, Goncharov, Iskander, Kaverin, Kazakov, Kochnev, Kozhevnikova, Nagibin, Lixanov, Lidin, Paustovskij, Pogodin, Pristavkin, Troepol'skij, Rasputin, Shcherbakova, Simonov, Solouxin, Shmelev, Tendrjakov, Tokareva, Tolstaja, Trifonov, Vasil'ev, Vorobl'ev, Zalygin and Zorin. Here, too, there is unequal representation, with a larger amount of writing by the better-known authors.  For further details about the corpus, see Lönngren, Lennart (ed.), 1993. Chastotnyj slovar' sovremennogo russkogo jazyka. (A Frequency Dictionary of Modern Russian. With a Summary in English.) Acta Universitatis Upsaliensis, Studia Slavica Upsaliensia 32. 188 pp. Uppsala. ISBN 91-554-3134-8.  Purpose:  The aim is to provide a corpus of Russian prose texts.</abstract><abstract xml:lang="sv">Uppsalakorpusen består av runt 600 ryskspråkiga texter med sammanlagt en miljon ord (token), jämnt fördelade på informativ och skönlitterär prosa. De informativa texterna är skrivna 1985-1989 medan de skönlitterära texterna, vars vokabulär inte föråldras lika snabbt, hänför sig till en längre tidsperiod, från 1960-1988. Korpusen omfattar inte poesi eller drama.  Ett omfattande arbete har lagts på att säkerställa att korpusen blir så representativ och varierad som möjligt inom de givna ramarna. De informativa texterna är hämtade från 25 olika ämnesområden: ekonomi, utrikes nyheter/utrikespolitik, ideologi/inrikespolitik, partiangelägenheter, det sovjetiska samhället, sociala frågor, försvar, utbildning, lagstiftning, historia, kultur, lingvistik, medicin/hälsovård, psykologi, miljö/ekologi, jordbruk, ingenjörskonst, informationsteknologi, rymdforskning, energi, biologi, geologi/geografi, fysik, kemi och idrott. Vissa områden som ansågs vara viktigare representeras av en större textmängd.  Den skönlitterära hälften av korpusen omfattar verk av följande 40 författare: Abramov, Ajtmatov, Astaf'ev, Baklanov, Bek, Belov, Bitov, Bondarev, Dubov, Ganin, Gladyshev, Granin, Grekova, Goncharov, Iskander, Kaverin, Kazakov, Kochnev, Kozhevnikova, Nagibin, Lixanov, Lidin, Paustovskij, Pogodin, Pristavkin, Troepol'skij, Rasputin, Shcherbakova, Simonov, Solouxin, Shmelev, Tendrjakov, Tokareva, Tolstaja, Trifonov, Vasil'ev, Vorobl'ev, Zalygin och Zorin. Inte heller här är representationen jämn, utan de kändare författarna representeras av större textmängder.  För mer detaljerad information om korpusen se Lönngren, Lennart (ed.), 1993. Chastotnyj slovar' sovremennogo russkogo jazyka. (Modern rysk frekvensordbok. Med engelskspråkig sammanfattning.) Acta Universitatis Upsaliensis, Studia Slavica Upsaliensia 32. 188 sidor Uppsala. ISBN 91-554-3134-8.  Syfte:  Syftet är att tillhandahålla en korpus med ryskspråkiga prosatexter.</abstract>
      <sumDscr>
      </sumDscr>
    </stdyInfo>
    <method>
      <dataColl>
      </dataColl>
    </method>
    <dataAccs>
      <useStmt>
        <restrctn xml:lang="en">Access to data through an external actor. Data are freely accessible.</restrctn><restrctn xml:lang="sv">Åtkomst till data via extern aktör. Data är fritt tillgängliga.</restrctn>
      </useStmt>
    </dataAccs>
    <othrStdyMat>
    </othrStdyMat>
  </stdyDscr>
  <fileDscr>
  </fileDscr>
</codeBook>
      </metadata>
      <about>
        <provenance xmlns="http://www.openarchives.org/OAI/2.0/provenance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/provenance http://www.openarchives.org/OAI/2.0/provenance.xsd">
    <originDescription harvestDate="2026-06-02T14:06:24Z" altered="true">
      <baseURL>https://snd.gu.se</baseURL>
      <identifier>ext0071-1</identifier>
      <datestamp>2020-11-25T13:10:27Z</datestamp>
      <metadataNamespace>ddi:codebook:2_5</metadataNamespace>
    </originDescription>
</provenance>
      </about>
    </record>
  </GetRecord>
</OAI-PMH>