<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type='text/xsl' href='/oai/static/oai2.xsl' ?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd">
  <responseDate>2026-04-16T21:28:05Z</responseDate>
  <request identifier="0559def8bad8ed63f52714021225f3d339b6e7f1a7b357043bf4c2d2d020c44a" metadataPrefix="oai_ddi25" verb="GetRecord">https://datacatalogue.cessda.eu/oai-pmh/v0/oai</request>
  <GetRecord>
    <record>
    <header>
      <identifier>0559def8bad8ed63f52714021225f3d339b6e7f1a7b357043bf4c2d2d020c44a</identifier>
      <datestamp>2026-02-09T03:03:38Z</datestamp>
      <setSpec>language:en</setSpec><setSpec>openaire_data</setSpec>
    </header>
      <metadata>
        <codeBook xmlns="ddi:codebook:2_5" version="2.5" xsi:schemaLocation="ddi:codebook:2_5 http://www.ddialliance.org/Specification/DDI-Codebook/2.5/XMLSchema/codebook.xsd">
    <docDscr>
      <citation>
        <titlStmt>
          <titl xml:lang="en">DDI study level documentation for study ZA9089 German General Social Survey Personas – GGSS Personas Add-On data</titl>
        </titlStmt>
        <prodStmt>
        </prodStmt>
        <holdings xml:lang="en" URI="https://search.gesis.org/research_data/ZA9089?lang=en"/><holdings xml:lang="de" URI="https://search.gesis.org/research_data/ZA9089?lang=de"/>
      </citation>
    </docDscr>
  <stdyDscr>
    <citation>
      <titlStmt>
        <titl xml:lang="en">German General Social Survey Personas – GGSS Personas Add-On data</titl>
        <parTitl xml:lang="de">German General Social Survey Personas – GGSS Personas Add-On data</parTitl>
        <IDNo xml:lang="en" agency="GESIS">ZA9089, Version 1.0.0</IDNo><IDNo xml:lang="de" agency="GESIS">ZA9089, Version 1.0.0</IDNo><IDNo xml:lang="en" agency="DOI">10.4232/1.14707</IDNo><IDNo xml:lang="de" agency="DOI">10.4232/1.14707</IDNo>
      </titlStmt>
      <rspStmt>
        <AuthEnty affiliation="University of Mannheim" xml:lang="en">Rupprecht, Jens
        </AuthEnty><AuthEnty affiliation="University of Mannheim" xml:lang="de">Rupprecht, Jens
        </AuthEnty><AuthEnty affiliation="GESIS Leibniz-Institute for Social Sciences" xml:lang="en">Fröhling, Leon
        </AuthEnty><AuthEnty affiliation="GESIS Leibniz-Institute for Social Sciences" xml:lang="de">Fröhling, Leon
        </AuthEnty><AuthEnty affiliation="GESIS Leibniz-Institute for Social Sciences, RWTH-Aachen" xml:lang="en">Wagner, Claudia
        </AuthEnty><AuthEnty affiliation="GESIS Leibniz-Institute for Social Sciences, RWTH-Aachen" xml:lang="de">Wagner, Claudia
        </AuthEnty><AuthEnty affiliation="University of Mannheim, GESIS Leibniz-Institute for Social Sciences" xml:lang="en">Strohmaier, Markus
        </AuthEnty><AuthEnty affiliation="University of Mannheim, GESIS Leibniz-Institute for Social Sciences" xml:lang="de">Strohmaier, Markus
        </AuthEnty>
      </rspStmt>
      <prodStmt>
        <prodDate xml:lang="en"/>
      </prodStmt>
      <distStmt>
        <distrbtr abbr="GESIS" URI="http://www.gesis.org/" xml:lang="en">GESIS Data Archive for the Social Sciences</distrbtr><distrbtr abbr="GESIS" URI="http://www.gesis.org/" xml:lang="de">GESIS Datenarchiv für Sozialwissenschaften</distrbtr>
        <distDate xml:lang="en" date="2026-02-05"/><distDate xml:lang="de" date="2026-02-05"/>
      </distStmt>
      <verStmt>
        <version date="2026-02-05" xml:lang="en"/><version date="2026-02-05" xml:lang="de"/>
      </verStmt>
      <holdings xml:lang="en" URI="https://search.gesis.org/research_data/ZA9089?lang=en"/><holdings xml:lang="de" URI="https://search.gesis.org/research_data/ZA9089?lang=de"/>
    </citation>
    <stdyInfo>
      <subject>
      </subject>
      <abstract xml:lang="en">The German General Personas is a dataset based on the survey data from the German General Social Survey (GGSS/ALLBUS) wave of 2023. The data converted the tabular survey data into a natural language format that is compatible with the use in Large Language Model (LLM) prompts. We designed a process for the systematic selection of survey variables featured in different versions of the GGP. Since the idea of the GGP is to be a general-purpose persona prompt collection, this persona attribute selection process aims at identifying the subsets of sociodemographic and additional attributes that are most important for explaining variation in human responses across a range of different topics.</abstract><abstract xml:lang="en">The GGP data comprises a total of 20 versions, differing in format (key-value pairs and full-text versions) and level of included information (ten levels, ranging from only core socio-demographic information to all available survey variables). Each version includes all 5,246 participants surveyed in the GGSS/ALLBUS 2023 as persona descriptions, featuring varying numbers of the variables available in the GGSS/ALLBUScompact 2023 (ZA8831). The first version of the persona description format is a JSON-like key-value structure, where the questions or statements in the ALLBUScompact are the keys and their response options in text format are the corresponding values. To ensure that the response options (the variable labels are usually stored as integers in the tabular survey data) are interpretable for LLMs, we converted them back into the original text labels found in the survey codebook and interview question documentation. In addition to the fully structured key-value persona descriptions, we also provide more descriptive natural-language versions of the same personas. Each of these persona descriptions is created by prompting a proprietary, state-of-the-art LLM (Gemini-2.5-flash-lite) to turn the key-value persona description into a short textual description without adding, altering or omitting any of the provided information.</abstract><abstract xml:lang="de">Die German General Personas sind ein Datensatz, der die Umfragedaten der Allgemeinen Bevölkerungsbefragung für die Sozialwissenschaften (ALLBUS) aus dem Jahr 2023 für die Nutzung in großen Sprachmodellen optimiert. Die Daten wurden aus den tabellarischen Umfragedaten in ein natürliches Sprachformat konvertiert, das die Verwendung in Large Language Model (LLM)-Prompts ermöglicht. Wir haben einen Prozess zur systematischen Auswahl von Umfragevariablen entwickelt, die in verschiedenen Versionen der GGP enthalten sind. Da die GGP als universell einsetzbare Sammlung von Persona-Prompts konzipiert ist, zielt dieser Prozess der Auswahl von Persona-Attributen darauf ab, die Untergruppen soziodemografischer und weiterer Attribute zu identifizieren, die die Varianz in den Antworten von Menschen zu einer Reihe verschiedener Themen am besten erklären.</abstract><abstract xml:lang="de">Die GGP-Daten enthalten insgesamt 20 Versionen, die sich hinsichtlich ihres Formats (Schlüssel-Wert-Paare und Volltextversionen) und des Umfangs der enthaltenen Informationen (zehn Stufen, von ausschließlich soziodemografischen Merkmalen bis hin zu allen verfügbaren Umfragevariablen) unterscheiden. Jede Version enthält alle 5.246 Teilnehmer, die im Rahmen der ALLBUS-Erhebung 2023 befragt wurden, als Personenbeschreibungen mit einer unterschiedlichen Anzahl der in ALLBUScompact 2023 (ZA8831) verfügbaren Variablen. Die erste Version des Persona-Formats ist eine JSON-ähnliche Schlüssel-Wert-Struktur, bei der die Fragen oder Aussagen in ALLBUScompact die Schlüssel und ihre Antwortoptionen im Textformat die entsprechenden Werte sind. Um sicherzustellen, dass die Antwortoptionen (die Variablenbezeichnungen werden in den tabellarischen Umfragedaten in der Regel als Ganzzahlen gespeichert) für LLMs interpretierbar sind, haben wir sie wieder in die ursprünglichen Textbezeichnungen aus dem Umfrage-Codebook und der Dokumentation der Interviewfragen umgewandelt. Zusätzlich zu den vollständig strukturierten Schlüssel-Wert-Persona-Beschreibungen bieten wir auch beschreibendere Versionen derselben Personas in natürlicher Sprache an. Jede dieser Persona-Beschreibungen wird erstellt, indem ein proprietäres, hochmodernes LLM (Gemini-2.5-flash-lite) aufgefordert wird, die Schlüssel-Wert-Persona-Beschreibung in eine kurze Textbeschreibung umzuwandeln, ohne die bereitgestellten Informationen hinzuzufügen, zu ändern oder wegzulassen.</abstract>
      <sumDscr>
        <collDate xml:lang="en" date="2023-04" event="start"/><collDate xml:lang="en" date="2023-09" event="end"/>
        <nation xml:lang="en" abbr="DE">Germany</nation><nation xml:lang="de" abbr="DE">Deutschland</nation>
        <dataKind xml:lang="en">Text
Text</dataKind><dataKind xml:lang="de">Text
Text</dataKind>
      </sumDscr>
    </stdyInfo>
    <method>
      <dataColl>
        <timeMeth xml:lang="en">Cross-section<concept vocab="Time Method" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/TimeMethod/1.2?languageVersion=en-1.2">CrossSection</concept></timeMeth><timeMeth xml:lang="de">Querschnitt<concept vocab="Time Method" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/TimeMethod/1.2?languageVersion=de-1.2.1">CrossSection</concept></timeMeth>
        <sampProc xml:lang="en">Probability: Stratified: Disproportional<concept vocab="Sampling Procedure" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/SamplingProcedure/1.1?languageVersion=en-1.1">Probability.Stratified.Disproportional</concept></sampProc><sampProc xml:lang="de">Wahrscheinlichkeitsauswahl: Disproportional geschichtete Zufallsauswahl<concept vocab="Sampling Procedure" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/SamplingProcedure/1.1?languageVersion=de-1.1.1">Probability.Stratified.Disproportional</concept></sampProc><sampProc xml:lang="en">Probability: Multistage<concept vocab="Sampling Procedure" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/SamplingProcedure/1.1?languageVersion=en-1.1">Probability.Multistage</concept></sampProc><sampProc xml:lang="de">Wahrscheinlichkeitsauswahl: Mehrstufige Zufallsauswahl<concept vocab="Sampling Procedure" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/SamplingProcedure/1.1?languageVersion=de-1.1.1">Probability.Multistage</concept></sampProc>
        <collMode xml:lang="en">Self-administered questionnaire: Paper<concept vocab="Mode Of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/4.0?languageVersion=en-4.0">SelfAdministeredQuestionnaire.Paper</concept></collMode><collMode xml:lang="de">Selbstausgefüllter Fragebogen: Papier<concept vocab="Mode Of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/4.0?languageVersion=de-4.0.1">SelfAdministeredQuestionnaire.Paper</concept></collMode><collMode xml:lang="en">Self-administered questionnaire: Web-based (CAWI)<concept vocab="Mode Of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/4.0?languageVersion=en-4.0">SelfAdministeredQuestionnaire.CAWI</concept></collMode><collMode xml:lang="de">Selbstausgefüllter Fragebogen: Webbasiert (CAWI)<concept vocab="Mode Of Collection" vocabURI="https://vocabularies.cessda.eu/v2/vocabularies/ModeOfCollection/4.0?languageVersion=de-4.0.1">SelfAdministeredQuestionnaire.CAWI</concept></collMode>
      </dataColl>
    </method>
    <dataAccs>
      <useStmt>
        <restrctn xml:lang="en">A - Data and documents are released for academic research and teaching.</restrctn><restrctn xml:lang="de">A - Daten und Dokumente sind für die akademische Forschung und Lehre freigegeben.</restrctn>
      </useStmt>
    </dataAccs>
    <othrStdyMat>
    </othrStdyMat>
  </stdyDscr>
  <fileDscr>
  </fileDscr>
</codeBook>
      </metadata>
      <about>
        <provenance xmlns="http://www.openarchives.org/OAI/2.0/provenance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/provenance http://www.openarchives.org/OAI/2.0/provenance.xsd">
    <originDescription harvestDate="2026-02-09T03:03:37Z" altered="true">
      <baseURL>http://dbkapps.gesis.org/dbkoai/oai.asp</baseURL>
      <identifier>oai:dbk.gesis.org:DBK/ZA9089</identifier>
      <datestamp>2026-02-06</datestamp>
      <metadataNamespace>ddi:codebook:2_5</metadataNamespace>
    </originDescription>
</provenance>
      </about>
    </record>
  </GetRecord>
</OAI-PMH>