GESIS - für eine forschungsbasierte Infrastruktur

GESIS ist eine forschungsbasierte Infrastruktureinrichtung für die Sozialwissenschaften und führt eigene kontinuierliche und interdisziplinäre Forschung durch. Die Ergebnisse unserer Forschung dienen sowohl der Gewinnung wissenschaftlicher Erkenntnis, als auch der nachhaltigen Verbesserung unserer Angebote für die Sozialwissenschaften.

Für GESIS steht die Qualität von Daten im Mittelpunkt. GESIS strebt danach, qualitativ hochwertige Forschungsdaten sowie Methoden und Tools bereitzustellen, die es Nutzenden ermöglichen, selbst einzuschätzen, wie hoch die Qualität von Forschungsdaten ist. Daher richtet sich der Forschungs- schwerpunkt auch auf dieses Kerninteresse aus. Um einen Beitrag zur Wissensgenerierung rund um Datenqualität leisten zu können, fokussiert GESIS auf die Forschungsbereiche Umfragemethodik, computerbasierte Methoden und Forschungsdatenmanagement. Gemeinsam richten wir unsere methodisch orientierte Forschung darauf aus, Forschende zu unterstützen, die mit quantitativen Daten zu sozialwissenschaftlichen Fragestellungen arbeiten und selbst Beiträge zu grundlegenden inhaltlichen Fragestellungen zu leisten.

Forschungsoutput von GESIS

Titel	Start	Ende	Förderer
Kompetenzzentrum Datenqualität in den Sozialwissenschaften (KODAQS)	2023-11-15	2026-11-14	Bund
PIAAC-C2 - The Programme for the International Assessment of Adult Competencies (Cycle 2) (PIAAC-C2)	2018-04-06	2024-12-31	Sonstige Drittmittel
Nationales Projektmanagement für die Durchführung des zweiten Zyklus der internationales Vergleichsstudie PIAAC (NPM PIAAC2)	2018-01-01	2024-12-31	Bund

Sen, Indira, Dennis Assenmacher, Mattia Samory, Isabelle Augenstein, Wil van der Aalst, and Claudia Wagner. 2023. "People Make Better Edits: Measuring the Efficacy of LLM-Generated Counterfactually Augmented Data for Harmful Language Detection." 2023. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, EMNLP, edited by Houda Bouamor, Juan Pino, and Kalika Bali, 10480-10504. Singapore: Association for Computational Linguistics.
Dahou, Abdelhalim Hafedh, Mohamed Amine Cheragui, and Ahmed Abdelali. 2023. "Performance Analysis of Arabic Pre-Trained Models on Named Entity Recognition Task." In Proceedings of the 14th International Conference on Recent Advances in Natural Language Processing, edited by Ruslan Mitkov, and Galia Angelova, 458–467. Shoumen: INCOMA Ltd.. https://aclanthology.org/2023.ranlp-1.51.pdf.
Diera, Andor, Abdelhalim Hafedh Dahou, Lukas Galke, Fabian Karl, Florian Sihler, and Ansgar Scherp. 2023. GenCodeSearchNet: A Benchmark Test Suite for Evaluating Generalization in Programming Language Understanding. Proceedings of the 1st GenBench Workshop on (Benchmarking) Generalisation in NLP. Association for Computational Linguistics (ACL). doi: https://doi.org/10.18653/v1/2023.genbench-1.2.
Dahou, Abdelhalim Hafedh, and Brigitte Mathiak. 2023. "Subject Classification of Software Repository." In Proceedings of the 15th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management - KDIR, 1, 30-38. SciTePress. doi: https://doi.org/10.5220/0012159600003598.
Lietz, Haiko, Mohsen Jadidi, Daniel Kostic, Milena Tsvetkova, and Claudia Wagner. 2024. "Individual and gender inequality in computer science: A career study of cohorts from 1970 to 2000." Quantitative Science Studies online first 1-24. doi: https://doi.org/10.1162/qss_a_00283.

1
2
3
4
…
309

Forschungsschwerpunkt Data Quality

Ein wesentliches Merkmal von GESIS ist, dass das Institut insbesondere bei den Daten, für die es auch die Erhebung verantwortet, sehr hohe Ansprüche und Standards an die Qualität der bereitge- stellten Daten anlegt. Daher ist es für GESIS zentral, eigene Beiträge zur Untersuchung und Verbes- serung von Aspekten der Datenqualität zu leisten. Die Forschung in den GESIS-Forschungsbereichen trägt deshalb direkt zum Schwerpunkt Datenqualität bei. Dies betrifft sowohl Umfragedaten als auch digitale Verhaltensdaten und relevante Metadaten.

Datenqualität umfasst Aspekte der (a) Kor- rektheit und Repräsentativität von Daten und (b) Nutzbarkeit und FAIRness von Daten. Beispiele für (a) sind die Vollständigkeit, Korrektheit, Provenienz der Repräsentativität von Daten, während (b) Aspekte wie Findbarkeit, Qualität der Dokumentation, Aufbereitung oder die Interoperabilität von Daten und Metadaten berücksichtigt. Damit wird eine wichtige Voraussetzung dafür erfüllt, dass die Bearbeitung inhaltlicher Fragestellungen (Substantive Research) auf Basis dieser Daten zu validen Ergebnissen führt.

Forschungsbereich Survey Methodology

Wir forschen bei GESIS grundlagen- und anwendungsorientiert zum Themenbereich Umfragemethodik. Unsere Umfrageforschung gliedert sich in die Schwerpunktbereiche Survey Statistics, Survey Instruments, Survey Operations und Comparative Surveys. Wir verfolgen das Ziel, evidenzbasierte Erkenntnisse darüber zu gewinnen, wie Umfragen und deren Datenqualität optimiert werden können.

Im Rahmen von systematischen Reviews und Meta-Analysen bewerten wir dafür vorhandene Forschung und identifizieren Forschungslücken. Im Forschungsbereich Umfragemethodik erforschen wir zudem die Verbindung von Umfragedaten mit digitalen Verhaltensdaten (z.B. Social Media Profilen, Smartphone-Nutzungsdaten oder Browserverläufen) und prüfen, wie sich diese Datentypen ergänzen und kombinieren lassen. Dafür treiben wir auch die Übertragung von etablierten Konzepten zur Bewertung der Datenqualität von Umfragen auf digitale Verhaltensdaten voran.

Forschungsbereich Computational Methods

Um angesichts des raschen Wandels in den Informations- und Wissenstechnologien ein hohes Qualitätsniveau digitaler GESIS-Produkte und -Dienste sicherstellen zu können, betreibt GESIS Forschung im Bereich der Angewandten Informatik und Informationswissenschaft.

Ziel dieses Forschungsfeldes ist es, neuartige Methoden, Modelle und Algorithmen der Informatik im Anwendungsfeld Sozialwissenschaften zu erproben, zu analysieren, zu adaptieren, weiterzuentwickeln und zu evaluieren. Ein Kernbestandteil dieses Forschungsbereiches ist dabei vor allem die Erschließung von digitalen Verhaltensdaten wie z.B. Daten aus sozialen Medien oder durch Sensoren generierte Daten für die sozialwissenschaftliche Forschung. Denn die Entwicklung und Beurteilung von Methoden zur Erhebung, Aufbereitung und Analyse dieser neuen Daten erweitert die Basis zur Beantwortung sozialwissenschaftlicher Fragen. Durch die Implementierung der gewonnen Erkenntnisse können so in Zukunft auf die Sozialwissenschaften zugeschnittene, innovative und integrierte Forschungsinfrastrukturen und -angebote zu allen Phasen des Forschungsdatenzyklus entstehen.

Forschungsbereich Research Data Management

Das Forschungsgebiet Forschungsdatenmanagement hat in den letzten Jahren an Bedeutung gewonnen und firmiert in der Scientific Community auch unter den Schlagworten Data Access, Data Archiving, Data Infrastructures, Data Preservation, Data Reuse, Data Science, Metadaten, Open Data oder Open Science.

Vor dem Hintergrund des großen und weiter wachsenden Datenbestandes von GESIS, sowie den damit verbundenen Angeboten zum Datenbezug und zur Datenarchivierung ist die Forschung in diesem Themenbereich ein wichtiger Bestandteil zur Erweiterung und zum Ausbau der damit verbundenen Infrastrukturen. Forschung in diesem Themengebiet befasst sich mit der Langzeitarchivierung, der Datendokumentation sowie den rechtlichen Rahmenbedingungen des Datenzugriffes und der Lizenzierung von Daten. Themen dieses Forschungsbereiches adressieren somit die Fragestellungen, die sich aus der gemeinsamen Sekundärnutzung von Daten (Daten teilen) sowie aus der Problematik der Langzeitarchivierung (Langzeitarchivierung) ergeben. Zudem sind in Bezug auf Umfragedaten, vor allem aber für digitale Verhaltensdaten (z.B. Daten aus sozialen Medien oder durch Sensoren generierte Daten) das Erstellen von Datendokumentationsstandards und die Vernetzung von Daten (Metadaten) sowie ebenso wie die Datensicherheit (Datensicherheit) zentrale Forschungsthemen.

Forschungsbereich Substantive Research

Die inhaltliche Forschung bei GESIS ist stark in den GESIS-Datenerhebungsprogrammen verankert. Die Datenerhebungen und unsere damit verknüpfte Forschung orientieren sich an den themati- schen Interessen der Fach-Communities, die durch die Koordinierungsgruppen (KGs) und Einrei- chungen von Nutzenden eingebracht werden. Gleichzeitig wirbt GESIS Drittmittelprojekte zu inhalt- lichen Themen ein, erhebt in diesem Rahmen neue Daten und beforscht aktuelle Fragestellungen. Die inhaltliche Forschung trägt somit zu mehreren Zielen bei.

Durch die Arbeit mit den im Institut erhobenen Daten werden Entwicklungspotentiale der Daten erkannt und deren Qualität und Attrak- tivität erhöht. Die inhaltliche Forschung dient zudem individuellen Qualifikationszielen und der För- derung wissenschaftlicher Karrieren. Schließlich eröffnen unsere inhaltlichen Arbeiten neue Koope- rationspotenziale mit externen Wissenschaftler*innen und Forschungsinstitutionen.