GESIS - für eine forschungsbasierte Infrastruktur
Forschungsoutput von GESIS
Titel | Start | Ende | Förderer |
---|---|---|---|
Kompetenzzentrum Datenqualität in den Sozialwissenschaften
(KODAQS)
|
2023-11-15 | 2026-11-14 | Bund |
PIAAC-C2 - The Programme for the International Assessment of Adult Competencies (Cycle 2)
(PIAAC-C2)
|
2018-04-06 | 2024-12-31 | Sonstige Drittmittel |
Nationales Projektmanagement für die Durchführung des zweiten Zyklus der internationales Vergleichsstudie PIAAC
(NPM PIAAC2)
|
2018-01-01 | 2024-12-31 | Bund |
- Sen, Indira, Dennis Assenmacher, Mattia Samory, Isabelle Augenstein, Wil van der Aalst, and Claudia Wagner. 2023. "People Make Better Edits: Measuring the Efficacy of LLM-Generated Counterfactually Augmented Data for Harmful Language Detection." 2023. In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing, EMNLP, edited by Houda Bouamor, Juan Pino, and Kalika Bali, 10480-10504. Singapore: Association for Computational Linguistics.
- Dahou, Abdelhalim Hafedh, Mohamed Amine Cheragui, and Ahmed Abdelali. 2023. "Performance Analysis of Arabic Pre-Trained Models on Named Entity Recognition Task." In Proceedings of the 14th International Conference on Recent Advances in Natural Language Processing, edited by Ruslan Mitkov, and Galia Angelova, 458–467. Shoumen: INCOMA Ltd.. https://aclanthology.org/2023.ranlp-1.51.pdf.
- Diera, Andor, Abdelhalim Hafedh Dahou, Lukas Galke, Fabian Karl, Florian Sihler, and Ansgar Scherp. 2023. GenCodeSearchNet: A Benchmark Test Suite for Evaluating Generalization in Programming Language Understanding. Proceedings of the 1st GenBench Workshop on (Benchmarking) Generalisation in NLP. Association for Computational Linguistics (ACL). doi: https://doi.org/10.18653/v1/2023.genbench-1.2.
- Dahou, Abdelhalim Hafedh, and Brigitte Mathiak. 2023. "Subject Classification of Software Repository." In Proceedings of the 15th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management - KDIR, 1, 30-38. SciTePress. doi: https://doi.org/10.5220/0012159600003598.
- Lietz, Haiko, Mohsen Jadidi, Daniel Kostic, Milena Tsvetkova, and Claudia Wagner. 2024. "Individual and gender inequality in computer science: A career study of cohorts from 1970 to 2000." Quantitative Science Studies online first 1-24. doi: https://doi.org/10.1162/qss_a_00283.
Ein wesentliches Merkmal von GESIS ist, dass das Institut insbesondere bei den Daten, für die es auch die Erhebung verantwortet, sehr hohe Ansprüche und Standards an die Qualität der bereitge- stellten Daten anlegt. Daher ist es für GESIS zentral, eigene Beiträge zur Untersuchung und Verbes- serung von Aspekten der Datenqualität zu leisten. Die Forschung in den GESIS-Forschungsbereichen trägt deshalb direkt zum Schwerpunkt Datenqualität bei. Dies betrifft sowohl Umfragedaten als auch digitale Verhaltensdaten und relevante Metadaten.
Datenqualität umfasst Aspekte der (a) Kor- rektheit und Repräsentativität von Daten und (b) Nutzbarkeit und FAIRness von Daten. Beispiele für (a) sind die Vollständigkeit, Korrektheit, Provenienz der Repräsentativität von Daten, während (b) Aspekte wie Findbarkeit, Qualität der Dokumentation, Aufbereitung oder die Interoperabilität von Daten und Metadaten berücksichtigt. Damit wird eine wichtige Voraussetzung dafür erfüllt, dass die Bearbeitung inhaltlicher Fragestellungen (Substantive Research) auf Basis dieser Daten zu validen Ergebnissen führt.