Forschung
In der Human-Centered Data Science konzentrieren wir uns auf die Entwicklung von Modellen, die der Vielfalt der Perspektiven und Erfahrungen der Menschen, die von ihnen betroffen sind, entsprechen. Während die Data Science traditionell mit Zahlen arbeitet, kommunizieren Menschen mit Sprache. Die Idee, symbolische Spracheingaben in quantitativen Modellen abzubilden, entwickelte sich von einem akademischen Nischeninteresse zu einer allgegenwärtigen Technologie, die weltweit eingesetzt wird. Wir verlassen uns auf Sprachtechnologie, um nach Informationen zu suchen, über Sprachgrenzen hinweg zu kommunizieren und unseren Schreibstil zu verfeinern. Die neuesten Modelle können uns beim Brainstorming unterstützen oder sogar Entwürfe ganzer Dokumente verfassen. Die Integration ihrer Nutzung in unsere tägliche Routine wird sich bald so normal anfühlen wie die Verwendung eines Taschenrechners. Diese Entwicklungen werden durch große Sprachmodelle vorangetrieben, die Milliarden von Parametern unter Verwendung von Terabytes an Trainingsdaten optimieren. Die enormen Rechenressourcen, die für ihre Entwicklung erforderlich sind, können derzeit nur von einer Handvoll marktführender Unternehmen aufgebracht werden, deren Entwicklungsziele von wirtschaftlichen Zielen bestimmt werden. Infolgedessen wird bei der Entwicklung von Sprachmodellen derzeit die englische Sprache und ein Standardpublikum bevorzugt, was ein Ungleichgewicht beim Zugang zu Informationen für bereits marginalisierte Benutzergruppen schafft. In unserem Team arbeiten wir an der Erforschung der Verarbeitung natürlicher Sprache mit einer auf den Menschen ausgerichteten Perspektive.
Projekte
Unsere Projekte konzentrieren sich auf sprachübergreifende und kognitiv inspirierte Forschungsfragen, die wir mit computergestützten Modellen untersuchen.
- Interpretierbarkeit des Transfers in Multilingual Models
- Kognitive Plausibilität in NLP
- BabyLM - kognitiv inspiriertes Repräsentationslernen für effizientere Sprachmodelle
- Robustheit von Interpretierbarkeitsmethoden
- NLP im Bildungskontext