Innerhalb des Moduls "Praktikum: Statistische Modellierung" wurde im Sommersemester 2024 neben vielen spannenden Projekten mit Kooperationspartner*innen von unterschiedlichen Einrichtungen ein Projekt zusammen mit der Stadt Göttingen bearbeitet. Dieses ist nun auch auf der Webseite der Stadt Göttingen zu finden. Das entwickelte Dashboard ist ebenfalls einsehbar.

"Als Projektpartner haben wir im Sommersemester 2024 ein Studierendenprojekt der Uni Göttingen begleitet. Ziel war es, dass die Studenten ein Dashboard entwickeln, in dem verschiedene Arten von Daten dargestellt werden. Dazu haben wir Daten aus verschiedenen Bereichen der Stadtverwaltung bereitgestellt und das Projekt als Projektpartner mit Ihnen zusammen entwickelt. Es wurden unterschiedliche Prioritäten und Vorstellungen diskutiert, sodass viele Ideen zur Visualisierung der Daten entstanden sind. Neben den bereitgestellten Daten aus den Bereichen Pegelstand, Fahrradverkehr und Parkraumnutzung, wurde über eine API noch Wetterdaten vom DWD eingebunden und dargestellt.

Ziel des Uniprojektes war es, die Daten so zu visualisieren, dass den Nutzenden einen einfachen, niederschwelligen Zugang zu den Daten zu geben und so Transparenz zu schaffen. Das Seminar wurde vom Lehrstuhl für Raumbezogene Datenanalyse und Statistische Lernverfahren angeboten und auch von der Seite aus statistisch betreut. Diese Zusammenarbeit hat auf der einen Seite sehr viel Spaß in den Diskussionen gebracht und zum anderen auch neue und interessante Inputs geliefert sowie gezeigt was für andere Personen und Institutionen wichtig ist."

StudiDashboard
Der Lehrstuhl darf sich über eine weitere Auszeichnung freuen! Im Rahmen des NFDI4DataScience Summer School Days an der Leuphana Universität Lüneburg stellte John Brüne seine Projektarbeit und Teile der Masterarbeit als Poster vor.

Dabei wurden mittels API von abgeordnetenwatch.de Daten gezogen, aufbereitet und mithilfe statistischer Verfahren deskriptiv und multivariat ausgewertet. So sind beispielsweise Gruppen von Abgeordneten basierend auf ihrem Abstimmungsverhalten identifiziert worden. Die Ergebnisse sind in einer interaktiven App benutzerfreundlich visualisiert und helfen wissenschaftliche Erkenntnisse aus Daten einer breiten Öffentlichkeit zu kommunizieren.

Die Darstellung und seine Vorstellung überzeugte die Teilnehmenden, welche votierten und John mit dem „Best Poster Prize“ auszeichneten. Das preisgekrönte Poster ist im Flur ausgestellt und von der zugrundeliegenden App kann man sich hier selbst überzeugen. Herzlichen Glückwunsch, John!

Drei Doktorand*innen unseres Lehrstuhls haben auf der CompStat Konferenz in Gießen ihre Forschungsfortschritte präsentiert. Dabei bot die CompStat eine Plattform, die Forschung einem internationalen Publikum vorzustellen und Anregungen zu erhalten. Quentin Seifert präsentierte in der Session "Functional data analysis", Lars Knieper und Sophie Potts in der Session zu "Applied statistics and data analysis". Die Kurzzusammenfassungen der Präsentationen können hier eingesehen werden. compstat24
Ende Juli diesen Jahres fand die Konferenz "Statistical Computing" 2024 in Reisensburg (Günzburg) statt. Auch wir waren mit einer kleinen Gruppe und eigenen Vorträgen vertreten! Insbesondere konnten zwei Anna von Plessen und Marisa Lange ihren Fortschritt der Masterarbeiten vorstellen und so bereits erste Konferenzluft schnuppern.

Alexandra Daub hat einen Ansatz vorgestellt, wie Gradientenboostingverfahren für GAMLSS-Modelle durch adaptive Schrittlängen verbessert werden können. Ihre Methode, die auf der Idee basiert, ein Gleichgewicht zwischen den einzelnen Base-Learnern herzustellen, zeigt sowohl in simulierten als auch in realen Datensätzen vielversprechende Ergebnisse. Ein preprint wurde Anfang des Jahres veröffentlicht.

Anna von Plessen präsentierte ihre Arbeit, die sich mit Magnetoenzephalographie (MEG)-Daten von Gehirnwellen beschäftigt. Sie entwickelt ein Konzept zur verbesserten Verarbeitung dieser hochdimensionalen Daten, wobei sie Methoden wie Gradient Boosting und funktionale Regression einsetzt. Im Rahmen ihres Vortrags zeigte sie zudem eine von ihr entwickelte R Shiny Applikation zur Visualisierung von MEG-Daten.

Colin Griesbach hielt einen Vortrag zu modellbasierten Gradientenboostingverfahren für GAMLSS-Modelle. In diesem Kontext entwickelte er eine Methode zur Verbesserung der Schätzung von Random Effects. In seinem Vortrag präsentierte er die Ergebnisse dieser Methode anhand von Daten von Mukoviszidosepatient*innen.

Marisa Lange arbeitet ebenfalls mit Daten von Mukoviszidosepatient*innen. In ihrem Vortrag gab sie einen detaillierten Einblick in die Struktur und Besonderheiten der Daten und präsentierte Modellierungsansätze mithilfe von Gradient Boosting. Ein besonderer Fokus ihrer Arbeit liegt dabei auf der Verarbeitung der räumlichen Informationen in den Daten. reisensburg24

Dieses Jahr fand der International Workshop on Statistical Modelling (IWSM) in Durham, UK statt. Auch dieses Jahr haben wir aktiv an der jährlichen Konferenz teilgenommen. Dabei durfte sogar eine Auszeichnung bejubelt werden.

Dr. Colin Griesbach eröffnete die Konferenz mit seinem Vortrag zu modellbasierten Gradientenboostingverfahren für GAMLSS Modelle, welche auf Daten von Mukoviszidosepatient*innen angewendet wurden. Der Konferenzartikel ist im Sammelband der Konferenz erschienen.

Lars Knieper hielt einen Vortrag zum Phänomen von spatial confounding welches im modellbasierten Gradientenboosting mithilfe des Lösungsvorschlags von spatial+ behoben werden kann. Seinen Ansatz illustrierte er anhand von AirBnB-Daten. Der dazugehörige Kurzartikel ist bei Springer erschienen.

Quentin Seiferts Beitrag mit dem Titel „Function-on-scalar regression via first-order gradient-based optimization” verbindet die klassische Statistik mit Elementen aus Neuronalen Netzwerken und ermöglichte es, eine große Menge von Parkplatzdaten während der Coronapandemie zu analysieren und Muster im Einkaufsverhalten zu identifizieren.

Auch Dr. Joaquin Cavieres präsentierte einen Teil seiner Forschung, in welcher approximierte Gaussian Random Fields mit unterschiedlichen Parametrisierungen verglichen wurden. Der Konferenzartikel ist ebenfalls publiziert.

Sophie Potts stellte ihre Arbeit zur Anwendung von Joint Models für longitudinale und Ereigniszeitdaten in den Sozialwissenschaften als Poster vor. Dabei wurde die Methode mit Ursprung in der Biostatistik auf ein Beispiel aus der Familiensoziologie übertragen. Sophies neuartige Anwendung und nahbare Darstellung wurde dafür mit dem „Best Student Poster Award“ ausgezeichnet. Das ausgezeichnete Poster kann nun im Flur unserer Büros bestaunt werden.

Nach fast zwei Jahren Arbeit, die durch das MWK gefördert wurde, haben wir eine ordentliche Sammlung an Shinys, die helfen sollen, verschiedene statistische Konzepte zu erklären. Sie sind auf dieser Seite verfügbar. Die meisten sind direkt durch bestimmte Vorlesungen entstanden, sollten aber auch einzeln als Hilfe zum Selbstlernen funktionieren. Viel Spaß beim Spielen!