Die kidsTALC Datenbank wird die Nachnutzung der im Rahmen der Entwicklung der verschiedenen TALC Tools und von Lab internen TALC Projekten erhobenen ein- und mehrsprachigen kindlichen Sprachdaten ermöglichen. Geplant ist eine Einlagerung in Form von Transkripten und Audiodateien. Der Zugang zur Datenbank soll interdisziplinär, sowohl für informationstechnische als auch für sprachwissenschaftliche Disziplinen möglich sein.
Die aktuelle Zusammensetzung der Datenbank:
Anzahl | Uploaded | Alter | Sprache der Kinder | Sprache im Audio | Sprachstatus | Type | Jahr |
90 | 47 | 3;6–10;11 | einsprachig Deutsch | Deutsch | typisch entwickelt | Spontansprache | 2022 |
40 | 0 | 3;0–7;0 | einsprachig Deutsch | Deutsch | mit Aussprachestörung | Spontansprache | 2025 (geplant) |
100 | 0 | 8;0–10;0 | einsprachig Deutsch & mehrsprachig | Deutsch | typisch entwickelt | gelesene Sprache | 2024 (geplant) |
Die kidsTALC Datenbank befindet sich im kontinuierlichen Aufbau. Der erste Teildatensatz wurde 2022 veröffentlicht.
Der Zugang kann auf der folgenden Seite projektspezifisch per Mail beantragt werden: www.tnt.uni-hannover.de/en/project/talc/
Publikationen
2023
Ehlert, H., Beaulac, E., Wallbaum, M., Gebauer, C., Rumberg, L., Ostermann, J., & Lüdtke, U. (2023). Collecting and Annotating Natural Child Speech Data - Challenges and Interdisciplinary Perspectives. Elektronische Sprachsignalverarbeitung, Tagungsband der 34. Konferenz, München, März 2023, 72-78.
2022
Rumberg, L., Gebauer, C., Ehlert, H., Wallbaum, M., Bornholt, L., Ostermann, J. & Lüdtke, U. (2022). kidsTALC: A Corpus of 3- to 11-year-old German Children’s Connected Natural Speech. Proceedings INTERSPEECH -- 23th Annual Conference of the International Speech Communication Association, September 2022, 5160-5164.