töggl lernt rätoromanisches Idiom Surmiran
Was braucht es mindestens damit töggl eine neue Sprache lernt?
Lesen Sie hier am Beispiel eines rätoromanischen Idioms: Surmiran.
Braucht es Printmedien in der Sprache?
Nicht zwingend – aber es hilft. In Surmiran erscheint die regionale Wochenzeitung La Pagina da Surmeir https://lnkd.in/ePNjNytt
Braucht es eine minimale Anzahl an Sprechern?
Das absolute minimum ist ein Sprecher, aber dann bräuchten wir von diesem Sprecher sehr viel Audiomaterial um das System zu trainieren. Für Surmiran haben wir etwa 25 Stunden Trainingsmaterial. Das sind sehr viele Daten, wenn man bedenkt, dass Surmiran von etwa 2200 Menschen gesprochen wird. Derart exklusive Spracherkennungssysteme können wir nur dank der Zusammenarbeit mit RTR Radiotelevisiun Svizra Rumantscha entwickeln.
Braucht es eine minimale Anzahl an Audiostunden?
Jein – wir sind darauf spezialisiert mit nur 25 Stunden bereits gute Systeme zu trainieren. Das ist aber eine äusserst kleine Datenmenge für die künstliche Intelligenz. Normalerweise werden Spracherkennungssysteme mit hunderten oder tausenden Stunden Audiomaterial trainiert. Mehr wäre also besser – aber auch bedeutend aufwändiger.
Interessiert wie gut unserer künstliche Intelligenz mit derart wenig Trainingsmaterial funktioniert?
Testen Sie es selbst: töggl.ch
Aber Vorsicht: um zu urteilen wie gut das System funktioniert, muss man Surmeirisch verstehen!