WissensWert/49 - Automatisch gesprochene Wikipedia

From Meta, a Wikimedia project coordination wiki

49 - Automatisch gesprochene Wikipedia

Zur Idee[edit]

Kurzbeschreibung deiner Idee und deren Beitrag zur Förderung Freien Wissens[edit]

Die Wikipedia in Form von ständig aktueller Audio-Dateien anzubieten, ist nur mit dem Einsatz einer synthetischen Stimme (Text-to-Speech, TTS) möglich. Das System soll im ersten Schritt eine vorgelesene Wikipedia mit allen aktuellen exzellenten und lesenswerten Artikel anbieten. Läuft das System damit stabil, soll es auf alle Artikel anwendbar sein. Anders als bei vorhandenen System wie Pediaphon wird die Sprachqualität deutlich besser sein.

Welches Ziel soll mit deiner Idee erreicht werden?[edit]

Die Inhalte der deutschsprachigen Wikipedia können so immer aktuell und größtenteils ohne Verzögerung beim Download als Audio-Dateien zur Verfügung gestellt und damit eine größere Zielgruppe (siehe unten) erreicht wird.

Wie lässt sich messen, ob dieses Ziel erreicht wird?[edit]

Alle exzellenten und lesenswerten und Artikel stehen als immer aktueller Audio-Download zur Verfügung. Dabei bleibt die Sprachqualität zwar etwas hinter einem professionellen Sprecher zurück, ist jedoch deutlich besser als bei bisherigen Systemen. Anders als bei professionellen Sprechern, entspricht der Inhalt der Audio-Dateien immer dem aktuellen Stand der Wikipedia. Durch Feedback der Community wird die Aussprache problematischer Wörter nach und nach korrigiert.

Was ist die Zielgruppe deiner Idee?[edit]

-Nutzer, die Informationen unterwegs auf ihrem mobilen Audio-Player hören möchten
-leicht sehbehinderte Nutzer, die keine professionelle Ausstattung haben, mit der sie selber Texte automatisch vorlesen lassen können
-Nutzer, die noch nicht lesen können oder nur langsam lesen können (Analphabeten, Kinder)

Wie erreichst du diese Zielgruppe?[edit]

Wegen der geringen Bekanntheit von 45info sind wir dabei auf eine Integration in die Wikipedia angewiesen.

Beschreibe, welche Tools, Technologien oder Hilfsmittel du für die Umsetzung benötigst[edit]

Das System wird eine in Java entwickelte Software, die via API aktuelle Texte aus der Wikipedia lädt, in Audio-Dateien konvertiert und für zukünftige Anfragen zwischenspeichert. Texte werden nur dann neu konvertiert, wenn sie sich seit der letzten Konvertierung geändert haben.

Die Qualität der Stimme ist dabei für die Akzeptanz durch die Nutzer sehr wichtig. Open-Source-Systeme wie MBROLA reichen derzeit nicht an die Qualität kommerzieller Systeme heran und unsere Resourcen reichen nicht aus, ein freies TTS-System in ausreichendem Maße zu verbessern. Deshalb findet die eigentliche Konvertierung mit einem kommerziellen TTS-System der Firma SpeechConcept statt. Das System selbst ist so ausgelegt, dass die TTS-Komponente durch eine andere, auch freie, ersetzt werden kann. Die entstehenden Audio-Daten sind natürlich in jedem Fall frei.

Das System sollte auf einem leistungsstarken Rechner (in Bezug auf CPU und Plattenplatz) der Wikimedia laufen, da unsere Hardware-Kapazitäten beschränkt sind.

Wird deine Idee weiterleben, nachdem die Förderphase beendet ist? Wie nachhaltig ist dein Projekt?[edit]

Wir möchten den Betrieb auch langfristig sicherstellen. Wir haben umfangreiche Erfahrungen im langfristigen Betrieb von Open-Source/Open-Content-Projekten wie OpenThesaurus (online seit 2003) und LanguageTool (online seit 2006 in seiner jetzigen Form). Dadurch können wir das System so entwickeln, dass es auch auf Dauer mit sehr geringem personellen Aufwand betrieben werden kann.

Lässt sich deine Idee auch von anderen Zielgruppen, Orten, Projekten nutzen? Wenn ja, wie und von wem?[edit]

Da die generierten Audio-Daten unter einer freien Lizenz stehen, sind u.a. folgende Nutzungsarten denkbar:

-Museen nutzen die Audio-Dateien oder Teile davon für ihren Audio-Guide
-Städte nutzen die Audio-Dateien oder Teile davon zur Erweiterung vorhandener Audio-Stadtführungen
-Autoren von Smartphone-Apps integrieren die Audio-Dateien in ihre App, z.B. um Informationen über die nächstgelegene Sehenswürdigkeit vorlesen zu lassen

Zur Person[edit]

Name[edit]

Daniel Naber

Website des Einreichers oder Projektes[edit]

Profil des Einreichers[edit]

Ich arbeite als Software-Entwickler in Berlin. Nebenbei arbeite ich für 45info und an meinen privaten Open-Source-Projekten OpenThesaurus.de und languagetool.org.