Wie helft ihr Medienhäusern mit eurer Text-to-Speech-Lösung in die Zukunft?
Wie helft ihr Medienhäusern mit eurer Text-to-Speech-Lösung in die Zukunft?
Text-to-Speech-Verfahren und synthetische Stimmen gibt es schon länger, in den letzten Jahren haben sie sich kontinuierlich verbessert. Aber wie können auch kleinere Medienhäuser mit begrenzten Ressourcen von der Technologie profitieren? Das haben sich Maximilian Knop und Marcel Tuljus von Konsole Labs gefragt – und mit Content Creation Intelligence in der MIZ-Innovationsförderung eine Lösung entwickelt, mit der Redaktionen ganz einfach automatisierten Audio-Content erstellen können – vom Wetterbericht über Breaking News bis zum personalisierten Digitalformat.
Wie die Audiobranche von ihrem Tool profitieren kann, wie der Einsatz von CCI in der Praxis aussieht und welche Rolle der Austausch mit Medienhäusern für sie bei der Produktentwicklung spielt, hat uns das Team im Interview verraten.
Lieber Marcel, lieber Max, warum beschäftigt ihr euch damit, neue Lösungen explizit für Audio zu entwickeln? Was fehlt der Branche?
Marcel Tuljus / Maximilian Knop: Audio liegt in der DNA unseres Unternehmens. Wir sind teils selbst langjährige Radiomacher und der Fokus lag schon seit Gründung auf Broadcasting. Die Audiobranche als Gesamtes boomt. Aber nicht jede Teilbranche profitiert gleichermaßen. Die, die sich im Digitalen gut aufgestellt haben und auf allen Kanälen perfekt zu konsumieren sind, profitieren am meisten. Einige Andere werden abgehängt. Gerade die traditionellen Mechanismen von Radio werden nicht mehr so funktionieren. Die Hörer:innen erwarten sich hier mehr als nur Empfangbarkeit über eine Frequenz.
„Die Audiobranche als Gesamtes boomt. Aber nicht jede Teilbranche profitiert gleichermaßen. Gerade die traditionellen Mechanismen von Radio werden nicht mehr so funktionieren.“
Könnt ihr anhand eines Beispiels erklären, was CCI konkret kann und wie Medienhäuser das Tool in der Praxis einsetzen können?
MT/MK: Wer schon mal nach 19 oder 20 Uhr eine kleinere oder mittelgroße Radioredaktion betreten hat, kann sich sehr schnell vorstellen, was hier synthetische Stimmen leisten können. Die Redaktion ist leer, aber draußen dreht sich die Welt weiter. Alles wofür Radio steht - Aktualität, Schnelligkeit und Flexibilität im Programm - ist plötzlich hinfällig. Und da können künstliche Stimmen helfen, bestimmte Inhalte auch in diesen Stunden zu senden.
Aber auch Verlage oder Zeitungen können davon profitieren, wenn sie ihre Artikel hörbar machen. Ganz nebenbei sind Audios natürlich auch vermarktbar. Unbedingt erwähnen sollten wir noch das Thema Barrierefreiheit, wo Audio einen großen Teil leisten kann. Es gibt also eher wenig Gründe, die Chance nicht zu nutzen.
„Wer schon mal nach 19 oder 20 Uhr eine kleinere oder mittelgroße Radioredaktion betreten hat, kann sich sehr schnell vorstellen, was hier synthetische Stimmen leisten können.“
Wie kommen synthetische Stimmen bei den Hörer:innen an? Gibt es bestimmte Formate, für die sich ihr Einsatz besonders anbietet?
MT/MK: Bei zig Millionen von Haushalten steht ein Sprachassistent zuhause. Siri und Google Assistant sind absoluter Alltag. Und auch diese lesen uns bereits viele Inhalte vor. Die Skepsis der Nutzer:innen ist deutlich niedriger als viele denken. Die größere Skepsis herrscht da eher bei den Medien, speziell in der Radiobranche. Klar ist, ein Radiomoderator mit all seinen Ecken und Kanten als Personality ist nicht zu ersetzen. Das ist auch kein erstrebenswertes Ziel.
Aber Informationen, Nachrichtentexte, Wetter, Verkehrsservice, Warnmeldungen und vieles mehr lassen sich schon sehr gut mit künstlichen Stimmen abbilden - ob für unmoderierte Strecken beim Radio oder um für mehr Personalisierung in digitalen Angeboten sorgen.
Welche Rolle spielt für euch der Austausch mit Redaktionen vor Ort oder auch mit dem journalistischen Nachwuchs?
MT/MK: Wir sind sehr nah dran an den Häusern und im ständigen Austausch. Denn, wenn wir die Probleme und Needs der Redaktionen und Digitalabteilungen nicht erkennen, können wir nicht die richtigen Lösungen dafür konzipieren und umsetzen. Wir sehen uns als Lösungsfinder und Enabler. Daher nutzen wir jede Möglichkeit des direkten Austausches, der Teilnahme an Arbeitsgruppen oder auch von Kooperationen mit anderen Tech-Dienstleistern.
Auch sind wir seit kurzem Partner der electronic media school (ems) in Potsdam-Babelsberg. Wir wollen den Volontär:innen regelmäßig Einblick in die Audiowelt geben und mit den kreativen, jungen Talenten dort ein wenig an der Zukunft gestalten.
„Klar ist, ein Radiomoderator ist als Personality nicht zu ersetzen. Das ist auch kein erstrebenswertes Ziel. Aber Nachrichtentexte, Wetter, Verkehrsservice und vieles mehr lassen sich schon sehr gut mit künstlichen Stimmen abbilden."
In der MIZ-Förderung starten mit dem Media Founders Program bald junge Start-ups bzw. Teams, die noch vor der Gründung stehen. Was sind eure drei größten Learnings, die ihr ihnen mit auf den Weg geben könnt?
MT/MK: Zum einen sollte man seine Idee immer und zu jeder Zeit auf den Prüfstand stellen. Die anfängliche Euphorie kann einen blind werden lassen.
Das bringt uns zum zweiten Punkt: Bleibt immer im engen Austausch mit potenziellen Nutzer:innen oder Kund:innen. Denn nur so erfährt man, was wirklich gebraucht wird und man entwickelt nicht am optimalen Ergebnis vorbei.
Und zu guter Letzt: Bringt Geduld und Ausdauer mit. Es gibt Phasen, in denen es nur sehr zäh vorangeht. Aber plötzlich kommt dann wieder Schwung rein.
CCI, in 90 Sekunden erklärt – Abschlussvideo des Teams
>>> Mehr über CCI auf der Website von Konsole Labs
>>> Kontakt zum Projektteam: Marcel Tuljus, tuljus@konsole-labs.com | Maximilian Knop, knop@konsole-labs.com
Ansprechperson
Marion Franke
FörderungMarion leitet den Bereich Innovationsförderung. Sie ist Ansprechpartnerin für alle Fragen zu den Förderbedingungen, der Antragstellung und verantwortlich für die Betreuung der Projekte.