
Chorleitung und KI
Das Thema “Künstliche Intelligenz” geht auch an uns Chorleitenden nicht spurlos vorüber, kürzlich gab es einen interessanten Post in einer ChorleiterInnen-Gruppe auf Facebook, dabei ging es um KI-basierten Gesang und seine Einsatzmöglichkeiten für unsere Branche. Die angeregte Diskussion gab mir noch ein paar Impulse, ich war schon länger auf der Suche nach einer Software, die meine Arrangements zum Klingen bringt. Aber warum eigentlich? Ich könnte es doch selbst singen und aufnehmen, oder geeignete SängerInnen meiner Chöre fragen, ob sie mir behilflich sein können. Die Wahrheit ist aber, dass dieser Prozess recht aufwendig ist, zumindest dann, wenn das Ergebnis professionellen Ansprüchen gerecht werden soll.
Aber gehen wir einen Schritt zurück, was ist denn mein Use Case, für was brauche ich KI-generierten Gesang?
Arrangements
Da ist zunächst die Möglichkeit, meine Arrangements zum Klingen zu bringen, so kann ich meinen Chören eine Vorstellung davon geben, wie sich das Stück am Ende anhören wird. Da ich seit einiger Zeit auch Arrangements verkaufe, kann ich diese damit viel besser vermarkten, schließlich muss man es potenziellen Käufern so einfach wie möglich machen.
TeachMe-Files
Für mich ist es auch hilfreich, wenn meine SängerInnen ihre Stimmen zu Hause üben können. Bisher habe ich dazu einfach die Stimmen des Arrangements mit einem Klaviersound direkt aus dem Notensatz-Programm exportiert, das funktioniert zwar, vermittelt aber nur Tonhöhe und Rhythmus. Ich erhoffe mir, dass es einfach mehr Spaß macht, wenn die Stimme richtig vorgesungen wird. Als Highlight habe ich noch einen Player gebaut, mit dem man verschiedene Konstellationen testen kann, z.B. Stimme(n) stummschalten, Lautstärke und Panorama anpassen, mitten im Stück beginnen.
Software
Ich habe intensiv recherchiert und mich letztlich für das Programm Synthesizer V von Dreamtonics entschieden, die Qualität der Stimmen und die Tatsache, dass man das Programm kaufen kann und kein Abo abschließen muss, haben mich überzeugt.
Kritik
Die Ergebnisse sind beeindruckend, obwohl ich noch längst nicht alle Möglichkeiten des Programms voll ausgeschöpft habe. Trotzdem gibt es Einschränkungen, die Aussprache ist hin und wieder nicht ganz nach meinem Geschmack, beim “dn” im Bass musste ich ein wenig tricksen, es klingt aber immer noch nicht ganz so wie ich es gerne hätte. Leider “spricht” das Programm momentan nur englisch, chinesisch und japanisch. Spanisch ist in Planung, ob es deutsch lernen wird, weiß ich noch nicht.
Fazit
Ich bin bis hierhin recht zufrieden, die Ergebnisse meiner Experimente mit der KI könnt Ihr auf der Seite “Kings and Queens” sehen und hören.
Habt Ihr Fragen oder Anmerkungen? Ich freue mich über eure Kommentare!
Nachtrag
Martins Kommentar hat mich dazu angeregt ein kurzes Beispiel in deutsch zu veröffentlichen. Ich bin durch eine Google Suche über diesen Beitrag bei Reddit gestolpert, darin findet Ihr den Link zu einem deutschen Wörterbuch. Dieses habe ich importiert und dann dieses kleine Beispiel generiert, aus meiner Sicht ist es aber nicht zu gebrauchen.
-
Ich bin Ich, Rosenstolz
Kommentare
Hi Martin,
du kannst Midi Dateien (inklusive Text) importieren, so gehe ich auch vor. Den Text musst du aber nachbearbeiten, das Programm erwartet eine andere als die üblicherweise notierte Aufteilung. Zum Thema Sprache: Ich habe zwar ein deutsches Wörterbuch gefunden, die Ergebnisse sind aber - aus meiner Sicht - nicht brauchbar, ich erweitere den Artikel mal mit einem kleinen Hörbeispiel, dann weißt du, was ich meine. Das Programm erzeugt Wav-Dateien, du kannst sie vorher abmischen und wahlweise auch einzeln exportieren.
Ah, noch eine Ergänzung. Gibt es beim Dreamtonic Synthesizer auch die Möglichkeit des midi- bzw. mp3-Exports? Kann man zuvor die Stimmen abmischen, sodass man auch ohne die Möglichkeiten eines zusätzlichen Players bestimmte Chorstimmen lauter hervorheben kann?
Hallo Uli. Ich bin ja erstmal geflasht dass es so etwas mittlerweile gibt. Das es mir für ein Selber-Einsingen sowohl an notwendiger Technik als vielleicht auch ein bißchen den stimmlichen Möglichkeiten mangelt, bastele ich bislang immer in einer DAW Software bessere Sounds als was die Notationsprogramme per se hergeben. Es geht, ist aber eben auch sehr zeitaufwändig, und weiterhin fehlt der Eindruck echten Gesangs. Nun würde mich interessieren, ob man beim Dreamtonic Synthesizer tatsächlich komplette Sheet Music einfach importieren kann (bzw. Midi-Exporte) und daraus bereits in Kürze etwas befriedigendes entsteht. Die Sache mit den begrenzten (Aus-)Sprachfähigkeiten habe ich dabei soweit verstanden. Kann man sich deutsch antun? Hilft es den Chorsänger*innen trotzdem, weil echt wirkender Gesang zu hören ist? BG, Martin
Liebe Sarah,
der Player ist frei unter https://audiomixer.io/ verfügbar, der Entwickler erbittet eine Spende, die ich gerne geleistet habe. Allerdings sind schon einige Kenntnisse im Bereich der Webseitenerstellung nötig, da ich das allerdings auch beruflich mache, war es für mich kein Problem. Ich überlege, ob ich den Service für das Hosting des Players auch für andere anbiete, habe mir aber noch keine Gedanken darüber gemacht, was das kosten muss.
Lieber Ulrich!
Zunächst einmal Chapeau für die geleistete Arbeit. Ich habe mich mit dem Thema auch schon vor gut einem Jahr beschäftigt, bin bislang aber noch am scheinbar umständlichen Workflow gescheitert. Aber ich habe es mir offensichtlich auch deutlich schwerer gemacht als nötig, wie ich deinen Ausführungen gerade entnehmen konnte.
Was mich jedoch brennend interessieren würde, ist 1.. Wie der Player funktioniert, den die Chormitglieder zum üben verwenden können - Ist das eine App oder ist das ganze Browser gestützt? und 2. Vertreibst du eine Lizenz dafür? Es wäre natürlich sehr praktisch, dieses wunderbare Tool auch verwenden zu können.
Musikalische Grüße
Sarah
Hallo Hans,
das ist noch schwer zusagen, ich habe sehr viel experimentiert und musste einiges erst lernen, ich vermute mal, dass ich durch Optimierung meines Workflows auf 1,5 bis 2 Stunden komme.
Hallo Ulrich, ich hatte das dreamtonics-Tool auch schon entdeckt, und die Möglichkeit, Teachme-Files mit Text zu generieren, reizt mit sehr und wurde in meinem Chor auch schon mehrfach angefragt. (Immer dann, wenn ein Arrangeur, dessen Sätze wir singen, eingesungene Files mitliefert ;-)). Ich habe bislang nur die Trail-Version von Synthesizer V heruntergeladen, und mit den mitgelieferten Stimm-DB ziemlich unbefriedigende Ergebnisse erzielt, was die Text-Verständlichkeit angeht. Für einen "ernsthaften" Einsatz hatte ich an Hayden und Nathalie als Stimm-DB gedacht. Frage an Dich: wie aufwändig ist es denn tatsächlich, ein Ergebnis wie bei Deinem "Kings and Queens" zu erzielen. - Reicht er hier, das MIDI zu importieren und die Stimmen zu verteilen? Oder ist beim Text viel Nacharbeit nötig? - Wenn ich Stunden investieren muss, um das "rund" zu bekommen, bin ich mit Einsingen vielleicht doch schneller? Ich scheue noch die aktuell rund 200€, um Synthesizer V anzuschaffen. Nach den Ergebnissen mit der Trial-Version um so mehr, daher würde mich Deine Erfahrung sehr interessieren. BG, Hans