Egal ob Musik, Film oder Game Audio – wer es mit Tonproduktionen zu tun hat, hat es früher oder später auch mit Stems zu tun. Sie bilden eine elementare Grundlage für die Archivierung, den Austausch und die Bereitstellung von Tonmischungen und sind mittlerweile in den meisten Lieferspezifikationen von Labels und Produktionsfirmen enthalten. Nicht selten führt die Ausspielung der gewünschten Stems bei unerfahreneren Engineers aber zu nervigen Extrarunden (und unbezahlten Überstunden). Das lässt sich vermeiden!
Dieser Beitrag ist für alle gedacht, die ihren Audio-Workflow im Hinblick auf Stems professionalisieren wollen.
Warum überhaupt Stems?
Stems sind Teilmischungen, die den ursprünglichen Originalmix ergeben, wenn man sie wieder summiert. Ziel der Sache ist, im nächsten Arbeitsschritt gezieltere Eingriffe und alternative Versionen zu ermöglichen, die auf der Mix-Summe nicht mehr möglich wären. Der Mix soll dabei aber bestenfalls vollständig reproduzierbar bleiben.
Auch wenn die Begriffe oft fälschlicherweise gleichbedeutend verwendet werden, sind Stems keineswegs mit “Multitracks” (Einzelspuren) zu verwechseln! Multitracks sind sämtliche Einzelsignale eines Projekts, also das gesamte Rohmaterial, aus dem ein Mix aufgebaut wird. Je nach Projekt sind das gut und gerne mehrere hundert Spuren! Bei Stems handelt es sich dagegen um bereits zusammengefasste Signalgruppen und damit auch um deutlich weniger Tracks.
Ein weiterer Unterschied ist, dass Multitracks im Normalfall klanglich unbearbeitet sind, während Stems die Klangbearbeitung und auch die Pegelverhältnisse der Originalmischung enthalten.
Die richtigen Stems für alle Fälle
Was genau ist nun aber Teil eines Stems und wie nimmt man am besten die Aufteilung vor? Nun, das kommt auf das Projekt an und darauf, für welchen Zweck die Stems angefertigt werden!
Die einfachste Teilung eines typischen Pop-Song besteht aus zwei Stems: Dem Instrumental (Musik ohne Gesang) und dem A Cappella (Gesang ohne Musik). Das wäre eine denkbare Trennung für eine Karaoke-Version oder für den Fall, dass der Song noch einmal in einer anderen Sprache aufgenommen werden soll. Möchte man aber beispielsweise einen Remix anfertigen und dabei das Schlagwerk austauschen, reicht die Trennung in Instrumental und A Cappella nicht mehr aus. Meist wird also in mehr als 2 Stems unterteilt.
Betrachten wir doch mal ein paar typische Szenarien im Detail:
Stem Mastering
Beim Stem Mastering wird der Mastering Engineer mit mehreren Stems versorgt, um weiter in den Mix eingreifen zu können. Für diesen Zweck sind ca. 3-6 Stems meist völlig ausreichend. Schlagzeug, Bass, Vocals und Harmonie-Instrumente bieten sich für eine getrennte Ausspielung an, weil diese häufig etwas unterschiedliche Bedürfnisse haben. Gitarren oder Keyboards können in Gruppen zusammengefasst werden.
Synch Licensing
“Synch” steht in der Musikwelt für die Verwendung von Musik im Verbund mit Bewegtbild, beispielsweise Kino-, Fernsehen- oder Werbefilmproduktionen oder auch Videospiele. Hier wird mit Stems gearbeitet, weil im filmischen Kontext oft nur einzelne Elemente eines Songs verwendet werden. Der Gesang und das Schlagzeug sollten einzeln vorliegen, weil diese Elemente besonders häufig ausgeschaltet werden, um nicht vom Bild abzulenken. Das führende Melodie-Instrument sollte ebenfalls einzeln ausgespielt werden, um eine “abgespeckte” Version des Songs zu ermöglichen. Gibt es Streicher, sollten diese ebenfalls getrennt exportiert werden. Filmproduktionen werden in der Regel in 48 kHz angelegt, für Synch ergibt es also oft Sinn, die Stems bereits in 48 kHz auszuspielen um es dem Filmtonteam so leicht wie möglich zu machen.
Remixing
Egal ob Dance Remix oder Dolby Atmos Version, bei einer Neumischung bringt man die Signale in einen neuen Kontext und braucht deswegen tendenziell etwas mehr kreative Eingriffsmöglichkeiten. Folglich ist man mit ungefähr 12-20 Stems für einen durchschnittlichen Pop-Song gut beraten. Hall- und Echokanäle werden am besten einzeln ausgespielt, damit die Räumlichkeiten neu inszeniert werden können. Rhythmus- und Lead-Instrumente zu trennen, ergibt in den meisten Arrangements ebenfalls Sinn.
Live Playbacks
Zugegeben, das Live Playback für die Bühnenperformance ist eher eine alternative Version als ein klassischer Stem-Fall. Es werden aber häufig mehrere unterschiedliche Arrangements des Playbacks benötigt, wenn mit unterschiedlich großen Besetzungen aufgetreten wird. Stems sind super geeignet, um die verschiedenen Szenarien abzudecken und bei Bedarf kurzerhand eine neue Playbackversion anzufertigen.
Tipps für den professionellen Umgang mit Stems
Wenn es an das Ausspielen der Stems geht, zeigt sich schnell die Erfahrung eines professionellen Engineers. Die meisten Tonprofis legen ihre Mischungen von vornherein so an, dass alle üblichen Stemformate zuverlässig in einem einzigen Durchlauf ausgespielt werden können. Falls du beim Exportieren von Stems bis jetzt also noch jedes Mal mehrere Durchläufe brauchst, etliche Spuren manuell stummschalten und Plugins bypassen musst, schau dir unbedingt die folgenden Tipps an:
- Verwende Bus-Gruppen für jedes Signal!
Einfach aber effektiv: Achte darauf, dass alle Signale konsequent auf passende Busse verteilt werden und keines direkt auf den Master führt. Ich arbeite beispielsweise grundsätzlich mit zwei Hauptgruppen (z.B. “Vocals” und “Instrumental”) und in der Hierarchie darunter mit zahlreichen weiteren Gruppen wie “Drums”, “Percussions”, “Gitarren” oder “Background Vocals”. So kann ich auf einen Schlag einfach mehrere dieser Gruppen exportieren, um unterschiedliche Stem-Szenarien abzudecken. Mehrfaches Exportieren oder manuelles Ausschalten von Spuren oder Plugins ist damit hinfällig und man vergisst garantiert kein Signal beim Export.
- Nutze getrennte Send-Effekte für die unterschiedlichen Bus-Gruppen!
Derselbe Hall für Vocals, Gitarre und Snare? Das kann klanglich funktionieren, sorgt jedoch spätestens beim Stem-Export für Probleme. In welchen Stem gehört das Hallsignal? Vocal-Hall auf dem Gitarren-Stem kann niemand gebrauchen. Lösung: Aux-Kanal kopieren und jeder Signalgruppe eine eigene Instanz spendieren! Das bringt auch mehr Flexibilität mit sich und man kann die Effekte für die verschiedenen Instrumente leicht variieren, um mehr Tiefenstaffelung und Struktur zu schaffen.
- Stems gehören ins Archiv!
Hast du schon mal ein uraltes DAW-Projekt wiederherstellen müssen? Dann verstehst du, wie wichtig dieser Punkt ist. Du kannst dir selbst und allen Beteiligten viel Zeit und Arbeit ersparen, wenn du gleich beim Abschluss einer Produktion die üblichen Stems exportierst und zusammen mit dem Projekt archivierst. Das stellt sicher, dass auch in vielen Jahren (wenn die verwendeten Softwares und Plugins schon lange nicht mehr unterstützt werden) ein Projekt weitergeführt oder verwertete werden kann.
- Füge deine Mischung bei!
Ich erhalte erstaunlich häufig Stems, ohne je den Mix gehört zu haben. Es ist sinnvoll, Mix (und falls vorhanden das Master) bei der Ausspielung von Stems hinzuzufügen, damit eine Klangreferenz zur Verfügung steht. Nicht zuletzt, um Fehler vorzubeugen: Fehlt ein Signal, fällt das ohne Originalmix nämlich oft gar nicht auf. Selbst wenn es bislang nur einen Roughmix gibt, ist das allemal besser als nichts.
Mit oder ohne Master-Bearbeitung?
Die Bearbeitung, die auf dem Master-Kanal stattfindet, ist kein Bestandteil des einzelnen Stems. Das liegt daran, dass auf der Summe meistens Dynamikwerkzeuge eingesetzt werden. Das Dilemma dabei: Ein Kompressor oder Limiter reagiert auf das eingehende Signal, verhält sich also unterschiedlich, wenn er mit einer ganzen Mischung oder nur einem Teil der Signale konfrontiert wird. Deshalb werden Stems nicht über den Summenkanal, sondern direkt aus der Bus-Gruppe exportiert.
Bei statischen EQs ist das anders: Wird massives EQ-ing auf der Stereosumme vorgenommen, kann es Sinn ergeben, den EQ beim Export der Stems auf die einzelnen Stem-Gruppen zu kopieren und einzurechnen. Achte aber darauf, dass die Reihenfolge der Klangbearbeitungen dadurch nicht durcheinandergerät! Lege im Zweifel einfach einen Screenshot deiner Summenbearbeitung bei, damit diese jederzeit mit ähnlichen Werkzeugen reproduziert werden kann.
Falls mit derselben DAW gearbeitet wird, bietet es sich an, die Stems in einem DAW-Projekt zu übergeben und die Summenbearbeitung einfach in der Session zu belassen. Professionelle DAWs bieten in der Regel auch die Möglichkeit, Spuren und Gruppen “einzufrieren” (freeze). Die Pluginbearbeitung wird dann in das Audiosignal eingerechnet, man kann aber jederzeit zurück, um die Plugins noch einmal anders einzustellen. Das Praktische dabei: Man kann “gefrorene” Spuren auch verwenden, wenn man die entsprechenden Plugins oder Geräte gerade nicht parat hat und die CPU wird auch entlastet.
Welches Format für die Ausspielung?
Es ergibt Sinn, bei der Ausspielung von Stems bei der ursprünglichen Abtastrate des Projekts zu bleiben, um Qualitätseinbußen und unnötige Konversionen zu vermeiden. Wurde beispielsweise in 96 kHz produziert, werden auch die Stems in 96 kHz angelegt. Werden die Stems aber für einen bekannten Anwendungszweck mit spezifischer Abtastrate angefertigt (bspw. 48 kHz für eine Videoproduktion), kann es sinnvoll sein, die Konversion in das benötigte Format direkt beim Bounce durchzuführen.
Was die Bittiefe angeht, empfehle ich eine Auflösung von 32 bit float (Gleitkomma). Das ist auch die Auflösung, mit der die allermeisten digitalen Workstations rechnen, also sozusagen das Originalformat der Gruppenspuren. Hintergrund dieser Empfehlung ist aber vor allem, dass das Gleitkommaformat einen erheblich höheren Headroom für Pegelspitzen aufweist als feste Bittiefen und etwaige Übersteuerungen zu einem späteren Zeitpunkt einfach durch eine Pegelreduktion rückgängig gemacht werden können. Es kann nämlich in einer Mischung durchaus mal vorkommen, dass eine Signalgruppe für sich betrachtet übersteuert und erst auf der Mix-Summe (z.B. von einem Limiter) zurück geregelt wird. Da der Übersteuerungsschutz der Summenbearbeitung auf den Stems fehlt, ist das Floating Point Format also eine gute Lösung, um Pegelverhältnisse beibehalten zu können, ohne sich dabei unerwünschte Verzerrungen einzufangen oder zusätzliche Limiter einsetzen zu müssen.
Falls es für dein Projekt übrigens abweichende Spezifikationen oder Absprachen gibt, solltest du dich natürlich an diese Vorgaben halten, damit alle anderen Gewerke bestmöglich mit deinem Material arbeiten können. Alle meine Tipps sind also in erster Linie für die vielen Fälle gedacht, in denen keine eindeutigen, technischen Spezifikationen vorliegen.
Fazit
Ein professioneller Umgang mit dem Thema Stems ist häufig entscheidend, um mit Produktionen auch in Zukunft noch flexibel arbeiten zu können. Erfahrungsgemäß wird dieses Thema von Tonschaffenden mit weniger Berufserfahrung gerne vernachlässigt, was oft zu Nacharbeiten und Verzögerungen führt. Vernachlässigte Stem-Arbeit kann aber auch in geplatzten Deals und verpassten Chancen resultieren, z.B. wenn es um Synch-Platzierungen oder das Remixing alter Tracks geht. Damit solche Chancen genutzt werden können, sollten die Daten unmittelbar zur Verfügung stehen.
Ich hoffe, dass dieser Beitrag dir ein wenig Klarheit für deinen Workflow gebracht hat und dir nervige Extrarunden erspart, sodass du dich mehr auf das Wesentliche konzentrieren kannst: Deine nächste Produktion!
Schreib uns gerne in die Kommentare, wenn du der Meinung bist, dass ich einen wichtigen Aspekt vergessen habe oder lass uns an deinem persönlichen Stem-Workflow und deinen Erfahrungen mit Stems und Routing teilhaben!