Testbericht: sonible smart:deess

Die Sprach- und Gesangsaufnahme kennt zwei Schreckgespenster, die Toningenieure häufig zur Verzweiflung bringen: Zisch- und Plosiv-Laute. Man kann ihre Übertreibung oder Schärfe bereits bei der Aufnahme vermeiden, jedoch ist nicht jedem Sänger oder Sprecher, egal ob weiblich oder männlich, ein weicher und kontrollierter S-Laut angeboren. Plosiv-Laute sind weitaus leichter zu bändigen, wenn man sie nicht frontal aus nächster Nähe auf die Membran des Mikrofons prallen lässt. Haben sich die Ohren erst einmal auf störende S-Laute eingeschossen, beginnt der in der Regel mühsame Prozess der Verarztung mit einem De-Esser, der oft mit einem ‚fff‘ anstelle eines ‚sss‘ endet, weil man die Zischlautunterdrückung durch zu starke Fokussierung instinktiv übertreibt und erst mit Abstand bemerkt, was man da eigentlich angerichtet hat. Der klassische De-Esser ist ein frequenzselektiv im Bereich von etwa 2 bis 6 kHz sehr schnell arbeitender Begrenzer. Inzwischen gibt es jedoch viele Methoden, scharfen oder übertriebenen Zischlauten an den Kragen zu gehen, zum Beispiel mit dynamischen Equalizern oder auch mit Melodyne. Duldsame Menschen editieren bisweilen jeden auffälligen S-Laut händisch in der Timeline ihrer DAW. Mit smart:deess, einem neuen Plug-In aus dem Hause sonible, kann man diesem ganzen Aufwand getrost Lebewohl sagen, so zumindest behauptet es der Hersteller. Ob sich das in der Praxis bewahrheitet, erfahren wir in diesem Testbericht. Wie von diesem stets nach Innovation strebenden Entwicklerteam nicht anders zu erwarten war, arbeitet auch smart:deess auf der Basis von KI beziehungsweise maschinellem Lernen. Also – ab sofort geht es nur noch um s, sch, z, p, t und k.

Es gehörte bislang nicht zu den Aufgaben (und Fähigkeiten) eines De-Essers, sich auch um die Problematik von Plosiv-Lauten zu kümmern. Durch die immanente, komplexe spektrale Bearbeitung von smart:deess und die generelle strukturelle Verwandtschaft von S und P ließ sich offensichtlich beides unter einen Hut bringen. Der vielschichtige Aufbau der menschlichen Sprache erfordert eine sehr feinteilige Analyse und Bearbeitung. Konventionelle De-Esser kümmern sich lediglich um den Pegel eines Zischlauts, nehmen aber keinen Einfluss auf dessen spektralen Inhalt. Anders ist hier smart:deess angelegt, denn ein neuronales Netzwerk erkennt nicht nur automatisch Phoneme (die kleinsten bedeutungsunterscheidenden sprachlichen Lautabschnitte) und reduziert daraufhin ‚Zisch‘ und ‚Bumm‘ (etwa infolge eines explosionsartigen Ps), sondern verbessert auch die spektrale Struktur des ‚Störsignals‘. Mit dieser Ausstattung lässt sich sogar ein übertriebener De-Esser-Einsatz nachträglich retten, denn smart:deess ist in der Lage, S-Laute in gewisser Weise und bestimmten Grenzen zu ‚rekonstruieren‘. Wie gewohnt, spielt man dem Plug-In einen Audioabschnitt mit für die erhoffte Bearbeitung typischem Inhalt vor. Nach einer kurzen Lernphase beginnt smart:deess bereits mit seiner Arbeit, und liefert, wie ich schon verraten darf, verblüffend souveräne Ergebnisse.