Audiodaten in Echtzeit über Netzwerk (AoIP = Audio over IP) dank weltweite Verfügbarkeit des Ethernets bietet deutliche Vorteile
Vorbei sind die Zeiten, in denen schwere, feuerwehrschlauchdicke Multicor-Kabel quer von der Bühne bis zum Mischplatz des Tontechnikers verlegt werden mussten und die Größe des Multicor mit der Größe der Veranstaltung immer dicker und unübersichtlicher geworden ist.
Heute ist der Einsatz dünner Glasfaser- oder Netzwerkkabel üblich, über die eine hohe Zahl Audio-Kanäle bidirektional über eine Standard-Netzwerkleitung versendet werden.
Diese Entwicklung gilt nicht nur für die sogenannten „fliegende Installationen“, also mobile Veranstaltungen wie Live-Auftritte, Konzerte, Messen, Events oder mobile Aufnahmeeinrichtungen. Mittlerweile ist die Nutzung digitaler Übertragungsmethoden für Audiosignale fester Bestandteil im Bereich der Festinstallationen.
Konkrete Beispiele sind:
- Kleinere Installationen wie Konferenzräume, Klassenzimmer, kleinere Kirchen, Clubs oder Restaurants.
- Mittlere Installationen wie in mittelständischen Geschäftsumgebungen oder Studios, die lediglich eine einfache Verwaltung ihrer überschaubaren Räume benötigen.
- Große Installationen für Organisationen mit vielen Benutzern, Räumen und Geräten sowie unterschiedlichen Standorten. Hierzu zählen insbesondere Rundfunk- und Fernsehanstalten mit zahlreichen Studios sowie mobile Aufnahmeeinrichtungen sowie große Gotteshäuser und Opernhäuser.
In den letzten Jahren ist eine eindeutige Entwicklung von digitalen Audioübertragungswegen (Koaxialkabel, Lichtwellenleiter) hin zu IP-basierten Audio-Übertragungslösungen festzustellen.
Audiodaten in Echtzeit über Netzwerke (AoIP = Audio over IP) zu versenden bietet gegenüber herkömmlichen digitalen Übertragungen deutliche Vorteile. Die weltweite Verfügbarkeit des Ethernets zum einen, zum anderen reduzieren sich Verkabelungsaufwand sowie die Kosten (Verkabelung, Installation), durch die Übertragung vieler Kanäle über ein einziges Kabel.
Das grundlegende Problem von AoIP-Systemen besteht darin, das Netzwerke nicht für Echtzeitanwendungen ausgelegt sind und somit Latenzen verursachen. In diesem Zusammenhang spielt die Übertragungsart der Audiogeräte über das Netzwerkkabel eine bedeutende Rolle. Laut OSI-Schichtenmodell unterscheidet man zwischen drei Übertragungsschichten (Layer).
Layer 1 ist die einfachste Übertragungsschicht und definiert lediglich das verwendete Übertragungsmedium (z.B. Kupfer- oder Glasfaser). Eine auf Layer 1 basierende Übertragungsvariante ist z.B. AES50. Die Audioübertragung zwischen den beiden direkt miteinander verbundenen Geräten erfolgt hier im Punk-zu-Punkt Verfahren in einem der herkömmlichen digitalen Mehrkanalformate.
Audio-Übertragungsprotokolle die auf Layer 2 basieren, setzen auf dem Ethernet-Übertragungsprotokoll auf. Das System bietet jedoch (wie Layer 1) keine Adressierbarkeit der verwendeten Geräte, so dass auch hier kein gezieltes Routing zwischen mehreren Geräten möglich ist.
In Layer 3 erfolgt die Übertragung IP-basiert in Datenpaketen, was eine Adressierbarkeit der einzelnen Datenpakete ermöglicht. So können hochauflösende Audiopakete und sonstige Daten, Dateien und Dienste problemlos, gleichzeitig auf der gleichen Leitung und über weite Strecken übertragen werden.
Systeme, die auf Layer 3 ansetzen, sind unter anderem AVB/TSN, RAVENNA und Dante. Dabei ist das System Dante der Firma Audinate auf dem Gebiet AoIP weltweit marktführend.
Für ein echtzeitkritisches Audionetz wie Dante ist eine exakte Synchronisierung notwendig. Dante arbeitet mittels dem Precision Time Protocol (PTP) gemäß Standard IEEE 1588-2008.
Um eine adäquate Widerherstellung des Audiomaterials sicherstellen zu können, bedarf es einer Instanz, welche die Geschwindigkeit der Wiedergabe der Samples steuert und möglichst konstant hält. Das ist der Takt. AoIP-Netze zeichnen sich durch einen sehr präzisen Takt aus. Dafür wird das Precision Time Protocol (IEEE 1588-2008) eingesetzt, welches nach dem Master-Slave-Prinzip arbeitet. Hierbei wird ein Grandmaster ausgewählt, dem die Rolles des Masters (Taktgebers) zugewiesen wird, während alle anderen Geräte vom Master synchronisiert werden. Der Master selber, wird z.B. über eine GNSS-Antenne, die eine hochgenaue Zeitreferenz darstellt, synchronisiert.
Bei Verlust der Zeitquelle sorgt der im Grandmaster integrierte Oszillator für eine kontinuierlich hohe Zeitgenauigkeit. Dabei müssen die im Oszillator eingesetzten Quarze, die Genauigkeit nach ITU-T G.813, G.812 oder G.811 erfüllen. In der Praxis ist es dann häufig so, dass zwei Grandmaster redundant im IT-Netzwerk als Zeitquelle installiert sind und sich untereinander synchronisieren, um so evtl. Ausfälle zu vermeiden.