YouTube Video-Podcast erstellen mit Riverside.fm (Erfahrung)

Transkript der Episode 37 von Frag Wolfram, dem Online Business Podcast mit Wolfram Kläger vom 13.11.2023

Nach vier Recording Sessions mit Riverside.fm für unseren YouTube Video-Podcast sind wir schlauer, was super funktioniert und was uns noch fehlt.

Schön, wieder hier zu sein! Vielleicht hast du gemerkt: diese Episode hätte schon vor einer Woche erscheinen sollen.

Ist sie aber nicht!

Wegen akutem Überanfall an Arbeit und restlicher Erkältung, die ich zwischendurch noch ausbaden musste, habe ich es einfach nicht geschafft. Und im Zweifel haben Kunden und andere Projekte die Priorität.

Wie z.B. unser neuestes Baby, der True Miles Video-Podcast via YouTube und überall, wo es Podcasts gibt. Dann ohne YouTube und ohne Bild, aber immerhin mit Ton.

Tatsächlich, nach 14 Tagen, 5 Episoden aufgezeichnet, 3 davon online, freue ich mich riesig, dass dieses neue Projekt sich schon jetzt weit besser entwickelt, als ich erwartet habe. Und die Zusammenarbeit mit Kai Berke einfach richtig Spass macht und nach vorne losgeht.

Aber!

Was red' ich?!

Thema hier und heute sollen die Erfahrungen sein, die wir beim Aufzeichnen der ersten 5 Episoden eben dieses neuen Podcasts gemacht haben. Warum wir uns dafür für Riverside.fm entschieden haben und ob Riverside unsere Erwartungen erfüllt hat, vielleicht sogar übertroffen.

Warum und was ist Riverside.fm?

Riverside.fm ist – ich würde sagen – die führende Plattform fürs sogenannte Double-Ender Recording für Audio und Video über Internet, statt im lokalen Studio.

Single Ender, Double Ender … eigentlich müsste es bei Riverside heissen: Multi Ender.

Denn Riverside kann bis zu 8 verteilte Locations über Internet integrieren.

Also bis zu 8 Kameras und Mikrofone können weltweit irgendwo herumstehen. Hauptsache, sie sind jeweils mit einem Computer mit Internet-Anschluss verbunden.

Riverside.fm wird auf dem lokalen Computer nicht als Software installiert, sondern im Google Chrome Browser aufgerufen und läuft dann dort als App.

Andere Web-Browser werden meines Wissens offiziell nicht empfohlen. Und warum ausprobieren, wenn Chrome garantiert funktioniert?

Man kann ansonsten gegen Google Chrome gerne einwenden, was man will. Dass dieser Browser technisch ganz vorne ist und einfach super funktioniert, darüber gibt es so schnell keine zwei Meinungen.

Für "True Miles", unseren neuen Video-Podcast, brauchten wir unbedingt eine Remote-Lösung. Da mein Co-Host die meiste Zeit in Thailand ist, wenn er nicht irgendwo im Flugzeug sitzt oder in einer Lounge für Business Class, First Class Passagiere abhängt. Natürlich nicht zum Zeitvertreib, sondern aus beruflichen Gründen. Schliesslich schreibt er regelmässig Reviews und berichtet von seinen Erlebnissen und Erfahrungen als Global Traveler.

Eben jetzt auch im neuen Podcast, zusammen mit mir, als Co-Hosts.

Ausserdem wollten wir von vornherein eine Plattform, die uns flexibel macht, Gäste einzuladen, für Interviews und sonstige Gesprächsrunden.

Riverside.fm erlaubt uns bis zu 6 weitere Gäste an verschiedenen Locations einzubinden, in die True-Miles-Show.

Und übrigens: Für jede dieser Locations genügt sogar ein Handy, Android oder Apple. Riverside bietet dafür eigene Apps an, die sich in eine Session integrieren wie lokale Desktop PCs oder Laptops.

Das haben wir noch nicht ausprobiert. Wir hatten erst mal genug zu tun, die Gerätschaften, die wir jeweils greifbar hatten, einigermassen ordentlich zusammen zu bekommen, damit sich das Ergebnis sehen und hören lassen kann.

Aber der Reihe nach, zu den Fallstricken. Zuerst:

Video: Kameras, Auflösung, Framerate

Für Video braucht es eine Kamera. So viel ist jedem klar. Aber dann geht es los:

  • Einfach die Webcam?
  • Mein Handy als Webcam?
  • Geht auch ein Camcorder?
  • Oder braucht es eine ausgewachsene Kamera?

Und dann: wie schliesse ich die Kamera an?

  • USB 2 oder 3 (3.0, 3.1 oder 3.2)
  • PCI
  • HDMI

In der Regel kommst du um USB nicht herum.

PCI bedeutet, du hast eine Steckkarte für einen Desktop-PC. Brauchst du aber nur für extrem hohe Auflösung und oder mehrere Kameras.

HDMI bedeutet, du hast einen externen Adapter. Die Kamera schliesst du mit einem HDMI-Kabel an, wie einen externen Monitor oder Recorder. Das andere Ende kommt an einen freien USB-Anschluss am Rechner.

USB 2 kannst du dafür grundsätzlich vergessen.

Ab USB 3.0, das sind die blauen USB-A Buchsen oder gleich USB-C, kannst du mit einer brauchbaren Auflösung und Framerate rechnen.

Apropros: Was heisst Auflösung?

Auflösung heisst einfach: Wie viele Pixel hat dein Kamerabild, breit und hoch?

Grundsätzlich im Seitenverhältnis 16 : 9, also: Breite geteilt durch Höhe.

Die unterste Kante einer brauchbaren Video-Auflösung wird oft mit "SD" oder "720p" bezeichnet.

Das sind 1.280 * 720 Pixel.

Wenn du hauptsächlich an YouTube denkst, dann ist die heute meist verbreitete Auflösung das sogenannte Full HD oder 1080p.

Das sind dann 1.920 * 1.080 Pixel.

Kennst du wahrscheinlich vom typischen PC-Monitor.

Und dann ist da noch das sogenannte 4K oder 2160p relevant.

Das ist die Auflösung, mit der für moderne Kameras, Monitore und Fernsehgeräte geworben wird. Was du dann tatsächlich davon hast, in der Praxis, steht auf einem anderen Blatt. Aber das lesen wir hier nicht vor, heute. Zu viele Details 🙂

Viel wichtiger ist nämlich in der Praxis noch die zeitliche Auflösung, sogenannte Framerate.

Was heisst Framerate?

Übersetzt ungefähr "Bildrate" oder "Bildwechselfrequenz". Die einfach sagt, wie viele Bilder hat dein Video, pro Sekunde?

Handelsüblich sind Framerates

  • 24 Bilder pro Sekunde wie im Kino
  • 25 Bilder pro Sekunde wie im europäischen PAL-Fernsehen
  • oder 30 Bilder pro Sekunde wie im US-Fernsehen
  • oder doppelt so viele, bei LED / LCD Monitoren mit 60 Hz
  • oder noch mal doppelt so viele, bei Handy Displays mit 120 Hz
  • oder noch mal doppelt so viele fürs Gaming mit 240 Hz

Für Webcams und Videokameras spielt die Musik zwischen 24 und 60 Hz.

Darunter sind Stand- und Ruckelbilder.

Darüber ist nur für Slow Motion Effekte interessant, die bei Videokonferenzen traditionell eher selten zum Einsatz kommen.

Aber wer weiss?

Demnächst?! 🙂

Für unsere Zwecke Richtung YouTube:

YouTube ist die Auflösung und Bildrate weitgehend egal.

Hochladen kannst du dort erst mal alles, was du hast.

Wenn du dann mithalten willst, mit dem Standard, der zur Zeit am weitesten verbreitet ist, dann orientierst du dich an Full HD und einer Framerate von 30 Hz.

Viel interessanter in der rauen Praxis ist doch zunächst:

Was kann deine Kamera?

Bei unserem neuen Podcast ging alles so schnell, dass wir gar keine Zeit hatten, uns gross zu überlegen, was wäre die perfekte Hardware, das perfekte Equipment dafür, an beiden Enden der Videokonferenz?

Wir haben einfach genommen, was greifbar war:

  • Meine gute alte Logitech Webcam, eine C920 HD Pro, am Monitor aufgesteckt
  • Mein Co-Host in Thailand schon eine richtige Digitalkamera, eine Sony ZV-1

Die Logitech behauptet steif und fest, sie löst HD auf. Technisch korrekt. Optisch: na ja … Webcam halt!

Bei der Sony kommt es darauf an, wie sie angeschlossen wird.

Zur Zeit hängt sie einfach per USB am Laptop. Dann ist schon bei SD bzw. 720p Schluss.

Alternativ kannst du so eine Digicam meistens auch per HDMI an USB 3 bzw. USB-C anschliessen, über einen Adapter, auch als "Capture Card" bezeichnet, z.B. den Elgato Camlink 4k.

Wenn es nur um HD statt SD Auflösung geht, dann genügt dafür auch einer der zahllosen alternativen Sticks, die nur einen Bruchteil kosten, von dem, was dich der Elgato kostet.

In der Praxis zeigt sich allerdings sofort, durch persönliche Inaugenscheinnahme: eine gute SD-Auflösung von einer ausgewachsenen Digicam sieht deutlich besser aus, als eine Pseudo HD-Auflösung von der Webcam.

Kannst du selbst sofort nachvollziehen, wenn du dir eine der ersten True Miles Podcast-Episoden auf YouTube anschaust.

Mein Bild von der Logitech, sogenanntes HD, und Kais Bild von der Sony.

Technisch wie gesagt SD, optisch, dass du dich fragst, was soll da jetzt noch HD extra bringen?

Das gilt auch für die nächst grössere Sony-Kamera, die ich im Zulauf habe, damit ich demnächst genauso attraktiv rüber komme, optisch, wie Kai mit seine ZV-1, nämlich mit der Sony ZV-E10. Auch die kann nur 720p, per USB. Via HDMI-Stick könnte ich das auf 1080p oder sogar 4K aufpimpen. Aber ob sich das für diesen Zweck lohnt, das bezweifle ich …

Deshalb mein Tipp:

Capture Card oder Stick kannst du in der Regel vergessen.

Es sei denn, deine Kamera kann kein USB-Streaming oder die Auflösung soll mindestens 4K sein oder du musst mehr als eine Kamera anschliessen. Oder du bist ein "Streamer" und willst per OBS auf Twitch Furore machen. Aber das ist heute hier nicht das Thema.

Für Videokonferenzen und Remote Recordings viel kniffliger als das Bild erweist sich nämlich der gute Ton.

Audio: Mikrofone, Kopfhörer, Samplerate

Lokal im Studio arbeiten, alles zur selben Zeit am selben Platz, hat einen Riesenvorteil: du kommst direkt an jedes Kabel, jeden Stecker, jeden Schalter und alle Rechner ran.

Das geht schon mit den Kopfhörern los. Die sind für alle an der Session Beteiligten dringend empfohlen, damit es zu keinem Zeitversatz kommt, der dann auch in der Aufnahme zu hören ist.

Und es sollten auch unbedingt verkabelte Kopfhörer oder Ohrhörer sein. Weil Bluetooth seine ganz eigenen Probleme und Zickigkeiten mitbringt. Angefangen bei den Akkus, die immer im falschen Moment leergehen.

  • Ich benutze immer noch meinen AKG K371, ein klobiges Ding auf dem Kopf, nicht gerade perfekt für ein stylishes Video, aber ich habe einfach noch keinen Kopfhörer gefunden, mit dem ich das Gras besser wachsen höre und der dazu noch bequem auf meinem Riesenkopf sitzt, egal wie lange die Session dauert.
  • Und Kai, mein Co-Host, hat in der Not zu einem billigen Gamer-Headset gegriffen, damit er mich gut hören kann, ohne dass die Laptop Speaker ins Mikro quäken. Der fest montierte Drahtbügel fürs eingebaute Mikrofon ist jetzt immer im Weg. Für die Aufnahme spielt es nämlich gar keine Rolle. Wir nutzen ein drahtloses Ansteckmikrofon. Jedenfalls, so lange der Akku mitspielt und Bluetooth nicht aussetzt.

Wie gesagt. Wir wissen, was gut wäre. Und wir arbeiten daran. Mit jeder Episode werden wir besser. Und irgendwann vielleicht sogar professionell 🙂

Die wahren Herausforderungen lauern eh woanders, z.B. standortbedingt.

In unserem Beispiel: Hannover vs. Buri Ram in Thailand, knapp 10.000 km Luftlinie voneinander entfernt.

Von der Zeitverschiebung ganz abgesehen. Zur Zeit 6 Stunden Unterschied. Kann man einplanen.

Das Klima ist schon eine andere Nummer. Zur Zeit noch, im November, tagsüber 30 Grad, nachts 24 Grad, konstant.

Bedeutet:

  • Die Klimaanlage ausgeschaltet, geht dort Videokonferenz nur halbnackt, in Eiswürfel gepackt oder dergleichen.
  • Die Klimaanlage eingeschaltet hört sich in der Aufnahme an wie ein Dauergebläse sich eben anhört, wie ein Föhn, Stereo.

Ist also schon entschieden. Und damit auch, dass es bei der Nachbearbeitung nicht geht ohne Rauschunterdrückung.

Lokal kein Problem. Remote leider schon. Jedenfalls, so lange du dich auf den Riverside-Schalter verlässt. Für den Export deiner Aufzeichnung bietet Riverside nämlich nur zwei Schalter an:

  • Noise Reduction ein / aus und
  • Normalization ein / aus

Wenn du also keine Möglichkeit (oder keine Zeit) hast, dich später von Hand darum zu kümmern, übernimmt Riverside das, auf die Schnelle, für dich. Und zwar gar nicht schlecht:

  • Alle lokal aufgezeichneten Audiospuren werden auf dieselbe maximale Lautstärke gebracht ("normalisiert").
  • Und alle Spuren werden von Hintergrundgeräuschen befreit.

Leider wirst du schnell feststellen: die Normalisierung alleine ist nur die halbe Miete. Nämlich die Angleichung nach "oben", die lautesten Stellen in der Aufnahme. In der Regel willst du aber auch nach "unten" abgleichen, also die leisesten Stellen. Und dazu braucht es einen Kompressor.

Die gibt es zuhauf. In allen Geschmacksrichtungen. Aber, leider, leider, zur Zeit noch nicht auf riverside.fm.

Das ist schon der erste Grund, warum du dich ganz schnell nicht mehr auf den Riverside-Editor online beschränken möchtest, sondern lieber alle aufgezeichneten Dateien erstmal herunterlädst und dann mit dem Video-Editor deiner Wahl angehst, z.B.

  • CapCut
  • Adobe Premiere oder
  • Davinci Resolve

Oder – wenn es nur um Audio geht – mit der DAW (Digital Audio Workstation) und das Audio-Interfache deiner Wahl. Wenn es nach mir geht:

  • Ableton Live. Aber Logic, Pro Tools, Studio One oder oder tun es natürlich genauso.
  • Und ein Audient iD14 Mk II. Aber jedes andere USB Audio-Interface von Audient, Focusrite, Universal Audio, RME oder Behringer oder oder tut es auch.

Dazu kommt, dass du früher oder später wirklich die Kontrolle behalten möchtest, über die finale Lautstärke der gerade aufgezeichneten Podcastepisode.

Streng genommen, geht es hier gar nicht um die Lautstärke, englisch "Volume", sondern um die wahrgenommene Lautheit, gemessen in LUFS, Loudness Units / Full Scale.

Die Details führen hier zu weit.

Nur so viel, zur groben Orientierung:

  • Für einen Audio-Podcast hat Apple die Richtschnur definiert. Danach soll eine Episode durchschnittlich höchstens -16 LUFS laut sein.
  • Für YouTube-Videos hat aber Google entschieden, und zwar darf es hier 2 Dezibel lauter zugehen, also maximal -14 LUFS.

Alle sonst so geläufigen Normen und Standards mal weggelassen. Auf Dauer solltest du anpeilen, im eigenen Interesse, dass deine Content-Stücke, als Audio oder Video, in der jeweils als "optimal" angesehenen durchschnittlichen Lautheit angeliefert werden.

Sonst regeln dich die Apple– oder Google-Algorithmen automatisch runter, irgendwie. Oder umgekehrt, machen sie gar nichts, wenn du zu leise bist, vielleicht sogar viel zu leise, im Vergleich zum sonstigen Audio- oder Video-Content auf der jeweiligen Plattform.

Das ist offensichtlich wichtig. Im Vergleich dazu ist es erstmal völlig nebensächlich, mit welcher Samplerate du das Endresultat hochlädst.

YouTube akzeptiert beinahe jede Samplerate.

Üblich sind heute entweder 44.1 kHz, der gute alte CD-Standard für Musik oder 48 kHz, der Standard für Videos.

Alle anderen Samplerates sind eher exotischen Zwecken vorbehalten.

Interessant, nebenbei:

YouTube empfiehlt, Videos hochzuladen mit einer Audio-Samplerate von 48 kHz. Wenn du YouTube-Videos anschaust, werden sie aber mit 44.1 kHz ausgespielt. Vermutlich, weil die meisten Endgeräte defaultmässig immer noch auf den historischen CD-Standard eingestellt sind.

Was all diese Feinheiten angeht: Das Schöne an Riverside ist, dass es dich mit diesen Details nicht weiter behelligt und im Hintergrund automatisch so werkelt, wie du es wahrscheinlich doch auch willst.

Das funktioniert fürs Erste auch schon mal ganz gut.

Aber auf Dauer kommst du eben nicht darum herum, um den Download und die herkömmliche Nachbearbeitung bzw. Post-Production mit darauf spezialisierten Tools, wie schon erwähnt.

Du hast dann einfach viel, viel mehr Möglichkeiten, präzise und wiederholbar so zu arbeiten, wie du es dir vorstellst, deine Kunden von dir verlangen oder Projektpartner einfach erwarten.

So wie sich Riverside zur Zeit entwickelt, gehe ich allerdings davon aus, dass sie ihren Online-Editor schrittweise immer mehr ausbauen und sich demnächst die Grenzen weiter verschieben werden.

Dass das – Quick & Dirty – schon heute sehr gut funktioniert, zeigt sich auch beim Video-Schnitt.

Riverside.fm Editor vs. Capcut, Davinci Resolve

Für die einfachsten Zwecke genügt tatsächlich der Riverside Online-Editor, der praktisch unmittelbar nach Ende der Aufzeichnung aktivierbar ist.

Natürlich kein Vergleich zu CapCut, Adobe Premiere oder gar Davinci Resolve.

Wer mit solchen "Full Blown" Flagschiffen umgehen kann, wird darauf nicht verzichten wollen, um auch noch das Letzte aus dem aufgezeichneten Videomaterial, der "Footage", herauszuholen.

Dito, wie schon erwähnt, was die Digital Audio Workstations angeht (DAW).

Aber für alles, was schnell gehen soll, ist der Riverside-Editor schon wirklich brauchbar:

  • Eine Intro voranstellen
  • Eine Outro ans Ende anfügen
  • An beliebigen Stellen Schnitte einfügen
  • Und Schnipsel dazwischen löschen

Dazu kommt, was ich bisher nur von der Descript-Software kenne, die Möglichkeit, im Transkript zu schneiden.

Extras: Transkription, Magic Clips

Das stellt Riverside nämlich automatisch bereit, nur kurze Zeit nach Fertigstellung der Aufnahme, zusammen mit allen lokal aufgezeichneten Audio- und Videodateien.

In diesem Transkript kannst du den Text dann durchsuchen, nach Stellen / Passagen, die du nachträglich löschen oder verschieben möchtest.

Und löschst sie eben oder verschiebst sie gleich im Text, statt in der Videospur. Das erledigt Riverside dann für dich automatisch, passend zum geänderten Text.

Und mit derselben Philosophie "Wir machen das für dich" gibt es dazu noch den Button "Magic Clips".

Sagen wir, du hast eben 30, 40 oder 50 Minuten Footage aufgenommen, dann genügt wirklich ein einziger Klick und nach einigen Minuten Wartezeit hat der Riverside-Automat aus diesem Material 5, 6 oder 7 Clips erstellt, jeweils rund eine Minute lang.

Als Ausschnitte aus deinem Original-Material, die du für YouTube Shorts, Tiktok oder Instagram Reels einsetzen kannst. Sogar noch einstellen und dekorieren kannst, mit diversen Optionen, Text-Einblendungen, Hintergrundfarbe und dergleichen.

Sehr, sehr praktisch und vor allem: schnell erledigt.

Auch wenn die Riverside-KI nicht immer wirklich zielsicher aussucht, was sie für deine besten, clickbait-igsten Ausschnitte hält.

Du kannst ja immer noch auswählen und von Hand eingreifen, z.B. Anfang und Ende feineinstellen usw.

Fazit für heute: Riverside.fm ist das beste Sprungbrett, vom Audio- zum Video-Podcast, vom lokalen Studio zum Remote Recording via Internet

Wenn du – wie wir – von heute auf morgen einen YouTube Video-Podcast auf die Beine stellen willst, dann ist Riverside.fm das perfekte Sprungbrett fürs kalte Wasser.

Egal, ob du alleine aufnimmst oder bis zu 7 weitere Beteiligte dabei haben willst.

Riverside ist ein rundes Paket, das dir automatisch so viel Gefrickel wie möglich abnimmt, erst mal, bis du Schritt für Schritt lernst, es auf eigene Faust, mit speziellen Tools und besserem Equipment, Knowhow und Erfahrung auf das nächste Level zu hieven. So dass du dich / ihr euch auf das Wesentliche konzentrieren könnt: was du / ihr zu sagen habt, den Content, wie ihr ihn präsentiert und vor allem: was ihr in den Socials, per SEO und vielleicht sogar via bezahlter Ads für die Promotion tun könnt, um für Bekanntheit und Verbreitung zu sorgen, für die Distribution.

Im Vergleich zu klassischen Diensten für Videokonferenzen per Google Meet, Zoom, Webex und dergleichen bietet Riverside ein überragendes Preis / Leistungsverhältnis, wenn man alle Komponenten berücksichtigt, die man auf einen Schlag an die Hand bekommt.

Und verglichen mit einem klassischen Dienst für die Verteilung als Audio-Podcast wie z.B. BuzzSprout frage ich mich, wie lange es dauert, bis Riverside diese Funktionalität einfach übernimmt und integriert und damit ein noch runderes Paket anbieten kann.

Da fehlt aus meiner Sicht wirklich nicht viel und Bumm! guckt so mancher der alteingessenen Dienstleister fürs Podcast Hosting ziemlich schräg aus der Wäsche.

Und Google bzw. YouTube hat erst mal noch alle Hände voll zu tun, endlich mal richtig mit Podcasts umzugehen, wie in der letzten Episode hier im Podcast schon angesprochen. Die haben also keine Zeit, so tief in die Details zu steigen.

Das ist die Chance für Riverside, sich bei den Content Creator:innen noch mehr als Standard-Plattform festzusetzen.

Es bleibt spannend. Und wir dürfen dabei sein!

In diesem Sinne

Bis nächsten Montag

Vielen vielen Dank mal wieder fürs Zuhören.

Freut mich jedes Mal, wenn du dabei bist.

Was immer du aus der heutigen Episode mitnimmst:

fragwolfram@wolframklaeger.com

Und du musst nicht mal Angst haben, dass ich dich hier namentlich nenne, jedenfalls nicht ohne dein Einverständnis, oder du vielleicht sogar hier auftreten musst, hier im Podcast.

Nur: wenn!

Gesetzt den Fall!

Du hättest!

Womöglich!

Sogar Spass daran!

Hier per Riverside.fm ein Interview mit mir aufzuzeichnen?!

Sag Bescheid und wir machen das!

Und schon machst du deine eigene, persönliche Erfahrung, wie das läuft, so eine Remote Recording Session über Internet, mit allem Zipp und Zapp.

Anyhow: bis dahin alle Grüsse, Ciao Ciao, Dein Wolfram und PEACE!