JM BudoAcademy

CONTENT-PIPELINE

JM BudoAcademy

Aus einem Video-Mitschnitt entsteht in einem einzigen Lauf ein veröffentlichungsfähiger, zweisprachiger CMS-Eintrag — inklusive polierter Transkripte, übersetzter Metadaten und passender Vorschaubilder.
Pattern Bilinguale Content-Pipelines
  • Python 3.12
  • Google Gemini
  • OpenAI Whisper

DIE AUSGANGSLAGE

Die Ausgangslage

Eine Kampfkunst-Akademie veröffentlicht regelmäßig Videos auf ihrer Website — auf Deutsch und Englisch, mit lesbaren Transkripten, eigenen Vorschaubildern, sauberen Metadaten und angeschlossener CMS-Pflege. Pro Video bedeutete das vor der Automatisierung: YouTube-Transkript holen oder MP4 transkribieren, manuell glätten, übersetzen, Vorschaubild gestalten, alles im Headless-CMS einpflegen, Kategorien und Tags setzen.

Das ist nicht nur „ein bisschen Nacharbeit" — sondern bindet einen nennenswerten Teil der wöchentlichen Redaktionszeit. Und mit wachsendem Videoarchiv keine Aufgabe, die sich auf Dauer nebenher erledigt.

WAS WIR GEBAUT HABEN

Was wir gebaut haben

Ein eigenständiges Python-Tool, das den kompletten Workflow vom Quellvideo bis zum CMS-Eintrag automatisiert — in klar getrennten Phasen, mit menschlichem Review vor der finalen Freigabe.

Die sechs Phasen

  1. Transkript ziehen — bei YouTube über die offizielle Transcript-API, bei lokalen MP4-Dateien über Whisper (lokal auf dem eigenen Rechner, keine Cloud-Übertragung des Audiomaterials).
  2. Transkript polieren — Gemini glättet Fülllaute, korrigiert Erkennungsfehler und strukturiert den Rohtext in lesbare Absätze.
  3. Bilingual übersetzen — DE/EN-Übersetzung inklusive Titel, Beschreibung, Slug und Tags.
  4. Szenenbild extrahieren — höchstaufgelöstes YouTube-Thumbnail oder ein ffmpeg-Frame aus dem MP4 als Bildreferenz für den nächsten Schritt.
  5. Vorschaubilder generieren — Gemini Nano Banana Pro erzeugt auf Basis des Szenenbilds zwei sprachspezifische Preview-Images mit Titel-Overlay und konsistentem Marken-Look.
  6. In Directus hochladen — Bilder ins File-Repository, Video-Entität mit allen Metadaten in die richtige Sammlung.

Zwei Bedienformen, ein Pipeline-Kern

Sowohl die CLI für Stapelläufe als auch die Weboberfläche teilen sich denselben Code. Die Web-UI führt durch einen Drei-Schritt-Wizard:

  • Eingabe — Quell-URL oder Dateipfad, Thema, Kategorie, Schwierigkeitsgrad.
  • Verarbeitung — automatisierte Pipeline mit Live-Fortschrittsanzeige je Phase.
  • Review — seitliche DE/EN-Ansicht für Titel, Beschreibung, Slug, Tags und Vorschaubilder, mit eigenem „Bild neu generieren"-Button pro Sprache und ausklappbaren Transkript-Editoren.

Was die Redaktion im Review ändert, landet auch im CMS — nicht das KI-Rohergebnis. Damit ist die menschliche Kontrolle nicht nur Theater, sondern strukturell verankert.

WAS WIR DAMIT ERREICHEN

Was wir damit erreichen

  • Aus stundenlanger Detailarbeit wird ein kurzer Review. Die wiederkehrenden Schritte — Transkript säubern, übersetzen, Bilder bauen, hochladen — passieren automatisch im Hintergrund.
  • Beide Sprachversionen entstehen parallel. Kein „erst Deutsch, später vielleicht Englisch" mehr.
  • Bildsprache bleibt konsistent. Ein Prompt-Template mit Marken-Vorgaben sorgt dafür, dass die Vorschaubilder als Reihe erkennbar bleiben — unabhängig davon, wer gerade bedient.
  • Daten bleiben dort, wo sie hingehören. Lokale Videos werden mit Whisper auf dem eigenen Rechner transkribiert; nur die polierten Texte gehen an die Sprach-API.

WAS BEWUSST NICHT AUTOMATISIERT WURDE

Was bewusst nicht automatisiert wurde

  • Die finale Freigabe. Das Tool ersetzt keinen Review — es bereitet vor.
  • Die kreative Eingangsentscheidung zu Thema, Kategorie und Schwierigkeitsgrad. Diese Eingaben kommen weiterhin von Hand.
  • Faktencheck bei Personen-Nennungen. Wer in den Videos genannt wird, prüft die Person, die das Themengebiet kennt.

WARUM DIESES MUSTER ÜBERTRAGBAR IST

Warum dieses Muster übertragbar ist

Der Aufbau funktioniert überall, wo wiederkehrend bilinguale Inhalte aus Audio- oder Videoquellen entstehen: Schulungsvideos, Interview-Reihen, Vortragsmitschnitte, Podcast-Begleittexte, Webinar-Aufzeichnungen.

Das Muster: Quelle → KI-Verarbeitung in Phasen → menschlicher Review-Schritt → CMS-Anbindung.

Die KI übernimmt die mühsamen 80 % der Routine. Die kreative und qualitätssichernde 20 % bleiben beim Menschen — dort, wo sie hingehören.

Sprechen Sie uns an

Zwei Türen, eine Adresse.

Konkreter Engpass?

Lassen Sie uns 30 Minuten über Ihren Use Case sprechen.

Unverbindlich, kostenlos, mit konkreten Vorschlägen am Ende.

30-Min-Gespräch buchen

Eigene KI-Plattform?

Sehen Sie CompanyWizard live in Aktion.

Demo mit Ihren eigenen Daten möglich. Wir bringen die Pseudonymisierung schon eingerichtet mit.

Demo anfragen