KI-gestützter Podcast-Generator mit Ollama LLMs und ebook2audiobook TTS
Generiere professionelle Podcasts vollautomatisch: Von der Idee bis zur fertigen Audio-Datei - alles mit einem Befehl!
- 🤖 KI-Drehbucherstellung mit Ollama (Llama2, Mistral, etc.)
- 🎙️ Natürliche Sprachsynthese mit ebook2audiobook und XTTS
- 👥 Multi-Speaker Support - 21+ professionelle Stimmen für jeden Sprecher
- 🇩🇪 11 deutsche Stimmen - Moderatoren, Experten, Erzähler und mehr
- 🎨 8 Podcast-Stile - Interview, Diskussion, News, Comedy, Dokumentar, etc.
- 🎚️ 4 Qualitätsstufen - Von schneller Vorschau bis Studio-Qualität
- 🚀 Schnellstart-Workflow - Ein Befehl genügt für professionelle Podcasts
- 🎚️ Audio-Nachbearbeitung - Normalisierung, Kompression, Hintergrundmusik
- 🐳 Docker Support - Einfaches Deployment
- 🌍 Mehrsprachig - Deutsch, Englisch und viele weitere Sprachen
- 🔒 100% Lokal - Keine Cloud-APIs, vollständige Privatsphäre
# Repository klonen
git clone https://github.com/makr-code/PodcastForge-AI.git
cd PodcastForge-AI
# Automatisches Setup
chmod +x setup.sh
./setup.sh
# Oder manuell
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
pip install -e .
# Ollama installieren
curl -fsSL https://ollama.ai/install.sh | sh
ollama pull llama2# 🧙 Interaktiver Assistent (empfohlen für Einsteiger)
podcastforge wizard
# 🚀 Schnellstart - Ein Befehl genügt!
podcastforge quick --topic "Künstliche Intelligenz im Alltag"
# Mit Stil-Auswahl
podcastforge quick --topic "Klimawandel" --style interview
# Erweiterte Optionen
podcastforge generate \
--topic "Klimawandel und Nachhaltigkeit" \
--style discussion \
--duration 15 \
--llm mistral \
--language de \
--output mein_podcast.mp3# Alle Komponenten auf einen Blick
podcastforge status
# Detaillierte Installation testen
podcastforge test# Alle Vorlagen mit empfohlener Dauer und Sprecheranzahl
podcastforge templates
# Qualitätsstufen anzeigen
podcastforge qualityfrom podcastforge import PodcastForge, PodcastStyle
# Initialisieren
forge = PodcastForge(llm_model="llama2", language="de")
# Podcast erstellen
podcast = forge.create_podcast(
topic="Die Zukunft der Elektromobilität",
style=PodcastStyle.INTERVIEW,
duration=15,
output="podcast.mp3"
)- Interview - Fragen und Antworten zwischen Host und Gast
- Discussion - Lebhafte Diskussion mit mehreren Teilnehmern
- Educational - Lehrreicher Dialog mit Erklärungen
- News - Nachrichtenbeitrag mit Moderator und Experten
- Narrative - Erzählende Geschichte mit Dialogen
- Comedy - Humorvoller Dialog mit Witzen
- Debate - Strukturierte Debatte mit Pro/Contra
from podcastforge import Speaker
speakers = [
Speaker(
id="host",
name="Max",
role="Moderator",
personality="freundlich, neugierig, professionell",
voice_profile="de_male_1",
gender="male"
),
Speaker(
id="expert",
name="Dr. Anna Schmidt",
role="Expertin",
personality="kompetent, enthusiastisch",
voice_profile="de_female_1",
gender="female"
)
]
forge.create_podcast(
topic="Quantencomputer einfach erklärt",
speakers=speakers,
duration=20
)# Mit Docker Compose
docker-compose up -d
# Podcast generieren
docker-compose exec podcastforge generate \
--topic "Dein Thema" \
--duration 10# 🧙 Interaktiver Assistent (Kurzform: w)
podcastforge wizard # Schritt-für-Schritt-Anleitung
# 🔍 Systemstatus prüfen (Kurzform: s)
podcastforge status # Alle Komponenten auf einen Blick
podcastforge info # Projektinformationen
# 🚀 Schnellstart (Kurzform: q)
podcastforge quick --topic "Dein Thema" --style interview
# 📋 Vorlagen anzeigen (Kurzform: t)
podcastforge templates # Alle Podcast-Stile mit Sprecheranzahl und Dauer
# 🎚️ Qualitätsstufen anzeigen
podcastforge quality # Von Preview bis Ultra-Qualität
# 🖊️ GUI Editor starten (Kurzform: e)
podcastforge edit [datei] # Neues Projekt oder vorhandene Datei öffnen
# 🎙️ Podcast generieren (Kurzform: g)
podcastforge generate \
--topic "Thema" \
--style discussion \
--duration 15 \
--llm mistral \
--language de \
--output podcast.mp3
# Aus vorhandenem Skript generieren
podcastforge from-script script.json --output podcast.mp3
# 🎤 Voice Library durchsuchen (Kurzform: v) - 21+ Stimmen!
podcastforge voices \
--language de \
--gender female \
--style professional
# TTS-Test durchführen
podcastforge test
# Verfügbare Ollama Models anzeigen
podcastforge models- Setup & Installation
- Editor Guide
- Voice Integration
- Architektur
- Dokumentations-Index
- Beispiele
- Copilot Introduction
(Kurzanleitung für automatisierte Assistenz; bitte bei automatischen Änderungen beachten) - Dokumentationspflicht / ToDo-Vorlage
podcastforge/
├── core/ # Kern-Logik
│ ├── forge.py # Hauptklasse
│ └── config.py # Konfiguration
├── llm/ # LLM-Integration
│ └── ollama_client.py
├── tts/ # Text-to-Speech
│ └── ebook2audiobook_adapter.py
├── audio/ # Audio-Processing
│ └── postprocessor.py
└── cli.py # Command Line Interface
Beiträge sind willkommen! Siehe CONTRIBUTING.md
# Development Setup
make install-dev
# Tests
make test
# Code-Formatierung
make format
# Linting
make lint- Ollama LLM Integration
- Multi-Speaker Support
- Docker Support
- Voice Cloning mit eigenen Stimmen
- Batch-Processing für Podcast-Serien (Script Orchestrator)
- Timeline Editor
- Multitrack Editor
- 4 TTS Engines (XTTS, Bark, Piper, StyleTTS2)
- Web-Interface (Gradio/Streamlit)
- RSS-Feed Integration für News-Podcasts
- Real-time Streaming (FFmpeg Pipe teilweise implementiert)
- Cloud-Deployment (AWS/GCP)
MIT License - siehe LICENSE
- DrewThomasson/ebook2audiobook - TTS Backend
- Ollama - Lokale LLMs
- Coqui TTS - Voice Synthesis
- 🐛 Issues
- 💬 Discussions
Wenn dir das Projekt gefällt, gib uns einen Stern! ⭐
Erstellt mit ❤️ von makr-code | November 2025