Skip to content

makr-code/PodcastForge-AI

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

48 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

🎙️ PodcastForge AI

Python 3.8+ License: MIT Powered by Ollama

KI-gestützter Podcast-Generator mit Ollama LLMs und ebook2audiobook TTS

Generiere professionelle Podcasts vollautomatisch: Von der Idee bis zur fertigen Audio-Datei - alles mit einem Befehl!

✨ Features

  • 🤖 KI-Drehbucherstellung mit Ollama (Llama2, Mistral, etc.)
  • 🎙️ Natürliche Sprachsynthese mit ebook2audiobook und XTTS
  • 👥 Multi-Speaker Support - 21+ professionelle Stimmen für jeden Sprecher
  • 🇩🇪 11 deutsche Stimmen - Moderatoren, Experten, Erzähler und mehr
  • 🎨 8 Podcast-Stile - Interview, Diskussion, News, Comedy, Dokumentar, etc.
  • 🎚️ 4 Qualitätsstufen - Von schneller Vorschau bis Studio-Qualität
  • 🚀 Schnellstart-Workflow - Ein Befehl genügt für professionelle Podcasts
  • 🎚️ Audio-Nachbearbeitung - Normalisierung, Kompression, Hintergrundmusik
  • 🐳 Docker Support - Einfaches Deployment
  • 🌍 Mehrsprachig - Deutsch, Englisch und viele weitere Sprachen
  • 🔒 100% Lokal - Keine Cloud-APIs, vollständige Privatsphäre

🚀 Schnellstart

Installation

# Repository klonen
git clone https://github.com/makr-code/PodcastForge-AI.git
cd PodcastForge-AI

# Automatisches Setup
chmod +x setup.sh
./setup.sh

# Oder manuell
python3 -m venv venv
source venv/bin/activate
pip install -r requirements.txt
pip install -e .

# Ollama installieren
curl -fsSL https://ollama.ai/install.sh | sh
ollama pull llama2

Ersten Podcast generieren

# 🧙 Interaktiver Assistent (empfohlen für Einsteiger)
podcastforge wizard

# 🚀 Schnellstart - Ein Befehl genügt!
podcastforge quick --topic "Künstliche Intelligenz im Alltag"

# Mit Stil-Auswahl
podcastforge quick --topic "Klimawandel" --style interview

# Erweiterte Optionen
podcastforge generate \
    --topic "Klimawandel und Nachhaltigkeit" \
    --style discussion \
    --duration 15 \
    --llm mistral \
    --language de \
    --output mein_podcast.mp3

Systemstatus prüfen

# Alle Komponenten auf einen Blick
podcastforge status

# Detaillierte Installation testen
podcastforge test

Verfügbare Podcast-Stile anzeigen

# Alle Vorlagen mit empfohlener Dauer und Sprecheranzahl
podcastforge templates

# Qualitätsstufen anzeigen
podcastforge quality

Mit Python

from podcastforge import PodcastForge, PodcastStyle

# Initialisieren
forge = PodcastForge(llm_model="llama2", language="de")

# Podcast erstellen
podcast = forge.create_podcast(
    topic="Die Zukunft der Elektromobilität",
    style=PodcastStyle.INTERVIEW,
    duration=15,
    output="podcast.mp3"
)

📚 Podcast-Stile

  • Interview - Fragen und Antworten zwischen Host und Gast
  • Discussion - Lebhafte Diskussion mit mehreren Teilnehmern
  • Educational - Lehrreicher Dialog mit Erklärungen
  • News - Nachrichtenbeitrag mit Moderator und Experten
  • Narrative - Erzählende Geschichte mit Dialogen
  • Comedy - Humorvoller Dialog mit Witzen
  • Debate - Strukturierte Debatte mit Pro/Contra

🎭 Custom Sprecher

from podcastforge import Speaker

speakers = [
    Speaker(
        id="host",
        name="Max",
        role="Moderator",
        personality="freundlich, neugierig, professionell",
        voice_profile="de_male_1",
        gender="male"
    ),
    Speaker(
        id="expert",
        name="Dr. Anna Schmidt",
        role="Expertin",
        personality="kompetent, enthusiastisch",
        voice_profile="de_female_1",
        gender="female"
    )
]

forge.create_podcast(
    topic="Quantencomputer einfach erklärt",
    speakers=speakers,
    duration=20
)

🐳 Docker

# Mit Docker Compose
docker-compose up -d

# Podcast generieren
docker-compose exec podcastforge generate \
    --topic "Dein Thema" \
    --duration 10

🖥️ CLI Referenz

Alle verfügbaren Befehle

# 🧙 Interaktiver Assistent (Kurzform: w)
podcastforge wizard       # Schritt-für-Schritt-Anleitung

# 🔍 Systemstatus prüfen (Kurzform: s)
podcastforge status       # Alle Komponenten auf einen Blick
podcastforge info         # Projektinformationen

# 🚀 Schnellstart (Kurzform: q)
podcastforge quick --topic "Dein Thema" --style interview

# 📋 Vorlagen anzeigen (Kurzform: t)
podcastforge templates    # Alle Podcast-Stile mit Sprecheranzahl und Dauer

# 🎚️ Qualitätsstufen anzeigen
podcastforge quality      # Von Preview bis Ultra-Qualität

# 🖊️ GUI Editor starten (Kurzform: e)
podcastforge edit [datei]              # Neues Projekt oder vorhandene Datei öffnen

# 🎙️ Podcast generieren (Kurzform: g)
podcastforge generate \
    --topic "Thema" \
    --style discussion \
    --duration 15 \
    --llm mistral \
    --language de \
    --output podcast.mp3

# Aus vorhandenem Skript generieren
podcastforge from-script script.json --output podcast.mp3

# 🎤 Voice Library durchsuchen (Kurzform: v) - 21+ Stimmen!
podcastforge voices \
    --language de \
    --gender female \
    --style professional

# TTS-Test durchführen
podcastforge test

# Verfügbare Ollama Models anzeigen
podcastforge models

📖 Dokumentation

🛠️ Architektur

podcastforge/
├── core/              # Kern-Logik
│   ├── forge.py      # Hauptklasse
│   └── config.py     # Konfiguration
├── llm/              # LLM-Integration
│   └── ollama_client.py
├── tts/              # Text-to-Speech
│   └── ebook2audiobook_adapter.py
├── audio/            # Audio-Processing
│   └── postprocessor.py
└── cli.py            # Command Line Interface

🤝 Contributing

Beiträge sind willkommen! Siehe CONTRIBUTING.md

# Development Setup
make install-dev

# Tests
make test

# Code-Formatierung
make format

# Linting
make lint

📋 Roadmap

  • Ollama LLM Integration
  • Multi-Speaker Support
  • Docker Support
  • Voice Cloning mit eigenen Stimmen
  • Batch-Processing für Podcast-Serien (Script Orchestrator)
  • Timeline Editor
  • Multitrack Editor
  • 4 TTS Engines (XTTS, Bark, Piper, StyleTTS2)
  • Web-Interface (Gradio/Streamlit)
  • RSS-Feed Integration für News-Podcasts
  • Real-time Streaming (FFmpeg Pipe teilweise implementiert)
  • Cloud-Deployment (AWS/GCP)

📄 Lizenz

MIT License - siehe LICENSE

🙏 Credits

📞 Support

⭐ Star History

Wenn dir das Projekt gefällt, gib uns einen Stern! ⭐


Erstellt mit ❤️ von makr-code | November 2025

About

No description, website, or topics provided.

Resources

License

MIT, Unknown licenses found

Licenses found

MIT
LICENSE
Unknown
license.md

Contributing

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors