Scriptbeispiel: Einzeltranskription inkl. Übersetzung

Code als *.py speichern und mit dem Anaconda-Prompt aufrufen.

# Einzelabfrage
import os

# Dateinamen in der Konsole abfragen
file_name = input("Geben Sie den Dateinamen (mit Erweiterung, z.B. video.mp4) ein: ")

# Überprüfe, ob der Dateiname Leerzeichen enthält
if ' ' in file_name:
    # Wenn der Dateiname Leerzeichen enthält, füge Gänsefüßchen hinzu
    quoted_file_name = f'"{file_name}"'
else:
    # Ansonsten lasse den Dateinamen unverändert
    quoted_file_name = file_name

# Überprüfe, ob eine TXT-Datei mit demselben Namen im Ordner "transkrip" existiert
if not os.path.exists(f"transkrip/{os.path.splitext(file_name)[0]}.txt"):
    # Führe die Whisper-Befehle aus und verwende den zitierten Dateinamen
    command = f"whisper {quoted_file_name} --output_dir transkrip"
    os.system(command)
    command = f"whisper {quoted_file_name} --output_dir transl --task translate"
    os.system(command)
else:
    print(f"Datei {file_name} wurde übersprungen, da bereits eine TXT-Datei im Ordner 'transkrip' existiert.")

# Ordnerabfrage
import os

# Ordnerpfad in der Konsole abfragen
folder_path = input("Geben Sie den Pfad des Ordners ein: ")

# Überprüfe, ob der Ordner existiert
if not os.path.exists(folder_path):
    print(f"Der angegebene Ordner '{folder_path}' existiert nicht.")
else:
    # Durchsuche den Ordner nach MP4-Dateien
    for file_name in os.listdir(folder_path):
        if file_name.endswith('.mp4'):
            # Überprüfe, ob der Dateiname Leerzeichen enthält
            if ' ' in file_name:
                # Wenn der Dateiname Leerzeichen enthält, füge Gänsefüßchen hinzu
                quoted_file_name = f'"{os.path.join(folder_path, file_name)}"'
            else:
                # Ansonsten lasse den Dateinamen unverändert
                quoted_file_name = os.path.join(folder_path, file_name)
            
            # Überprüfe, ob eine TXT-Datei mit demselben Namen im Ordner "transkrip" existiert
            if not os.path.exists(f"transkrip/{os.path.splitext(file_name)[0]}.txt"):
                # Führe die Whisper-Befehle aus und verwende den zitierten Dateinamen
                command = f"whisper {quoted_file_name} --output_dir transkrip"
                os.system(command)
                command = f"whisper {quoted_file_name} --output_dir transl --task translate"
                os.system(command)
            else:
                print(f"Datei {file_name} wurde übersprungen, da bereits eine TXT-Datei im Ordner 'transkrip' existiert.")



Wie kann ich eine saubere Transkriptionslösung (KI) bei mir installieren und in das Tagesgeschäft einbauen? (Whisper – OpenAI)

Vorraussetzung: installiertes Python oder Anaconda.

  1. Anaconda-Prompt starten
  2. pip install -U openai-whisper
  3. pip install setuptools-rust
  4. FFmpeg installieren (Anleitung: https://www.geeksforgeeks.org/how-to-install-ffmpeg-on-windows/)
  5. Anaconda-Prompt zu und im Administrator-Modus starten
  6. setx /m PATH „C:\ffmpeg\bin;%PATH%“ da eintragen und bestätigen

Befehle für für diese Lösung

  1. whisper datei.mp4 –model medium
  2. whisper datei.mp4 –model large
  3. whisper datei.mp4 –device cuda –task translate

Vorteil: diese Offline-KI-Lösung erkennt die Sprache automatisch und beinhaltet eine optionale Übersetzungsfunktion. Stapeltranskriptionen lassen sich mittels eigener Scripte lösen und für 20 Minuten Videotranskript inkl. Übersetzung werden etwas um die 2 Minuten benötigt.

Weiter lesen: https://github.com/openai/whisper

Wie kann ich eine saubere ÜbersetzungsKI bei mir installieren, bedienen und in das Tagesgeschäft implementieren?

Viele Anwendungsfälle und diverse aktuelle Datensicherheitsdebatten zwingen zur Prüfung selbstgehosteter Systeme und wir verwenden „Argos-Translate“ für 2 Szenarien:

(A) Einzelübersetzungen

(B) Stapelübersetzungen: große Datenbanken und Dokumente (DocX, PPTX etc.)

Installation:

Vorraussetzung: installiertes Python oder Anaconda.

Installationsweg bei der Anaconda-Variante

  1. Anaconda Prompt starten
  2. pip install argostranslate // -> Kernsystem
  3. pip install argostranslategui // -> GUI
  4. pip install argos-translate-files // -> Übersetzungssystem für Dateien
  5. Rechtsklick auf Desktop + Neu -> Verknüpfung + „%windir%\System32\cmd.exe „/K“ C:\Users\user\anaconda3\Scripts\activate.bat C:\Users\user\anaconda3″ (User entsprechend austauschen) eintragen und alles bestätigen // -> Anaconda-Prompt
  6. (5) wiederholen und da „%windir%\System32\cmd.exe „/K“ C:\Users\user\anaconda3\Scripts\activate.bat C:\Users\user\anaconda3 && python c:\users\user\anaconda3\scripts\argos-translate-gui “ eintragen (User entsprechend austauschen)
  7. Die Anaconda-GUI starten.
  8. In der GUI auf „Manage Packages“ klicken und alle Sprachdateien downloaden + installieren (der Installprozess läuft automatisch)

Wenn alles fertig ist, lassen sich Texte problemlos über die GUI übersetzen. Die Qualität ist „nahebei“ Deepl und wir haben das System auf die Sprachrichtungen RU -> EN, RU -> DE getestet. Spannend sind auch FS -> EN.