Ce site est optimisé pour être consulté depuis un navigateur moderne dans lequel JavaScript est activé.

traducteur vocal instantané anglais/Français

clint4162

Bonsoir à tous,
Existe-t-il un logiciel ou une application compatibles sous ubuntu, qui permettrait une traduction vocale en instantané à partir d'un PC ?
( le but, pouvoir suivre des exposés ou conférences déclinées en langue anglaise sur le net à partir d'un PC)
Je n'ai rien trouvé sur le forum à ce sujet, et mes amis du CERCLL, n'ont pas la solution.
Sinon la solution, quelques pistes seraient bienvenues.
A l'avance , merci pour votre aide.

LeoMajor

bonjour,

en gros, installer espeak espeak-data libespeak1 mbrola mbrola-fr1 mbrola-fr4 translate-shell

tu peux en avoir un petit aperçu en utisant la souris (click ~~droit~~ gauche et sélectionner un texte sur une page web)
à améliorer

unset now after; while true; do now=$(xclip -o); if [ "x$now" != "x$after" ]; then trad=$(trans -b -t fr "$now"); notify-send "$trad"; espeak  -v  mb/mb-fr1 "$trad" --punct="."; fi; sleep 5; after="$now"; done

si le site web est ciblé en particulier, tu peux utliliser lynx -dump https://www.thetimes.co.uk

il y a d'autres solutions. regarde la doc.

clint4162

Bonsoir LéoMajor,

Je viens de prendre connaissance de ta réponse concernant mon sujet : " traduction vocale instantanée", ( je commençais à désespérer , + de 252 visites ! et le black out! ).

Je tiens donc à te remercier sincèrement pour ton aide et les solutions que tu proposes.

Je vais tester rapidement ces pistes, et ferais un retour, qui je l'espère, sera positif.

Bonne soirée
Clint4162

adhara

Bonjour,
J'ai testé la solution de LeoMajor, elle est bien.
Librement.
Adhara

clint4162

Les solutions proposées par LéoMajor sont intéressantes uniquement pour de la traduction texte en vocal

Mais ne répondent pas à la question initiale qui était:

Existe-t-il un logiciel ou une application compatibles sous ubuntu, qui permettrait une traduction vocale en instantané pour suivre des exposés ou conférences déclinées en langue anglaise sur le net.

La question est donc toujours d'actualité.

fernand1

Sur android via play store il y a l'application interprète traducteur vocal (audio et écrit)
Mais là on s'écarte de ubuntu.

clint4162

Bonjour ,
Merci pour cette indication fernand1,
Je vais tester pour vérifier si cette application répond pleinement à la question initiale, que j'ai reformulée hier pour plus de précision.

clint4162

Vérification faite, l'application interprète traducteur vocal sur android via play store est un traducteur de texte,et ne répond pas à la question .

Le sujet: traduction vocale en instantané permettant de suivre des exposés ou conférences déclinées en langue anglaise sur le net.

LeoMajor

il te manque principalement la partie 1
0/ audio file
1/ Speech-To-Text (stt) from audio file; vocal anglais -> texte anglais
2/ traduction; c'est translate-shell ; texte anglais --> texte français
3/ Text-To-Speech (tts); espeak ou équivalent; texte français -> vocal français

0/ audio file
example: Le discours de Greta Thunberg à l'ONU , https:... www.youtube.com/watch?v=W4e5l-XUmfI
L'avantage est que son discours est complètement sous-titré. Pas de voix parasites type interview.

youtube-dl -f bestaudio -x --audio-format flac https://www.youtube.com/watch?v=W4e5l-XUmfI

conversion en 16000 Hz

ffmpeg -i Le\ discours\ de\ Greta\ Thunberg\ à\ l\'ONU-W4e5l-XUmfI.flac -ar 16000 -ac 1 target.wav"

durée

duree=$(ffmpeg -i target.wav 2>&1 | awk 'BEGIN{FS=":"; FPAT="[0-9:]+"}; /Duration/{nf=split($2,p,/:/); print p[1]*3600+p[2]*60+p[3] }') 
echo "$duree"
255

1/ transcription (Speech-To-Text) vocal anglais -> texte anglais

trans=$(python3 ~/scripts/audio_transcribe.py ~/tmps/target.wav)

NB: pour les gros fichiers wav, il faut les segmenter en plusieurs petits fichiers (split) . Normalement, l'api google fonctionne pour des fichiers de qq minutes de paroles (synchrone)

audio_transcribe.py ( ref SpeechRecognition / Transcribe an audio file )

#!/usr/bin/env python3
import os, sys
import speech_recognition as sr

# obtain path to "english.wav" in the same folder as this script
from os import path
# AUDIO_FILE = path.join(path.dirname(path.realpath(__file__)), "english.wav")
# AUDIO_FILE = path.join(path.dirname(path.realpath(__file__)), "french.aiff")
# AUDIO_FILE = path.join(path.dirname(path.realpath(__file__)), "chinese.flac")
#AUDIO_FILE = path.join(path.dirname(path.realpath(__file__)), sys.argv[1])
AUDIO_FILE = os.path.realpath(sys.argv[1])

# use the audio file as the audio source
r = sr.Recognizer()
with sr.AudioFile(AUDIO_FILE) as source:
    audio = r.record(source)  # read the entire audio file

# recognize speech using Google Speech Recognition
try:
    # for testing purposes, we're just using the default API key
    # to use another API key, use `r.recognize_google(audio, key="GOOGLE_SPEECH_RECOGNITION_API_KEY")`
    # instead of `r.recognize_google(audio)`
    print(r.recognize_google(audio))
except sr.UnknownValueError:
    print("Google Speech Recognition could not understand audio")
except sr.RequestError as e:
    print("Could not request results from Google Speech Recognition service; {0}".format(e))

dépendances

sudo apt/aptitude install  python3-pip python3-pyaudio 
sudo -H pip3 install SpeechRecognition

2/ traduction via translate-shell : texte anglais -> texte français

trad=$(trans -t fr -b "$trans")

3/Text-To-Speech (tts); espeak ou équivalent; texte français -> vocal français

killall espeak; nohup espeak -v mb/mb-fr1 -s 100 --punct="." "$trad" 2>/dev/null & yad  --title "traduction" --timeout="$duree"  --autoclose --text "$trans\n\n$trad" || killall espeak

clint4162

Merci LeoMajor pour cette réponse très détaillée.
Je vais transmettre toutes ces indications à mes amis du Cerccl de Marseille pour la mise en application, car celà dépasse très largement mes compétences , (je suis sous ubuntu, que depuis un an , et je ne matirise pas suffisamment la technique.)
Au vu des éléments que tu as développés, j'ai l'impression que l'on est sur la bonne piste!
Retour assuré.
Cordialement