Software per la trascrizione dell’audio manuale (parlato, interviste, ecc.)

Esiste un software che supporti la trascrizione manuale del contenuto da file audio (come ogg, mp3) in testo?

Quando devi trascrivere, cioè digitare, i contenuti che provengono da un file audio, lo si desidera

  • essere in grado di controllare l’audio (interrompere, mettere in pausa, riprodurre) tramite la tastiera mentre si digita il testo (in modo da non dover lasciare l’editor di testo e passare a un’applicazione audio per fare proprio questo).
  • Si potrebbe anche voler regolare la velocità dell’audio (per accelerare il parlato lento e rallentare il parlato troppo veloce).
  • Si desidera che la posizione dell’audio si riavvolga un po ‘quando si continua la riproduzione audio, per essere sicuri di non aver perso nulla.

Ho scoperto che un software chiamato transcribe ( launchpad ) fornisce la soluzione che stavo cercando.

Digitare il testo in un editor di testo durante la trascrizione riproduce il file audio in un’altra finestra. Per mettere in pausa o continuare la riproduzione audio, si utilizza qualsiasi scelta rapida da tastiera configurata per l’audio a livello di sistema nelle impostazioni di sistema. Io uso F7 per mettere in pausa, F8 per continuare.

* trascrizione * riproduzione audio mentre * gedit * viene utilizzato per trascrivere la sintesi vocale

Per installare trascrivi :

Innanzitutto, devi aggiungere un PPA:

sudo add-apt-repository ppa:frederik-elwert/transcribe sudo apt-get update 

Quindi puoi installarlo:

 sudo apt-get install transcribe 

Avevo bisogno di una soluzione multipiattaforma da utilizzare nel mio laptop (linux) e nel mio pc office (win xp) e ho deciso di crearne una mia:

Si chiama “Poor Man’s Translator” e può essere trovato qui .

Il software di riconoscimento vocale automatico normalmente riduce le esigenze di trascrizione manuale. Ma la tecnologia di riconoscimento vocale automatica non è ancora matura per produrre una trascrizione accurata per gli accenti non americani, o con persone che parlano velocemente o più file audio con altoparlanti. Se hai più di una voce è quasi imansible ottenere una buona trascrizione. Aggiungete a ciò qualsiasi rumore di fondo o una registrazione debole e potete quasi dimenticarlo.

Quindi, dopo la trascrizione automatica, devi massaggiare questa trascrizione nella forma finale. Alcuni dei massaggi sono

Correggere correttamente le parole / frasi trascritte. Punteggiatura corretta / interruzioni di frase. Definisci le interruzioni di paragrafo.

Per la trascrizione automatica, è ansible fare riferimento

http://audacity.sourceforge.net/

In questo scenario, meglio andare per la trascrizione manuale. Per una trascrizione manuale accurata ed economica, è ansible consultare: Servizi di trascrizione Synergy per la trascrizione dell’audio manuale

Elenco dei programmi di trascrizione

C’è questo elenco completo di software di trascrizione:

 Name Main category Second category Platform License form ---------------------------------------------------------------------------------- Anvil Transcription Linux, Mac Open Source casualtranscriber Transcription Mac Freeware EasyTranscript Transcription Linux, Mac, Win Open Source ELAN Transcription Linux, Mac, Win Open Source EXMARaLDA Transcription Linux, Mac, Win Open Source Express Scribe Transcription Mac Commercial F4/F5 Transcription Mac, Win Commercial f4analyse QDA Transcription Linux, Mac, Win Commercial Feldpartitur Transcription QDA Web Commercial Folker Transcription Win Free HyperTranscribe Transcription Mac Commercial inqscribe Transcription Mac, Win Commercial MEPA QDA Transcription Win Freeware Multitool Transcription Mac, Win Open Source pmTrans Transcription Linux, Mac, Win Open Source Praat Transcription Linux, Mac, Unix, Win Open Source Sonal QDA Transcription Win Freeware SoundScriber Transcription Win Open Source Transana QDA Transcription Mac, Win Commercial Transcribe Transcription Linux Open Source TranscriberAG Transcription Linux, Mac, Win Open Source Transcriva Transcription Mac Commercial trAVis Transcription Web Free xtrans Transcription Linux, Win Open Source 

E un’altra lista sul wiki di Ubuntu in tedesco con le istruzioni su come usare Audacious e VLC con i tasti di scelta rapida globali insieme a un editor di testo di tua scelta.


Personalmente uso smplayer (un front-end grafico per mplayer), dove puoi premere un tasto della tastiera per cambiare la velocità di riproduzione, spostarti indietro e avanzare facilmente in tre diversi passaggi (il default è 10 secondi, 1 minuto e 10 minuti penso , che potrebbe essere facilmente modificato per es. 2 sec, 5 sec e 30 sec).

Il giocatore è cross-plattform e software libero (GPL).

Come editor uso Vim con il controllo ortografico.

Playitslowly Installa playits lentamente

Questo software piacevole e leggero mira a modificare la velocità di riproduzione dei file registrati, ma ha anche delle funzioni utili per la trascrizione. Per maggiori dettagli e uno screenshot vedi:

  • Giocatore per impostare i tasti di scelta rapida per un salto avanti / indietro di 1 secondo?

Prova TranscriberAG . Ha bisogno di essere compilato e il processo potrebbe non essere semplice, ma puoi provare con questa versione non ufficiale o inviare un messaggio alla mailing list del progetto per ottenere aiuto.

Come già accennato, una seconda opzione è Evidence Bucket , con meno funzioni ma molto facile da avviare (è scritto in Java). Può essere utilizzato anche con un word processor esterno, perché ha scorciatoie da tastiera globali.

Una terza opzione potrebbe essere installare Wine e, se necessario, PlayOnLinux e utilizzare le versioni gratuite di software Windows come Inqscribe , Express Scribe , ecc.

ExpressScribe è abbastanza buono e la versione gratuita funziona bene. È per Windows ma funziona bene su Wine.

http://www.nch.com.au/scribe/

Dopo essermi frustrato con tutta la comunità Linux che aveva da offrire, nel modo di trascrizione, sono andato sul sentiero per copiare Express Scribe. Questo è auto-promozionale, quindi se ti piace il mio software, l’ho fatto :). Il mio programma viene eseguito in background. È una finestra semplice che mostra “Hello World”, ma funziona come Express Scribe in quanto ascolta le combinazioni di tasti da te e controlla l’audio di conseguenza. Sei libero di usare qualunque programma di documenti desideri.

controlli:

F2 è play / pause. F4 riavvolge 3 secondi.

Potrei portare avanti il ​​programma ulteriormente, se c’è abbastanza grido ma in questo momento non ho bisogno di farlo.

Sarà necessario installare Python3 e Pyglet (minimo). Se si desidera gestire formati crittografati e compressi, è necessario installare Avbin.

Il progetto può essere trovato qui: https://github.com/ki4jgt/Transkripshun

Prova Parlatype, riavvolgi in pausa e molto altro

inserisci la descrizione dell'immagine qui

http://gkarsay.github.io/parlatype/