top of page

GUIDA: Convertire un video HARDSUB in un SOFTSUB

In questa guida voglio mostrarvi un metodo per convertire un video che ha i sottotitoli hardsub (ovvero impressi insieme alla traccia video, ovvero che non si possono disattivare), in un video con sottotitoli softsub, più nello specifico alla fine di questa guida otterrete un file di testo contenente i sottotitoli, la cui unione in un unico file è (ritenuta da me) inutile e per tanto dovrete seguire altri tutorial.


Prefazione

Avere a disposizione i soli file dei sottotitoli è, per me, ritenuto di vitale importanza in quanto è molto più facile da salvare offline ed è possibile, in futuro, utilizzare quei sottotitoli su RAW migliori (e magari senza censure là dove presenti nei video hardsub).

Molti fansubber (o molti titoli vecchi) non rendono disponibile la versione softsub delle loro release (per chissà quale motivo), questa guida serve per creare questi softsub partendo dagli hardsub.


Il processo vuole essere il più automatizzabile possibile e con il minor impiego di energie e tempo e sostanzialmente vede l'utilizzo di due software gratuiti e della tecnologia OCR ovvero un algoritmo che converte la scritta presente in una immagine in un testo modificabile.




PASSO 1: VideoSubFinder

Una volta che avete il vostro video hardsub, il primo programma da scaricare è VideoSubFinder, è un programma gratuito che potete scaricare qui: https://sourceforge.net/projects/videosubfinder/

Questo programma avrà lo scopo di generare una serie di "screenshot" delle singole frasi dei singoli sottotitoli ovvero: ha lo scopo di rilevare automaticamente i frame del testo hardcodato nel video e di salvare le informazioni riguardo al posizionamento temporale in cui quella frase si trova all'interno del video.


(1) Aprite il programma e cliccate su: FILE -> OPEN VIDEO (FFMPEG)

Forse dovete installare FFMPEG nel caso lo trovate qui: https://ffmpeg.org/


(2) Scegliete il video che volete utilizzare e poi con il mouse ridimensionate la finestra (le barre verticali e orizzontali che compaiono nella schermata di sinistra) dove il programma dovrà rilevare i sottotitoli.


Qui c'è il primo limite di questa procedura, ovvero che vi consiglio di trovare un punto in cui i sottotitoli sono divisi su due righe e di portare le due barre orizzontali in modo che evidenzino solamente quell'area, poiché il programma lavorerò meglio e più velocemente. TUTTAVIA questo comporta che se il testo è su 3 o più righe, parte del testo non verrà riconosciuto o se il sottotitolo è in altre parti dello schermo (per esempio in alto), quelle frasi verranno perse. Inoltre tutti i cartelli e altre scritte presenti in tutto il resto dello spazio non compreso tra le barre non verrà letto e non sarà presente nei softsub.


Seguendo questa guida, automatizzerete il 90% dei sottotitoli, ovvero i dialoghi "normali" ma dovrete ricreare a mano da zero tutto il resto, ovvero cartelli e eventuali sottotitoli che si trovano il alto nello schermo.


(3) Cliccare su "Run Search" e aspettate che abbia finito. (Potete aggiustare i "settings" per cercare di ottenere un migliore risultato ma io non ho mai capito come funzionassero e non ho ottenuto mai risultati abbastanza soddisfacenti che mi portassero a modificarli).


(4) Ora dovete andare nella cartella del programma e trovare la cartella chiamata "RGBImages" qui troverete il risultato del programma. Che dovrebbe essere una cosa del genere:


Qui dovete fare il lavoro più manuale e noioso dell'intera procedura ovvero ELIMINARE a mano tutte quelle immagini che non contengono testo (alle volte il programma non funziona bene e inserisce delle immagini senza il testo) oppure dove il sottotitolo è ripetuto (soprattutto nelle frasi più lunghe può essere che abbiate due immagini con lo stesso testo, nel caso eliminate la seconda). Per fare questo vi consiglio di aumentare al massimo la visualizzazione delle icone (VISUALIZZA -> ICONE MOLTO GRANDI) in questo modo sarete in grado di capire subito dove non c'è testo ed eliminare quelle immagini senza aprirle una ad una, e di attivare il RIQUADRO DI ANTEPRIMA e di spostarvi da una immagine all'altra con le freccette della tastiera cosi da vedere il contenuto senza aprire l'immagine e velocizzare il processo.


Ora dovreste trovarvi con questa cartella "RGBImages" contenete centinaia di immagini ma senza immagini duplicate o che non contengono testo.


PASSO 2: UIPath

Fatto questo dovete scaricare e installare il programma UIPath https://www.uipath.com/ è necessaria la registrazione sul sito ma il programma è gratuito.

Fatto questo scaricate l'automazione da me creata: (dovete registrarvi in questo sito per scaricarlo) DOWNLOAD


(1) Aprite la cartella e aprite il programma "HardsubToSoftsub"

Dovreste trovarvi una schermata del genere:


Ora dovete modificare le cartelle di input e di output.

(2) Dovete sostituire nella sezione "For Each", alla scritta "CARTELLA RGBImages" il percorso della vostra cartella "RGBImages" quella che trovate nella directory del programma VideoSubFinder che si è utilizzata alla fine del passo 1 (cliccando il bottone che vedete cerchiato in rosso, e mantenendo le virgolette.)

(3) Sostituite nella sezione finale "Write Text File" (cliccando il bottone cerchiato in rosso) al posto della scritta "CARTELLA TXTResults" il percorso della cartella denominata "TXTResults" che si trova nella directory del programma VideoSubFinder (nella stessa posizione dove si trova anche la cartella "RGBImages").


(4) Avviate il programma cliccando il bottone in alto a sinistra "Debug File" il programma si avvierà e attendete che abbia finito.


ULTERIORI INFORMAZIONI.

Il motore OCR utilizzato per la conversione OCR è quello presente in Windows chiamato "Microsoft OCR" è gratuito e non ha bisogno di installazione (a meno di compatibilità o errori del programma) fa il suo lavoro ed è abbastanza buono, ma non perfetto. Tuttavia, il migliore motore che ho trovato, con una percentuale di rilevazione esatta quasi del 100% e che è implementabile in UIPath, si chiama "Google Vision" è gratis fino alle prime 1000 operazioni ogni mese e poi si deve pagare. Se li mettete a confronto vedrete ben presto che i sub creati con "Microsoft OCR" sono da risistemare in modo elevato, mentre quelli creati con "Google Vision" sono praticamente perfetti. Vi lascio un tutorial se volete cambiare motore OCR con Google Vision: https://youtu.be/cld-An4u_I8


PASSO 3: Tornare su VideoSubFinder

Riaprite VideoSubFinder, andate nella sezione "OCR" in basso a sinistra, e cliccate su "Create Sub From Text Results":


FINITO! Ora avete un file TXT dei sottotitoli, è già completamente funzionante se lo selezionate come file dei sub in un qualsiasi lettore video sul computer!


PASSO EXTRA: Sistemare i sottotitoli

Sfortunatamente il processo appena descritto (soprattutto se il motore OCR usato è Microsoft OCR) creerà dei sottotitoli buoni all'80%, dovrete sistemare alcune parole e aggiungere delle frasi che magari non sono state riconosciute e i cartelli e dialoghi che erano presenti in altre parti dello schermo. Purtroppo questo è un lavoro che va fatto completamente a mano e richiede di saper utilizzare dei programmi per la creazione dei sottotitoli come Aegisub: https://aegisub.org/


Se ci sono domande o il programma per UIPath non dovesse funzionare scrivetemelo nei commenti. Se volete uno spazio nel sito per rendere pubblici i vostri sottotitoli contattatemi.

Guida creata da Saigo no Pulsar a FEBBRAIO 2024

Commentaires


Saigo no Publish

©2023 by Saigo no Publish. Creato con Wix.com

bottom of page