Login

  



Ayuda! Como Extraer subtitulos de un AVI o MP4?





Thread creado por willygermo el 18/05/2020 03:14:47 pm. Lecturas: 26. Mensajes: 19. Favoritos: 0





18/05/2020 03:14:47 pm 
       3                           
willygermo


Miembro desde: 15/1/2004

Threads abiertos: 129
Mensajes: 411  
Subtítulos subidos: 11
Threads Favoritos: 0





Comunidad, necesito que me ayuden, estoy tratando de extraer unos subtitulos de un archivo AVI o MP4 que estaba buscando hace un tiempo y los encontre pero estan incrustados en la imagen. Probe con el Subrip pero al cargar el archivo me da el siguiente error: ´´Could not open video file usinf AviSynth´´, y no se cual puede ser el inconveniente, si alguien me puede dar una mano le voy a agradecer,

Saludos a todos!!
33 3



18/05/2020 03:46:46 pm 
       1                           
jtorcatt


Miembro desde: 18/05/2020

Threads abiertos: 0
Mensajes: 1  
Subtítulos subidos: 0
Threads Favoritos: 0



Si es un archivo con los subtitulos pegados no se puede extraer porque forma parte de cada cuadro de la pelicula, solo se puede extraer si estan flotando, no incrustados, en ese caso para MP4 he usado ´´My MP4Box GUI´´ con muy buenos resultados.


18/05/2020 04:03:38 pm 
       0                           
willygermo


Miembro desde: 15/1/2004

Threads abiertos: 129
Mensajes: 411  
Subtítulos subidos: 11
Threads Favoritos: 0





Estan incrustados, pero se que se pueden mediante OCR, es un poco lento pero es factible, pero los tutoriales que encontre por uno u otro motivo no puedo hacerlo.

jtorcatt escribió:
Si es un archivo con los subtitulos pegados no se puede extraer porque forma parte de cada cuadro de la pelicula, solo se puede extraer si estan flotando, no incrustados, en ese caso para MP4 he usado My MP4Box GUI con muy buenos resultados.



18/05/2020 04:36:26 pm 
       0                           
fedeguille


Miembro desde: 21/03/2007

Threads abiertos: 65
Mensajes: 23642  
Subtítulos subidos: 2
Threads Favoritos: 0





willygermo escribió:
Estan incrustados, pero se que se pueden mediante OCR, es un poco lento pero es factible, pero los tutoriales que encontre por uno u otro motivo no puedo hacerlo.jtorcatt escribió: Si es un archivo con los subtitulos pegados no se puede extraer porque forma parte de cada cuadro de la pelicula, solo se puede extraer si estan flotando, no incrustados, en ese caso para MP4 he usado My MP4Box GUI con muy buenos resultados.


El formato AVI es un contenedor, si están en un archivo aparte del video, se pueden extraer. De lo contrario, si están procesados como parte del archivo de video...cagaste.

Cuando tuve que hacer este quilombo, hice el mismo procedimiento que con un MKV, simplemente le cambié la extensión y el MKVExtractGui hizo lo suyo.

Con los Mp4 ni intenté, calculo que no se puede.


18/05/2020 06:34:53 pm 
       0                           
ZerOMegA


Miembro desde: 21/10/2004

Threads abiertos: 6
Mensajes: 3511  
Subtítulos subidos: 105
Threads Favoritos: 0





Con los AVI se puede hacer a través del AVISubDetector 0.6.0.7 beta.
Es gratuito, y aunque te reconoce bien las posiciones de los subs, el ocr es medio pedorrengue, pero podés hacer la prueba, yo lo usaba hace muuuuchos años, pero ni me acuerdo qué versión era. Esta que te pongo es la última que salió.


18/05/2020 06:48:37 pm 
       0                           
ZerOMegA


Miembro desde: 21/10/2004

Threads abiertos: 6
Mensajes: 3511  
Subtítulos subidos: 105
Threads Favoritos: 0





Haciendo un poco más de búsqueda encontré otra aplicación gratuita que parece servir para cualquier tipo de video con subtítulos hardcodeados, pero solamente te crea un archivo de subtítulo con las posiciones del texto, sin hacer el reconocimiento, así que igual después tenés que ir tipeando todo, aunque te vas a ahorrar el trabajo de buscar los tiempos: VideoSubFinder.


18/05/2020 07:00:56 pm 
       0                           
willygermo


Miembro desde: 15/1/2004

Threads abiertos: 129
Mensajes: 411  
Subtítulos subidos: 11
Threads Favoritos: 0





Muchas gracias, voy a probar ambos programas y después comento. Desde ya agradecido.

ZerOMegA escribió:
Haciendo un poco más de búsqueda encontré otra aplicación gratuita que parece servir para cualquier tipo de video con subtítulos hardcodeados, pero solamente te crea un archivo de subtítulo con las posiciones del texto, sin hacer el reconocimiento, así que igual después tenés que ir tipeando todo, aunque te vas a ahorrar el trabajo de buscar los tiempos: https://sourceforge.net/projects/videosubfinder/ VideoSubFinder.



18/05/2020 07:04:21 pm 
       0                           
ZerOMegA


Miembro desde: 21/10/2004

Threads abiertos: 6
Mensajes: 3511  
Subtítulos subidos: 105
Threads Favoritos: 0





Por nada, otro que anda dando vueltas desde hace muchos años es el SubRip. Este tiene mejor ocr pero es menos automático, igual vale la pena probarlo.
Buena suerte con tu proyecto.


18/05/2020 07:35:50 pm 
       0                           
willygermo


Miembro desde: 15/1/2004

Threads abiertos: 129
Mensajes: 411  
Subtítulos subidos: 11
Threads Favoritos: 0





El Subrip lo probe, pero me tira error cuando cargo el AVI asi que desistí ese programa.

ZerOMegA escribió:
Por nada, otro que anda dando vueltas desde hace muchos años es el zuggy.wz.cz/ SubRip. Este tiene mejor ocr pero es menos automático, igual vale la pena probarlo.Buena suerte con tu proyecto.



19/05/2020 09:17:00 am 
       0                           
kurko1992


Miembro desde: 15/1/2004

Threads abiertos: 128
Mensajes: 1877  
Subtítulos subidos: 229
Threads Favoritos: 0





willygermo escribió:
El Subrip lo probe, pero me tira error cuando cargo el AVI asi que desistí ese programa.ZerOMegA escribió: Por nada, otro que anda dando vueltas desde hace muchos años es el zuggy.wz.cz/ SubRip. Este tiene mejor ocr pero es menos automático, igual vale la pena probarlo.Buena suerte con tu proyecto.


Porque el SubRip es para extraer los sub del SubPack que viene en IDX/SUB, cuando se ripeaba una peli de DVD a AVI, los subtitulos venia por separdo (como dije, IDX/SUB) y con el SubRip los pasaba a .srt.
En esas epocas, no todos los DVDs de mesa leeian IDX/SUB y tampoco los rep de la PC.

Digo, no esta por ningun lado el subtitulo que te queres volver loco sacando lo de un AVI?


19/05/2020 02:57:35 pm 
       0                           
sonic2482


Miembro desde: 04/05/2015

Threads abiertos: 10
Mensajes: 576  
Subtítulos subidos: 17
Threads Favoritos: 0





Con subrip se puede hacer lleva bastante tiempo y paciencia pero se que varias subtitulos han podido ser sacados asi, es una ardua labor


19/05/2020 07:56:23 pm 
       0                           
elio1234


Miembro desde: 03/05/2007

Threads abiertos: 48
Mensajes: 3881  
Subtítulos subidos: 23
Threads Favoritos: 0





Eso que quieres hacer no es posible directamente con SubRip, primero necesitarías un programa que capture los frames con subs del video y los convierta en bitmaps, son varios miles de frames y varios miles de bitmaps, esos bitmaps si podrían ser procesados con el OCR de SubRip, pero es una tarea muy, muy difícil y tediosa.

Había un filtro de VirtualDubMod que hacía esa captura, pero los resultados eran muy malos. Con VirtualDubMod estamos hablando casi de un programa de la era de las cavernas.


19/05/2020 09:40:03 pm 
       0                           
goyik


Miembro desde: 10/09/2006

Threads abiertos: 53
Mensajes: 2609  
Subtítulos subidos: 16
Threads Favoritos: 0





No entiendo porque la gente se empeña en tanto lio, no se que quieren demostrar. Es mas facil buscarlos en ingles, luego aprender ingles y hacerlos desde cero que sacarlos cuando estan hardcoded y de paso no te quedan bien ni completos, igual hay que revisarlos, corregirlos y completarlos.


19/05/2020 09:45:11 pm 
       1                           
goyik


Miembro desde: 10/09/2006

Threads abiertos: 53
Mensajes: 2609  
Subtítulos subidos: 16
Threads Favoritos: 0





kurko1992 escribió:
willygermo escribió: El Subrip lo probe, pero me tira error cuando cargo el AVI asi que desistí ese programa.ZerOMegA escribió: Por nada, otro que anda dando vueltas desde hace muchos años es el zuggy.wz.cz/ SubRip. Este tiene mejor ocr pero es menos automático, igual vale la pena probarlo.Buena suerte con tu proyecto.Porque el SubRip es para extraer los sub del SubPack que viene en IDX/SUB, cuando se ripeaba una peli de DVD a AVI, los subtitulos venia por separdo como dije, IDX/SUB y con el SubRip los pasaba a .srt.En esas epocas, no todos los DVDs de mesa leeian IDX/SUB y tampoco los rep de la PC.Digo, no esta por ningun lado el subtitulo que te queres volver loco sacando lo de un AVI?


Correcto ahora recuerdo, para mi ya eso es pasado desaprendido. Los subotitulos antes venian en una pista separada de DVD o CD y con OCR era mas o menos facil obtenerlos, pero cuando estan hardcoded mezclados con la imagen del cuadro de la pelicula es practicamente imposible obtenerlo, tiene que ser un supersoftware digno de contraespionaje de inteligencia rusa, asi que suerte con eso, yo que tu me olvido del tema y busco el sub por otro lado hasta que algun dia aparezca.


19/05/2020 09:59:39 pm 
       0                           
kurko1992


Miembro desde: 15/1/2004

Threads abiertos: 128
Mensajes: 1877  
Subtítulos subidos: 229
Threads Favoritos: 0





goyik escribió:
No entiendo porque la gente se empeña en tanto lio, no se que quieren demostrar. Es mas facil buscarlos en ingles, luego aprender ingles y hacerlos desde cero que sacarlos cuando estan hardcoded y de paso no te quedan bien ni completos, igual hay que revisarlos, corregirlos y completarlos.


Creaste alguna vez un subtitulo dese CERO?????
No es tan facil como parece.
Y no es solo el tema de saber ingles o no.
Si te referis a traducir uno desde ingles, es otra cosa, tambien dificil, pero no es lo mismo que hacerlo desde CERO.

Peri si ya le dije al amigo, es mas facil buscarlo en ingles que sacarlo de un AVI.


23/05/2020 09:16:15 pm 
       0                           
Infectado


Miembro desde: 15/04/2020

Threads abiertos: 17
Mensajes: 253  
Subtítulos subidos: 8
Threads Favoritos: 0





No vas a encontrar la forma de hacerlo, te vas a llenar de problemas. De ultima es preferible que agarres otro subtitulo, lo corrijas y lo sincronices y para ello hay muy buenas herramientas. Ahora, si queres hacerlo desde cero, tambien tenes herramientas y metodos que podes adoptar y que a la final vas a ganar mas tiempo al resolverlo por estos metodos que tratando de hacer un ocr del archivo de video, ya que seguramente vas aperder mas tiempo al arreglar las frases que obtengas.


24/05/2020 11:31:15 pm 
       0                           
leonnos


Miembro desde: 10/06/2010

Threads abiertos: 0
Mensajes: 7  
Subtítulos subidos: 372
Threads Favoritos: 0



De todos los programas que te recomendaron, el que mejor resultado tiene, por no decir el único que actualmente funciona, es el VideoSubFinder. Hay varias versiones, te recomiendo la 2.50. Es el más preciso detecta casi todas las líneas, con excepción de algunas muy cortas, como ´´Sí´´ o ´´No´´, por ejemplo. No te detecta ningún guion de diálogos, que deberás agregarlos a mano. Para hacer un buen OCR, necesitás dos cosas, que el hardsub tenga buen borde (si no tiene borde o borde y sombra, es más difícil e impreciso) y usar el AbbyyFineReader (mejor de versión 12 para arriba la 9 no te va a tomar todas las imágenes). Luego, paciencia con las correcciones dentro del Abbyy mejor corregir lo más que puedas ahí, que luego en otro programa. Cuando terminas ahí, exportas en formato texto, en líneas individuales, cada una con el tiempo de cada imagen/línea de subtítulo (eso se explica bien en los tutos que hay por la web, youtube, etc), vuelves al VideoSubFinder, creas el subtítulo final, puedes comparar con una versión sólo de tiempos que hayas creado previamente, agregas líneas faltantes comparando con el SubtitleEdit, y luego cargas el subtítulo y abres el video con hardsubs en el Aegisub. Si querés darle estilo, podés hacerlo hasta que el SRT te tape exactamente el hardsub (buscas la tipografía exacta o una parecida, modificas tamaño, borde, etc, y le das otro color: amarillo si es blanco, blanco si es amarillo), y así podés ir pasando línea a línea detectando más fácil y rápido las diferencias, y agregar los guiones o corregir cualquier otro error de texto o tiempos (el VideoSubFinder generalmente adelanta 33 o 40/42 milisegundos que deberás atrasar en el sub final para que coincidan exactos tiempos de inicio y fin). Para finalizar, si querés, podés abrir el video, cargar el subtítulo corregido y ver la película acelerada hasta por 5, con el SRT y los hardsubs superpuestos, en el VLC. Ahí vas a ver si falta agregar alguna línea que no haya detectado el VideoSubFinder.

Tiempos:

Reconocimiento con el VideoSubFinder: No más de 20 min
AbbyFineReader: Depende la calidad del OCR y cantidad de líneas: de 30 min a 2 horas
Corregir línea por línea con Aegisub: de 20 a 40 min (opcional pero recomendado)
Ver acelerada por 5 una peli de 1:30 h, parando para corregir en el Aegisub, 25 a 30 min, máximo. (opcional si luego vas a ver la película, te vas a dar cuenta si falta alguna línea y te ahorras este paso)

Con los otros programas vas a perder el tiempo. Poder, por supuesto que se puede ´´extraer´´ un hardsub, y siempre va a depender de la calidad del mismo. Si es uno con fondo negro (caja opaca) siempre será más fácil, y a partir de ahí siempre un poco más difícil. Si te das maña, podés ´´limpiar´´ un poco el video antes de hacer todo esto. TMPGEnc Video Mastering Works es muy bueno para modificar gamma, luminancia, color, contraste, etc, para resaltar más los hardsubs y mejorar la detección (bajar mucho la gamma -60 a -90, a veces ayuda mucho para ´´aumentar´´ los bordes de los subtítulos y oscurecer un poco la imagen, destacando más el blanco o el amarillo de los subs). Con este método debo haber ´´trancripto´´ no menos de 200 subtítulos de viejos AVI para nuevas copias 1080p, capturas de TV, o hardsubs en inglés para traducir. Saludos y suerte.

Ultima edición por leonnos el 25/05/2020 12:03:47 , editado 1vez




extraer

1