Login

  



duda de extraccion de subtitulos





Thread creado por mariano89 el 08/10/2019 06:51:08 pm. Lecturas: 26. Mensajes: 21. Favoritos: 0







08/10/2019 06:51:08 pm 
       5                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





hola amigos usuarios de subdix hago una pregunta cuando extraigo subtitulos de un dvd se me extraen pero con errores por ejemplo: la letro o sale como una u y los signos de interrogacion sale como un parentecis, como se hace para q no salgan asi gracias
55 5



08/10/2019 07:43:23 pm 
       5                           
Abrilo con el bloc de notas, cambia la codificación a ANSI y guardalo.




08/10/2019 09:26:51 pm 
       2                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





lo hice pero no hay caso lo pase a ansi sigue igual


08/10/2019 09:28:09 pm 
       2                           
¿Cuál es el subtítulo, tenes un link así lo bajo y veo?


08/10/2019 09:33:40 pm 
       1                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





SUBTITULIN escribió:
¿Cuál es el subtítulo, tenes un link así lo bajo y veo?
SUBTITULIN escribió:
¿Cuál es el subtítulo, tenes un link así lo bajo y veo?
SUBTITULIN escribió:
¿Cuál es el subtítulo, tenes un link así lo bajo y veo?
Si lo acabo de subir aca en subdivx es darkroom 1989


08/10/2019 09:37:09 pm 
       1                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





ya lo subi a mi perfil aca en subdivx darkroom fijate y decime como se hace si lo hago yo, porque tengo muchos para extraer


08/10/2019 10:34:40 pm 
       1                           
elio1234


Miembro desde: 03/05/2007

Threads abiertos: 48
Mensajes: 3843  
Subtítulos subidos: 23
Threads Favoritos: 0





mariano89 escribió:
hola amigos usuarios de subdix hago una pregunta cuando extraigo subtitulos de un dvd se me extraen pero con errores por ejemplo: la letro o sale como una u y los signos de interrogacion sale como un parentecis, como se hace para q no salgan asi gracias


Tienes que hacer una corrección OCR.


08/10/2019 10:44:08 pm 
       1                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





ni idea como se corrige con ocr, los extraje cion el subtitleedit me los extrajo automaticamente, sale un ocr es verdad eso lo hizo antomaticamente


09/10/2019 08:30:02 am 
       1                           
juansoldado


Miembro desde: 28/05/2017

Threads abiertos: 46
Mensajes: 1219  
Subtítulos subidos: 1
Threads Favoritos: 0





Si no le encontras la vuelta abrilo con el word y reemplazas un caracter por otro.


09/10/2019 08:37:11 am 
       4                           
Cuando lo extraes tenés que tener activada la opción Fix ocr errors y otra opción que ahora no recuerdo dónde te permite ir modificando manualmente cada interpretación del ocr que hace el programa. A la tarde te doy una mano si no podés.


09/10/2019 08:41:44 am 
       6                           
juansoldado escribió:
Si no le encontras la vuelta abrilo con el word y reemplazas un caracter por otro.


Está buena la idea, funcionaría con el signo de pregunta pero no con el resto de errores, tiene la letra u en vez de la letra o, si reemplazas la o por la u rompes todas las palabras que usen esas letras.


09/10/2019 09:47:52 pm 
       2                           
Con esta configuración sale bien el subtítulo:



Ponelo tal cual lo tengo yo y dale start OCR.

Cada vez que encuentre un error te va salir una ventana donde podrás ir corrigiendo:



SubtitleEdit 3.5.10


09/10/2019 10:11:23 pm 
       1                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





gracias ahi lo vere, yo lo tengo y lo hago con el subtitleedit porqe me lo hace automaticamente este subrip se puede automaticamente??? cuando lo hice era manual me costo mucho


09/10/2019 10:15:55 pm 
       1                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





perdona hay lei bien es el q uso yo, q raro porque puse esas opciones y no me sale


09/10/2019 10:24:12 pm 
       1                           
Fijate de utilizar el método Tesseract, tener los diccionarios instalados y tener activada la opción Prompt for unkown words (preguntar por palabras no conocidas).

El procedimiento es automático, pero cada tanto te va a ir preguntando por palabras no conocidas, que pueden ser errores de OCR o errores ortográficos. Si no corregís eso manualmente y pretendés subirlos acá, te los van a borrar, especialmente en este caso ya que salen bastantes errores de ortografía, algunos de OCR y otros tantos de región.


09/10/2019 10:40:06 pm 
       1                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





vos sabes q lo hize pero me salio vacio sin los textos


09/10/2019 11:07:37 pm 
       1                           
Primero Dale a Start OCR, cuando termine el reconocimiento y las correcciones tocá OK y al final lo guardás en srt.


09/10/2019 11:25:23 pm 
       0                           
mariano89


Miembro desde: 08/05/2013

Threads abiertos: 10
Mensajes: 19  
Subtítulos subidos: 8
Threads Favoritos: 0





ahora si me sale pero el tema es q se pasa saliendo los errores y no los hace automaticamente sin errores, osea se frena a cadarato otra no quedara entonces pero se puede


10/10/2019 11:26:11 am 
       1                           
juanlamour


Miembro desde: 25/01/2013

Threads abiertos: 5
Mensajes: 1221  
Subtítulos subidos: 195
Threads Favoritos: 0





No lo hagas. Si pretendes que un software analice y corrija errores de OCR automáticamente no se necesitarían subtituladores. Hacer subs requiere de paciencia y compromiso. Además de un buen conocimiento gramatical y ortográfico....


11/10/2019 06:37:04 pm 
       0                           
Si haces varios intentos y tenes los diccionarios adecuados instalados, el sistema automático hace un buen trabajo, eso si no te podes salvar de hacer correcciones, no es perfecto el sistema, queda bastante bien, pero hay que corregir si o sí. Acá dejo un ejemplo de como quedó con el reconocimiento automático, ahora toca hacer las correcciones que falten:

1
00:03:52,529 > 00:03:53,746
- ¿Al?

2
00:03:54,114 > 00:03:54,603
¿Alice?

3
00:03:54,949 > 00:03:56,371
Me voy, llego tarde.

4
00:03:56,742 > 00:03:57,641
No te vayas.

5
00:03:57,993 > 00:03:59,575
Lo digo en serio, tengo que irme.

6
00:04:02,248 > 00:04:03,181
Dame un beso.

7
00:04:05,834 > 00:04:08,485
¿Me vas a extrañar esta noche?

8
00:04:09,838 > 00:04:10,532
- Sí.

9
00:06:16,423 > 00:06:17,185
- Mierda, ¡me la olvide!

10
00:08:09,077 > 00:08:10,659
Alice, olvidé mi billetera.

11
00:08:16,418 > 00:08:17,044
¿Al?

12
00:08:26,053 > 00:08:27,043
¿Alice?

13
00:08:53,247 > 00:08:54,669
- ¡Detente!

14
00:08:55,040 > 00:08:56,462
- Cindy, cuando termines
de poner la mesa,

15
00:08:56,833 > 00:08:58,688
dile a los chicos que estén
listos para la cena.

16
00:08:59,044 > 00:08:59,806
- Sí, mamá.

17
00:09:01,171 > 00:09:01,933
- ¿No crees que va siendo hora

18
00:09:02,297 > 00:09:03,617
de que te ayuden?

19
00:09:03,966 > 00:09:04,899
Ellos ya tienen mucho trabajo
en la granja,

20
00:09:05,259 > 00:09:06,647
no veo porque tengan que hacer
el trabajo de las mujeres.

21
00:09:07,010 > 00:09:07,943
El trabajo de las mujeres.
- Claro.

22
00:09:08,303 > 00:09:09,202
Sí, ya lo sé.

23
00:09:10,889 > 00:09:12,778
Algunas cosas nunca cambiaran, supongo.

24
00:09:14,142 > 00:09:15,189
- Entonces, ¿vas a decirme

25
00:09:15,561 > 00:09:16,915
que paso con ese novio tuyo?

26
00:09:17,271 > 00:09:18,454
- Se pelearon.

27
00:09:19,606 > 00:09:21,620
- No, nos peleamos.

28
00:09:23,151 > 00:09:25,301
- Me habías dicho que venia
a cenar con nosotros.

29
00:09:25,654 > 00:09:27,201
Es hora de que lo conozca.

30
00:09:27,573 > 00:09:31,999
- Iba venir, pero creo que tenia trabajo.

31
00:09:32,369 > 00:09:33,951
Ha estado ocupado, muy ocupado.

32
00:09:34,329 > 00:09:35,512
- Sí, tuvieron una pelea.

33
00:09:37,040 > 00:09:39,623
- Cindy, ve y dile a los
chicos que la cena esta lista.

34
00:09:40,002 > 00:09:42,050
- ¡Mark, Perry, a cenar!

35
00:09:42,421 > 00:09:44,469
- Cindy, ve y díselo.

36
00:09:44,840 > 00:09:45,398
- Sí, mamá.

37
00:09:50,929 > 00:09:53,409
- Supongo que va en serio.

38
00:09:53,765 > 00:09:54,982
- ¿Qué te hace pensar eso?

39
00:09:55,350 > 00:09:56,340
- Bueno, no has estado fuera
de casa por tanto mucho tiempo,

40
00:09:56,685 > 00:09:58,733
imaginé que era por
de ese muchacho.

41
00:10:00,981 > 00:10:02,904
- No tanto mamá

42
00:10:03,275 > 00:10:04,322
Estuve aquí por Navidad.






extraccion

1