Autor Tema: Generar subtitulos forzados y normales de un bd50  (Leído 143 veces)

0 Usuarios y 1 Visitante están viendo este tema.

Dylan gonsalez

  • Miembro nuevo
  • *
  • Desconectado Desconectado
  • Registrado: 10/10/2017
  • Mensajes: 9
  • Valoración: 0
Hola nuevamente traigo otro tema que aun no me ha quedado claro, quisiera saber como puedo extrar subtitulos de carpetas bluray mi objetivo es generar dos subtitulos forzados uno en ingles y otro en español (creo que los subtitulos forzados son aquellos que aparecen cuando en la pelicula hay carteles o notas o referencias de lugares) y quisiera generar dos subtitulos normales (traduccion de cada dialogo de la pelicula) respectivos a los dos idiomas mi inquietud es que programa o método me recomiendan para obtenerlos y cual seria el proceso. gracias



tebasuna51

  • Moderador
  • ******
  • Desconectado Desconectado
  • Registrado: 22/02/2010
  • Mensajes: 4.037
  • Valoración: 203
Hola nuevamente traigo otro tema que aun no me ha quedado claro, quisiera saber como puedo extrar subtitulos de carpetas bluray

En el Manual de UsEac3to se explica la manera de extaer todas las pistas de un BD http://www.mundodivx.org/foro/index.php?topic=44453.0;msg=199204

En concreto los subs en BD son las pistas PGS.
A veces hay un PGS para los completos y otro para los forzados, pero también es posible un único PGS y, dentro de él, algunos subs están marcados como forzados.

Si tu objetivo es crear mkv's hay que decir que soporta los PGS sin modificar, pero si quieres convertirlos a formato texto (srt, ass) puedes utilizar el programa Subtitle Edit para convertirlos.

Citar
(creo que los subtitulos forzados son aquellos que aparecen cuando en la pelicula hay carteles o notas o referencias de lugares)
O cuando los diálogos son en otro idioma y no se traducen en el audio.
Si la peli es inglesa los carteles o notas en inglés no generan subs forzados, es posible que no existan forzados en inglés.

Dylan gonsalez

  • Miembro nuevo
  • *
  • Desconectado Desconectado
  • Registrado: 10/10/2017
  • Mensajes: 9
  • Valoración: 0
ok Usando el usEac3to deslizando el mpls. que se corresponde a la pelicula me salen 15 pistas de las cuales 8 son pgs leyendo el manual cuando se repite el idioma en pgs son comentarios  por lo que se supone que los primeros son los de los subtitulos de la pelicula o como yo distingo cuales son los de la pelicula y comentarios ya que aperecen identicos. Para extraer los subtitulos de configurar algo espcial en frequent parameters o more parameters o lo dejo todo por defecto?

tebasuna51

  • Moderador
  • ******
  • Desconectado Desconectado
  • Registrado: 22/02/2010
  • Mensajes: 4.037
  • Valoración: 203
Lo normal es extraer todos los de los idiomas que te interesen y luego ya los revisarás con Subtitle Edit.
A priori no se sabe cuales son forzados, normales o comentarios.

Supongamos que quieres inglés y español:
Selecionar en Track Input: 8:SUP y en Output format: sup, pulsar 'Add'
Selecionar en Track Input: 10:SUP y en Output format: sup, pulsar 'Add'
Selecionar en Track Input: 13:SUP y en Output format: sup, pulsar 'Add'

Luego ya revisarás que son.

Dylan gonsalez

  • Miembro nuevo
  • *
  • Desconectado Desconectado
  • Registrado: 10/10/2017
  • Mensajes: 9
  • Valoración: 0
Ok ya extrage los subtitulos ahora quisiera saber como funciona subtitle edit ya que no se como trabajar los subtitulos con este programa veo diversas opciones cargo el pgs y no se que sigue ya que no parece un simpre editor de subtitulos sino que incorpora visualizacion de video y otras herramientas, que sigue tras cargar el subtitulo?

tebasuna51

  • Moderador
  • ******
  • Desconectado Desconectado
  • Registrado: 22/02/2010
  • Mensajes: 4.037
  • Valoración: 203
Es un programa con muchas opciones, tienes ayudas en http://www.nikse.dk/SubtitleEdit/HelpEs

Te digo lo que hago yo para convertir un .sup a un .srt (si es eso lo que quieres):

Archivo -> Importar archivo/OCR Bluray sup... y cargo el .sup extraido

1) En la nueva ventana que se abre:

- Método OCR (reconocimiento óptico de caracteres): OCR con Tesseract
- Idioma: Spanish (o el que sea) que automáticamente me activa el

- Diccionario: Español (España) [es_ES]
- Corregir errores OCR: Activado
- Confirmar palabras desconocidas: Desactivado
- Tratar de adivinar...: Activado
- Salto de párrafo...: Activado

Abajo hay una casilla 'Mostrar solo subs forzados'
- Si está desactivada es que no tiene ninguno
- Si puedes activarla y no cambia el contenido todos son forzados
- Si puedes activarla y cambia el contenido esos son forzados y el resto normales.

Pulsar en 'Empezar OCR' y esperar a que acabe.

Se habrá generado una lista de 'Palabras desconocidas'
Ves pinchando y verificando/editando lo que sospeches está mal (muchos nombres propios es normal que no los reconozca)
Cuando salgas de esa pantalla ya no podrás verificar la imagen con el texto reconocido.
Pulsar OK para salir.

2) Vuelve a la pantalla principal, elegir:

Formato: Subrip (.srt)
Codificador: 1252 (Europeo Occidental)

Pasar algunas verificaciones, por ejemplo:

3) Herramientas -> Corregir errores comunes (modificar opciones a tu gusto)

4) Ortografía -> Ortografía

Dylan gonsalez

  • Miembro nuevo
  • *
  • Desconectado Desconectado
  • Registrado: 10/10/2017
  • Mensajes: 9
  • Valoración: 0
Tengo inquietud una vez culmina el star ORC, efectivamente lanza un listado de palabras desconocidas mi inquietud es ¿como yo debo corregirlas para que las reconozca, reescribo la palabra o que hago para que las reconozca?

Con el archivo sup que trabajo parece que no tiene forzados porque no aparece disponible la opción de habilitar (confirmando lo que decías acerca de que los subs en ingles no los tienen en muchos casos, vere a posterior con los de español).

tebasuna51

  • Moderador
  • ******
  • Desconectado Desconectado
  • Registrado: 22/02/2010
  • Mensajes: 4.037
  • Valoración: 203
Pinchas en la palabra a corregir en el listado y en la parte superior aparece el sub gráfico.
En la parte inferior izquierda está como lo ha convertido a texto, ahí lo corriges.

Dylan gonsalez

  • Miembro nuevo
  • *
  • Desconectado Desconectado
  • Registrado: 10/10/2017
  • Mensajes: 9
  • Valoración: 0
Pero aun no se como corrijo, digo porque en la imagen que subo muestra en la grafica superior (Merci.) y En como lo convirtió lo mismo solo que le agrega unos simbolos que en otros textos que si reconoce están, por lo que no se como debo modificarlo.

tebasuna51

  • Moderador
  • ******
  • Desconectado Desconectado
  • Registrado: 22/02/2010
  • Mensajes: 4.037
  • Valoración: 203
Ese está bien:
Lo que está entre los símbolos <i></i> en un .srt, significa letra itálica o cursiva (inclinada), como así se percibe en el gráfico.
Si no quieres diferenciar esos tipos de letras desactiva la casilla itálica.

Ahí se ven unos errores típicos de OCR:

MNEMOSYNE:   interpretado como MNEMOSYNEI a veces
HIPPOLYTA:   interpretado como HIPPOLYTAI a veces

típico de subs SDH (para sordos)
puedes reemplazar la I final por :
Y luego puedes Herramientas -> Eliminar texto para sordos...
si así lo deseas.

Por cierto en Opciones -> Seleccionar idioma... puedes poner el interfaz en español

Dylan gonsalez

  • Miembro nuevo
  • *
  • Desconectado Desconectado
  • Registrado: 10/10/2017
  • Mensajes: 9
  • Valoración: 0
El reproductor que posea solo acepta formatos .ass .ssa .srt. .sub. smi .sami .txt .xml pero los pgs no los renoce hay otra manera de obtener alguno de esos formatos sin utilizar un programada edicion?

tebasuna51

  • Moderador
  • ******
  • Desconectado Desconectado
  • Registrado: 22/02/2010
  • Mensajes: 4.037
  • Valoración: 203
No, los PGS (.sup) son imágenes y todos los formatos que has puesto parecen de texto (supongo que .sub se refiere a MicroDVD y no a VobSub con idx/sub).

Así que siempre hay que hacer un OCR (reconocimiento gráfico de caracteres) que es lo más latoso.