¿Como están todos? Espero que se encuentren bien y se estén cuidando en estos tiempos difÃciles que pasa la humanidad.
QuerÃa dejar esta contribución, no para hacer una discusión, ni mucho menos hacer una crÃtica, al contrario, quiero dejarlo como una gota de saber, sobretodo para aquellos que con tanto trabajo y horas de su tiempo nos regalan y comparten dÃa a dÃa sus subtÃtulos.
Como subdivx es un sitio de subtÃtulos ,creo que también ya va siendo hora de ponernos al dÃa con lo que ya quedó en el pasado.
Actualmente casi todos los subtÃtulos acá esta en western iso (8859-15). Esto posiblemente se deba a que la mayorÃa de las personas que hacen subtÃtulos usan Windows en español. Sin embargo el tema de la codificación ISO ha cambiado y el standard es otro desde hace ya bastantes años.
Esto puede estar dando problemas a algunas personas por tanto explico:
Los acuerdos internacionales y la estandarización para la compatibilidad de diferentes idiomas para programación, sistemas operativoss, etcétera, etcétera solicitó a principios de siglo a los usuarios, desarrolladores Unicode UTF-8 si necesitan alguna codificación más allá del conjunto de 7 bits (lo cual sucede con el español). Unicode es el futuro.
Las codificaciones regionales de 8 bits como ISO-8859-2 y mutantes como CP1252 en Windows son el pasado .
El tratamiento del sÃmbolo del euro es un buen ejemplo de por qué es mejor evitar codificaciones de 8 bits que no sean ISO-8859-1 estándar. No hay sÃmbolo del euro en la parte de Unicode que corresponde a ISO-8859-1. El punto de código Unicode apropiado para € [esto puede o no mostrarse correctamente como el sÃmbolo del Euro en su navegador o un subtÃtulo] es decimal 8364 (0x20AC). En Windows CP1252 € tiene el código 128 (0x80) en ISO-8859-15 (también conocido como Latin-9) el código € es 164 (0xA4) en Macintosh Roman es 219 (0xDB).
Estos estándares de codificación de 8 bits incompatibles generan confusión.
La mejor salida es adoptar el estándar Unicode en la codificación UTF-8 común que es universalmente compatible con todos los sistemas operativos modernos, web, subtÃtulos, etc.
En los programas para trabajar subtÃtulos se puede elegir guardarlo como UTF-8 Algunos nuevos adeptos son UTF8- BOM.
¿Cuando vamos a tener problemas con subtÃtulos que no están en UTF-8?
Si su máquina no está en Windows en español y no es moderna va a tener problemas. Pueden tener problemas en Plex, Emby y algunos servidores de medios. A la hora de hacer un remux en mkv tendrá un error si no utilizan utf-8
Explicación técnica (entendible, espero)
UTF
UTF es una familia de esquemas de codificación de varios bytes que pueden representar puntos de código Unicode que pueden ser representativos de hasta 2 ^ 31 [aproximadamente 2 mil millones] caracteres. UTF-8 es un sistema de codificación flexible que utiliza entre 1 y 4 bytes para representar los primeros 2 ^ 21 [aproximadamente 2 millones] puntos de código.
En pocas palabras: cualquier personaje con un punto de código / representación ordinal por debajo de 127, también conocido como de 7 bits seguro, está representado por la misma secuencia de 1 byte que la mayorÃa de las otras codificaciones de un solo byte. Cualquier carácter con un punto de código superior a 127 está representado por una secuencia de dos o más bytes, con los detalles de la codificación mejor explicados aquà .
ISO-8859
ISO-8859 es una familia de esquemas de codificación de un solo byte utilizados para representar alfabetos que se pueden representar dentro del rango de 127 a 255. Estos diversos alfabetos se definen como partes en el formato ISO-8859- n , el más familiar de estos probablemente sean ISO-8859-1, también conocido como Latin-1. Al igual que con UTF-8, el seguro de 7 bits no se ve afectado independientemente de la familia de codificación utilizada.
El inconveniente de este esquema de codificación es su incapacidad para acomodar idiomas compuestos por más de 128 sÃmbolos, o para mostrar de manera segura más de una familia de sÃmbolos a la vez. Además, las codificaciones ISO-8859 han caÃdo en desgracia con el aumento de UTF.
El Grupo de trabajo ISO a cargo de que se disolviera en 2004, dejando el mantenimiento a su subcomité matriz.
Asà las cosas, UTF-8 es el estandar desde hace casi dos décadas, el uso de Windows en español ha dejado a muchos usuarios en la era de piedra, aunque Windows ya está cambiando eso por exigencia de la comunidad mundial ya que era el único sistema operativo que no estaba estandarizando nada, aunque si ofrece, al menos en las versiones nuevas de Windows, leer utf-8 sin problemas. Lo cual es lógico por lo arriba explicado.
Saludos a todos y cuÃdense!
