Internacionalización, localización, codificación, Islandia y traducción de un sitio web japonés de fotografías de gatos

traducción de internacionalización

InternacionalizaciónHay mucha información disponible cuando se trata de internacionalización, localización y codificación dentro de aplicaciones web. También hay muchos malentendidos sobre lo que cada uno proporciona para una aplicación web. Aquí está mi opinión ...

Cuando un navegador web se conecta a un servidor web, pasa bastantes variables y realiza solicitudes adicionales, aquí hay un ejemplo:

GET / HTTP / 1.1
Anfitrión: www.dknewmedia.com
Usuario-Agente: Mozilla / 5.0 (Macintosh; U; Intel Mac OS X; en-US; rv: 1.8.1.3) Gecko / 20070309 Firefox / 2.0.0.3
Aceptar: HTTP Aceptar = texto / xml, aplicación / xml, aplicación / xhtml + xml, texto / html; q = 0.9, texto / plano; q = 0.8, imagen / png, * / *; q = 0.5
Aceptar-Idioma: en-us, en; q = 0.5
Aceptar-codificación: gzip, desinflar
Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7

Internacionalización

La internacionalización es una combinación de muchas cosas:

  1. Localización: La capacidad de identificar desde qué idioma y ubicación visita un visitante. Esto se hace a través de solicitudes HTTP donde el visitante es identificado por una configuración regional. En mi caso, eso es en-US. "En" es inglés y "US" es Estados Unidos. Esta es una configuración dentro de mi sistema operativo.
  2. Zonas horarias: La capacidad de ajustarse a las zonas horarias. Normalmente, esto se logra configurando su servidor a la hora del meridiano de Greenwich (GMT) y luego permitiendo a los usuarios establecer su desplazamiento local de GMT.
  3. Codificación de caracteres: Esta es la capacidad de mostrar correctamente los conjuntos de caracteres del idioma. Es diferente de la localización, ya que la localización puede indicarme el idioma y la región de la computadora desde la que realiza la solicitud, pero no me dirá en qué idioma lector está solicitando ... ¡eso depende del lector!

Observe en mi encabezado HTTP cuando el navegador hizo la solicitud, le dijo al servidor que estaba solicitando mi configuración regional (Accept-Language: en-us); sin embargo, también necesita decirle al servidor qué conjunto de caracteres se solicita (Accept-Charset: Accept-Charset: ISO-8859-1, utf-8; q = 0.7, *; q = 0.7) ISO-8859-1 y utf -8 son ambos conjuntos de caracteres permitidos.

Localización

En este fantástico mundo mezclado, la localización ya no dicta el idioma. Aunque estoy en en-US, puedo leer absolutamente un idioma diferente usando un conjunto de caracteres diferente ... eso es lo que sucede cuando uso Hindi de Google (Realmente no uso Google Hindi). Mi solicitud de configuración regional y juego de caracteres es idéntica a cuando solicito el Google Ingles página, pero en realidad recibí una página que no puedo leer porque no tengo el juego de caracteres. Todo surge ????????????… Sin embargo, puedo cargar ese conjunto de caracteres en Firefox (Firefox> Preferencias> Avanzado> Idiomas):

Idioma de carga de Firefox

Si cargo ese idioma, puedo solicitar la página en su juego de caracteres nativo y mostrarla en mi computadora, ¡aunque mi configuración regional predeterminada es en-US!

Entonces ... si soy un estudiante de hindi, estudio inglés en Purdue y estoy conectado a través de VPN al servidor de la escuela, de vacaciones en Australia ... hay 3 configuraciones diferentes que deben aplicarse a la aplicación para estar verdaderamente internacionalizada, y ninguna dependen del otro.

Mi configuración regional aparecería como en-US, pero mi zona horaria es Australia, pero el idioma que solicito en el sitio web puede ser hindi. Si tuviera que programar mi solicitud para hacer supuestos Basado en la ubicación de mi computadora, estaría totalmente equivocado: alimentar a la persona en inglés en una zona horaria del Este. Idealmente, programaría mi aplicación para ofrecer ambos configuración de idioma y zona horaria ... pero no los asumiría en función de la configuración regional.

Islandia: el ejemplo definitivo

Somos ignorantes de los desafíos multilingües y locales en los Estados Unidos, donde todos hablar inglés [sarcasmo implícito]. En algunos países, como Islandia, aunque el idioma nativo es el islandés, ¡los increíbles islandeses crecen aprendiendo 3 idiomas! Dado que Islandia es un país en el centro de Europa y América del Norte, sus empresas trabajan en múltiples continentes, idiomas, dialectos de idiomas y múltiples zonas horarias desde su escritorio.

Muchos sitios web islandeses están creados en inglés de EE. UU., Inglés del Reino Unido, islandés, español, español, francés y alemán. Imagínense lo difícil que sería construir Icelandair's aplicaciones de sitios web y sistemas de venta de entradas ... ¡guau!

DESCARGO DE RESPONSABILIDAD: He tenido el placer absoluto de trabajar con la excelente gente de Icelandair y puedo decirles que son algunos de los profesionales más talentosos y amigables con los que he tenido el placer de trabajar. ¡Es simplemente un país y una gente increíbles! Visite ... tome Icelandair y asegúrese de visitar el Blue Lagoon!

Lenguaje versus codificación

¡Incluso hay diferentes codificaciones de caracteres dentro de un solo idioma que no funcionan bien entre sí! Ejemplo: un correo electrónico japonés escrito en Shift-JIS puede volverse ilegible en la computadora de una persona japonesa con la localización configurada en ja-JP porque su servidor de correo solo reconoce EUC-JP. Idealmente, un cliente debería poder establecer qué codificación le gustaría, así como qué idioma, simplemente asegurándose de que la codificación y el idioma sean compatibles con lo que solicita el cliente.

Si deseo leer japonés, es posible que deba seleccionar tanto japonés como mi idioma Y Shift-JIS para codificar para mostrar ese idioma correctamente. Aquí hay algo más de confusión para agregar a la mezcla ... algunos tipos de codificación admiten varios idiomas. UNICODE / UTF8 admite docenas. Lo contrario también es cierto. Algunos idiomas se pueden leer en muchos tipos de codificación. Si eso no tiene sentido ... Pido disculpas, es un tema muy complejo.

Algún día creo (espero) que todo esto cambie. Creo que los diseñadores originales de códigos de localización esperaban que la combinación de idioma y país fuera todo lo que se necesitaba ... pero nos hemos vuelto mucho más sofisticados. Recuerde, gran parte de esto se desarrolló antes de que existiera Internet. Con el advenimiento de GIS, tal vez una persona pueda seleccionar su codificación y GIS manejaría la información de zona horaria y ubicación.

Internacionalización

Volver al soporte de internacionalización. Si desea proporcionar una solicitud internacionalizada, debe:

  1. Admite varios tipos de codificación, idiomas y archivos de traducción para mostrar esas traducciones.
  2. Permita que el cliente configure su idioma, e incluso quizás su tipo de codificación, si es necesario.
  3. Admite zonas horarias al permitir a los usuarios hacer referencia a su zona horaria en comparación con GMT.
  4. Utilice los códigos de localización con precaución ... NO describen con precisión lo que su usuario está solicitando ni lo que puede leer.

Traducción

La traducción automática está todavía en pañales. Hay varios sitios web (y WordPress Plugins) que ofrecen traducción automática de su sitio. No se sienta tentado a hacer esto ... hay dos razones por las cuales:

  1. Si la traducción automática funciona, el usuario que está revisando su sitio ya tendrá un traductor con quien trabajar.
  2. La traducción automática apesta.

¿No me crees? Aquí tienes una traducción al japonés:
Pegado de Archivo Masatsu - un tipo con un montón de fotos de gatos:

Entrada de blog japonés

???
- 00:29:35 por masatsu

Además, el
??????????????????????????

?????????? (?)?

????????????????????????????????????????
??????????????????????????

??????????????????????????????????? (?)

?????????????????

??????????????
???
???

Su cuenta ha sido redirigida con éxito.

???????????????????????????????

??????????????????????????????????????
????????????????????????????????????????????????????????????????????????
??????????? Ag ??????????????

?????????????????????????????????????

Máquina traductora:

?? Hann ?????
-00: 29: 35 por masatsu

¿El nombre del primer santo de un / el elefante que apareció ayer en la flota del puño de la bestia? guardabosque" "?? Hann ???? " con un / el actor de radio Yutaka Mizushima….

? (?) que hace sepia fácilmente.

Porque incluso el actor de radio del puño santo, maestro ????? de un / el gato son los membrillos chinos de un Nagai Ichiro = bola de dragón el bastón de un / el ?? guardabosques se parece a la gente a la que el comentario ingenioso conoce fácilmente.

?????? (El sudor) que me estaba olvidando por completo este año “el secreto del nombre de la super flota”, de práctica habitual cada año ?,

?????? Si escribo tarde este año,

??????? santuario ??? (¿cómo?) cullion del promontorio (?? no cortes) Fukami ?? (? u observar capaz de?) an / the es lo que hace

?????? Con, se convierte en “a can /? /?”, En otras palabras, “kung fu”, cuando se alinea y cambia el encabezado de un / el nombre.

?????? Aunque se dice que aumenta dos adicionales, supuestamente puede convertirse en qué tipo de nombre.

Se dice que la verdad es “edad” porque el símbolo del elemento plateado es Ag ?, aunque el nombre de “¿???? plata ”el Takaoka? técnico de ??????? estaba pensando que el personaje llamado "?" se usó con la asociación de una película de pantalla plateada, si la llama con un miembro adicional.

?????? Sin embargo, estoy pensando egoístamente, que mi teoría no es ajena a ese "?" se incluye en un / el carácter chino.

Estoy seguro de que invertir la polaridad en esta traducción proporcionaría una dicción igualmente legible en inglés. Entendiste la entrada, ¿verdad?