twitter account

Google refina su herramienta de
traducción automática

10/03/2010

Miguel Helft, The New York TimesLa red de centros de datos que Google construyó para su sistema de búsqueda puede constituir hoy, en su conjunto, el equipo más grande del mundo. Google está usando esa máquina gigantesca para empujar los límites de la tecnología de traducción.El mes pasado, por ejemplo, dijo que está trabajando para combinar su herramienta de traducción con análisis de imagen, permitiendo que una persona pueda, por ejemplo, sacar una foto con un teléfono celular de un menú en alemán y obtener una de traducción al inglés al instante. «La traducción automática es uno de los mejores ejemplos de la visión estratégica de Google, »dijo Tim O'Reilly, fundador y director ejecutivo de la editor de tecnología de O'Reilly Media. «Ya no es algo que no se tome en serio. Sin embargo, hay algo más que Google entiende sobre datos y es que está dispuesto a hacer las inversiones necesarias para enfrentar este tipo de problemas complejos, yendo adelante del mercado».La creación de una máquina de traducción ha sido visto como uno de los retos más difíciles de la tecnología de inteligencia artificial. Durante décadas, los especialistas en computación han intentado utilizar un abordaje basado en normas - enseñando a las computadoras las normas lingüísticas de dos idiomas y dándoles los diccionarios necesarios.Pero a mediados de la década de 1990, los investigadores orientaron sus preferencias hacia lo que se denomina enfoque estadístico. Descubrieron que si se alimentaban los miles o millones de computadoras con trechos de textos hechos por el hombre, acompañados por sus traducciones, también humanas, las máquinas podrían aprender a hacer conjeturas sobre la forma exacta de traducir nuevos textos.Esta técnica, que requiere enormes cantidades de datos y muchos «caballos de fuerza» de poder informático le encantó a a Google. «Nuestra infraestructura se adapta muy bien a esto», dijo Vic Gundotra, vicepresidente de ingeniería de la empresa. «Podemos tener enfoques con los cuales nadie más puede ni siquiera soñar». Los sistemas de traducción automática todavía están lejos de la perfección. Los expertos dicen que es sumamente difícil para un equipo de romper una oración en partes, a continuación, traducir y volver a unirlos. Pero el servicio de Google ya es lo suficientemente bueno para transmitir la esencia de un artículo de noticias, y se ha convertido en una fuente rápida de las traducciones de millones de personas. «Si usted necesita un borrador rápido de traducción, esto es lo que precisa», afirmó Philip Resnik, un profesor de lingüística experto en traducción automática Universidad de Maryland, College Park. Al igual que sus rivales en este campo, sobre todo Microsoft y IBM, Google ha alimentado su motor de traducción de las transcripciones de Procedimientos de las Naciones Unidas, traducidas por profesionales en seis idiomas, y en las del Parlamento Europeo, en veintitrés idiomas.Pero Google ha rastreado además textos de la internet, así como los datos de su cartera de proyectos de exploración y de otras fuentes, para ir más allá de esos idiomas. Para las lenguas menos conocidas, se ha lanzado un «juego de herramientas» que ayuda a los usuarios en las traducciones y luego agrega los textos a su base de datos.La oferta de Google podría afectar seriamente las ventas de software de traducción de empresas como I B M, aunque no parece probable que la traducción automática pueda ser una fuente de ganancias enormes, al menos, no para las normas del negocio de publicidad de Google, pero aun así, los empeños de la empresa de Mountain View podrían rendir beneficios de varias maneras: como los anuncios en línea de Google son omnipresentes, la empresa resulta favorecida indirectamente por todo aquello que haga más fácil para la gente el uso de la internet. Y el sistema que así se va creando da lugar a nuevas aplicaciones interesantes en las que no se había pensado antes. La semana pasada, la empresa informó que usaría el reconocimiento de voz para generar títulos para el idioma Inglés-YouTube videos, que luego podría ser traducido a otros 50 idiomas. Ya se están experimentando sistemas que analizan textos contenidos en fotos, los interpretan y los traducen a cualquier idiomas.«Esta tecnología puede alejar cada vez más las barreras de la lengua», dijo Franz Och, científico principal de Google, encargado de la traducción automática de los equipos de la empresa. «Esto permitiría que cualquier persona se comunique en cualquier idioma con cualquier otra, de cualquier otro idioma».Mientras muchos sistemas similares al de Google usan textos de hasta mil millones de palabras para crear un modelo de lenguaje, Google fue mucho más lejos: algunos cientos de miles de millons de palabras en textos en inglés. «Los modelos se tornan cada vez mejores en la medidad en que incorpore más textos a los bancos de datos«, explicó Och.

Nota: Este artículo fue traducido del inglés mediante el servicio de Google y ajustado por un traductor humano.