Esta empresa alemana está enfrentando a Google Translate y ChatGPT y está ganando
El software de traducción basado en IA, DeepL, está haciendo su primera aparición en la lista Forbes Cloud 100 este año gracias a un modelo de traducción de aprendizaje automático que los usuarios dicen que es más preciso que el de Google.
Jaroslaw Kutylowski habla alemán, polaco e inglés (y puede pedir una Coca-Cola en francés). Con DeepL, la herramienta de traducción impulsada por IA de su startup, puede leer y escribir en unas 30 más.
Fundada en 2017, DeepL ha desarrollado un software de traducción que, según dice, es mucho más preciso que los productos rivales ofrecidos por Google y otros, gracias a una poderosa inteligencia artificial que trabaja en conjunto con hablantes nativos humanos ().
La arquitectura de red neuronal patentada de DeepL, una técnica de aprendizaje automático que ayuda a una computadora a aprender información de la misma manera que lo hace un cerebro humano, ha sido entrenada en una vasta base de datos de texto bilingüe (traducido) y monolingüe (sin traducir) disponible públicamente en 31 idiomas diferentes, incluidos chino, ruso, español e italiano.
Esa es una pequeña fracción de los 130 idiomas que puedes traducir usando Google. Pero las traducciones de DeepL están calibradas para los matices por editores humanos y hablantes nativos. La startup emplea a 20 editores internos y más de mil traductores humanos y hablantes nativos basados en contratos en todo el mundo para evaluar la calidad de las traducciones producidas por el modelo de DeepL y ajustarlas para su precisión.
DeepL cuenta con más de 10 millones de usuarios activos mensuales, 500.000 de los cuales pagan entre 9 y 59 dólares al mes. Eso incluye a los abuelos que usan DeepL para hablar con sus nietos en su idioma nativo y parejas románticas que luchan con una barrera lingüística. Pero la mayor parte del negocio de DeepL proviene de sus 20.000 clientes empresariales (Mercedes Benz, Fujitsu y la compañía ferroviaria alemana Deutsche Bahn, por nombrar algunos) que utilizan el software de DeepL para traducir todo, desde sitios web, contratos legales y acuerdos con clientes hasta correos electrónicos, textos de marketing y diapositivas de PowerPoint.
En enero de 2023, la startup con sede en Colonia, Alemania, recaudó alrededor de US$ 100 millones en fondos de firmas globales de capital de riesgo, incluidas Institutional Venture Partners (IVP), Atomico y Bessemer Venture Partners con una valoración de US$ 1 mil millones, según Pitchbook. El CEO y fundador Kutylowski no confirmó la financiación total que su compañía ha recaudado hasta la fecha.
DeepL se ha descargado en 25 millones de dispositivos, una miseria en comparación con los más de 1000 millones de instalaciones de Google Translate. Pero aquellos que lo han usado elogian su precisión. Nina Gafni, traductora profesional con sede en Washington, DC que anteriormente trabajó para la Oficina Federal de Investigaciones como lingüista y traductora, utiliza DeepL para traducir francés, alemán e italiano a inglés. Ella dice que si bien los sistemas de aprendizaje automático nunca son completamente perfectos en sus traducciones, los de DeepL son más matizados culturalmente y precisos que la mayoría.
“A veces las traducciones automáticas pueden ser demasiado literales y eso es un gran problema”, dijo Gafni. “Si estoy en una situación difícil, siento que puedo confiar mucho más en DeepL que en Google Translate”.
Eso es probablemente debido a la calibración humana aplicada a la gran cantidad de subtítulos de películas, traducciones de libros y patentes, y conversaciones en foros utilizadas para entrenar a DeepL.
Akiko Taguchi, una hablante nativa de japonés que trabaja para DeepL, le dijo a Forbes que pasa la mayor parte de su tiempo asegurándose de que las traducciones de DeepL sean contextualmente correctas y suenen humanas. “Le di a la máquina mis comentarios cuando estaba mezclando las formalidades utilizadas en la escritura japonesa”, dijo Taguchi a Forbes. “Ha mejorado significativamente desde entonces”.
DeepL, que surgió de una herramienta de traducción de motores de búsqueda Linguee, permite a los usuarios traducir documentos completos como PDF, Word y PowerPoint, manteniendo intacto el formato. Sugiere traducciones alternativas y modificaciones tonales y permite a los usuarios crear un diccionario personalizado para especificar cómo se deben traducir ciertas palabras.
Doctorado en ciencias de la computación, Kutylowski estaba desarrollando la tecnología de aprendizaje automático subyacente a DeepL en 2016, al mismo tiempo que los investigadores de Google trabajaban en Transformers, el avance tecnológico basado en la traducción que impulsa ChatGPT. Pero a partir de ahora, DeepL no utiliza Transformers ni grandes modelos de lenguaje para la traducción, dijo, negándose a especificar la arquitectura exacta de DeepL. “Sabíamos que las redes neuronales iban a dominar este campo muy pronto”, dijo Kutylowski. “Estábamos convencidos de que cualquier cosa que se usara para traducir antes, como los métodos estadísticos, no tendría ninguna aplicación en el futuro”.
Eso está demostrando ser cierto, según Karthik Ramakrishnan, socio de IVP, que dirigió la ronda de inversión Serie B de US$ 100 millones de DeepL en enero. Hay un mercado global de 27.9 millones de dólares para los servicios de traducción, y no ha sido bien aprovechado. “La gran mayoría de la traducción sigue siendo un flujo de trabajo muy manual y obsoleto”, dijo Ramakrishnan. “La gente contrata proveedores de servicios lingüísticos subcontratados que tardan días o incluso semanas en obtener su contenido traducido a tiempo”.
Con sus aplausos y su valoración de 1.130 millones de dólares, DeepL está en una posición razonable para capitalizar el mercado que Ramakrishnan ha estado mirando. Pero también lo son otros. Aunque su herramienta de traducción podría no ser tan precisa como DeepL, Google admite 100 idiomas y está respaldada por un gigante que ha pasado décadas invirtiendo en IA. Otro gran competidor tecnológico es Microsoft Translator, que admite más de 50 idiomas y dialectos y tiene usuarios de grandes empresas como Volkswagen Group.
Mientras tanto, ChatGPT, el bot que podría decirse que incorporó la IA, puede traducir a muchos idiomas actualmente (pero tiene una serie de problemas de traducción que van desde la alucinación hasta la traducción incorrecta de la jerga coloquial). Eso solo mejorará gracias a la continua evolución de los modelos de lenguaje grande líderes en la industria de su matriz OpenAI.
DeepL no tiene su propio LLM, todavía. Kutylowski le dijo a Forbes que planea construir uno interno y combinarlo con su modelo de traducción más pequeño actual para obtener mejores resultados. Con ese fin, DeepL está construyendo sus recursos computacionales para entrenar modelos de IA utilizando el centro de datos centrado en IA de Nvidia en Suecia. “La IA generativa es una gran oportunidad”, dijo. “Nos permitirá construir funciones sobre la traducción, donde el traductor se vuelve más interactivo o está más en diálogo con usted”.