IBM avanza la capacidad de Watson para comprender el lenguaje de los negocios
IBM (NYSE: IBM), líder en inteligencia artificial para empresas, anuncia nuevas tecnologías de IBM Watson diseñadas para ayudar a las organizaciones a comenzar a identificar, comprender y analizar con mayor claridad algunos de los mayores desafíos del lenguaje humano para obtener mejores insights.
Las nuevas tecnologías representan la primera comercialización de capacidades esenciales de procesamiento del lenguaje natural (Natural Language Processing - NLP) presentes en el proyecto de investigación Project Debater de IBM Research, el único sistema de Inteligencia Artificial (IA) capaz de debatir con humanos sobre temas complejos. Por ejemplo, se define una nueva función avanzada de análisis de sentimientos para identificar y analizar modismos y coloquialismos por primera vez. Frases como hot under the collar, que en español algo similar ocurriría con la frase "la sangre en el ojo", han desafiado los sistemas de IA porque son difíciles de detectar por algoritmos. Con el análisis avanzado de sentimientos, las compañías pueden comenzar a analizar esos datos de lenguaje con las APIs de Watson, para obtener una comprensión más holística de sus operaciones. Además, IBM está trayendo tecnología de su división de investigación, IBM Research, para comprender documentos comerciales, como archivos PDF y contratos, para agregar también a sus modelos de IA.
"El lenguaje es una herramienta para expresar pensamientos y opiniones, así como una herramienta para obtener información", comenta Rob Thomas, Gerente General de IBM Data and AI. " Es por eso que estamos cosechando tecnología del Proyecto Debater e integrándola en Watson, para permitir a las Sentiment Analysis (análisis avanzado de sentimientos). IBM ha mejorado el análisis de sentimientos para identificar y comprender mejor las construcciones de palabras complicadas, como frases y modismos, y los llamados shifters de sentimientos, que son combinaciones de palabras que juntas adquieren un nuevo significado, como la expresión en inglés hardly helpful, en el que hard no tiene sentido de 'difícil' sino de 'poco'. Esta tecnología se integrará con Watson Natural Language Understanding este mes, en Inglés, y hasta fin de año en español. Además, estamos anunciando una nueva tecnología de clasificación que permitirá a los clientes crear modelos de inteligencia artificial para clasificar más fácilmente las cláusulas que se producen en los documentos comerciales, como los contratos de adquisición. Basado en la tecnología de calificación con deep learning de Project Debater, las nuevas características pueden aprender de unos pocos cientos de muestras, para hacer nuevas calificaciones de manera rápida y fácil. Está planeado que sea incluido a Watson Discovery a finales de este año.
Briefs: Summarization (resumen). Esta tecnología extrae datos textuales de varias fuentes para proporcionar a los usuarios un resumen de lo que se dice y escribe sobre un tema específico. Se usó una versión inicial de Summarization en The GRAMMYS de este año, para analizar más de 18 millones de artículos, blogs y biografías para producir información digerible sobre cientos de artistas y celebridades de GRAMMY. Los datos se usaron en la transmisión en vivo de la alfombra roja, fotos y videos on-demand en www.grammy.com, para proporcionar a los fanáticos un contexto más amplio sobre los temas principales de la noche. Está planeado que sea incluido a IBM Watson Natural Language Understanding a finales de este año.
Clustering - Advanced Topic Clustering (agrupación avanzada de temas). Basado en los insights adquiridos del Proyecto Debater, las nuevas técnicas de agrupación de temas permitirán a los usuarios "agrupar" los datos recibidos para crear "temas" con información relacionada, para que puedan ser analizados. La técnica, que está planeada que sea incluida a Watson Discovery a finales de este año, también permitirá a los expertos personalizar y ajustar temas para reflejar el lenguaje de compañías o industrias específicas, como seguros, salud y manufactura.
IBM es líder desde hace mucho tiempo en NLP, desarrollando tecnologías que permiten que los sistemas informáticos aprendan, analicen y comprendan el lenguaje humano, incluidos sentimientos, dialectos, entonaciones, entre otros, con mayor precisión y velocidad. A través de Watson, IBM llevó su tecnología NLP al mercado, una gran parte de la cual nació en la división IBM Research. Productos como: Watson Discovery, para la comprensión de documentos; IBM Watson Assistant, para agentes virtuales; y Watson Natural Language Understanding, para el análisis avanzado de sentimientos, están todos infundidos con NLP.
ESPN Fantasy Football utiliza Watson Discovery y Watson Knowledge Studio para analizar millones de fuentes de datos de fútbol americano cada día durante la temporada, para ofrecer insights en tiempo real a millones de jugadores de Fantasy Football. Mediante el procesamiento del lenguaje natural, Watson identifica el tono y el sentimiento de los artículos de noticias, blogs, foros, rankings, proyecciones, podcasts y tweets que cubren todo, desde insights de vestuarios hasta análisis de lesiones. ESPN Fantasy Football muestra estas ideas en tarjetas de jugador que contienen el potencial de éxito y fracaso de cada jugador, así como una sección de "Player Buzz" que resume los comentarios positivos o negativos sobre cada jugador.