Hogar Con visión de futuro Las herramientas cognitivas y de conversación ocupan un lugar central en Microsoft Build

Las herramientas cognitivas y de conversación ocupan un lugar central en Microsoft Build

Video: Neurociencia cognitiva de la atención (Noviembre 2024)

Video: Neurociencia cognitiva de la atención (Noviembre 2024)
Anonim

Lo que más me sorprendió en la conferencia Microsoft Build de esta semana fue el énfasis en los servicios cognitivos y de conversación, ya que Microsoft desarrolló su visión de cómo dichos servicios transformarán las aplicaciones en el futuro e intentó convencer a los desarrolladores para que se unan a esta visión.. Gran parte de esto no será evidente para los usuarios finales hasta más tarde: las características más importantes para los usuarios finales por ahora serán las mejoras al asistente personal de Cortana y las nuevas características de entintado en la "Edición de aniversario" de Windows 10 que saldrá este verano. Pero el impulso para asegurarse de que Microsoft se mantenga al día con sus rivales en aprendizaje automático, agentes inteligentes y aplicaciones de mensajería está más dirigido a los desarrolladores por ahora, ya que la compañía ya tiene aplicaciones básicas pero necesita un ecosistema para hacerlas más impresionantes.

El nuevo tema más importante presentado por el CEO Satya Nadella fue "las conversaciones como una plataforma" que parece implicar la toma de plataformas de conversación, desde Cortana a Skype hasta aplicaciones de terceros, y agregarles inteligencia. La idea es agregar comprensión, preferencias y particularmente contexto a tales aplicaciones.

Dijo que hay tres actores principales en tales conversaciones: personas, asistentes digitales y bots. Del lado de persona a persona, habló sobre aplicaciones como Skype Translate, que intentan permitir mejores conversaciones en varios idiomas. Dijo que un asistente digital lo conocerá a través de múltiples dispositivos y puede ayudarlo con las tareas cotidianas, como programar citas. Los bots son nuevas aplicaciones con las que puedes conversar en lenguaje natural, y habló sobre una visión en la que puedes llamar a los bots dentro de una conversación.

Todo esto conduce a una nueva plataforma, dijo, donde el lenguaje humano se convierte en la interfaz de usuario, los bots se convierten en las nuevas aplicaciones, y los asistentes digitales son como "meta-aplicaciones", como el navegador, que existe en parte para llamar a otras aplicaciones, con todas estas aplicaciones, incluida la inteligencia. Dijo que esto sería un cambio de plataforma tan grande como la GUI, la Web o la tecnología táctil en el móvil.

Nadella habló sobre cómo la visión "no era hombre versus máquina, sino hombre con máquinas", con personas que proporcionaban empatía, emociones y juicios, y máquinas que proporcionaban potencia computacional. Pero dijo que era importante tener un "enfoque basado en principios" para el aprendizaje automático, y usarlo para aumentar las habilidades y experiencias humanas, ser confiable (en términos de privacidad, seguridad y cumplimiento), inclusivo y respetuoso.

Sobre el último punto, dijo que era importante que tales aplicaciones representaran "lo mejor de la humanidad, no lo peor", y señaló a Tay, el experimento fallido de Microsoft para introducir un bot de chat la semana pasada, que tuvo que retirarse un día después cuando comenzó a repetir comentarios ofensivos. Nadella admitió que la compañía se equivocó, diciendo que "nos dimos cuenta rápidamente de que no estaba a la altura", pero dijo que la compañía continuaría incubando tales tecnologías, señalando que sus bots en China y Japón no han tenido los mismos problemas..

Entre los nuevos detalles se encuentra Cortana que llegará a Outlook, para que pueda comprender mejor su correo, contactos y calendario, y hacer cosas como reprogramar citas, una idea genial, si no completamente nueva, y poder sugerir cosas que quizás quiera hacer a continuación según su calendario, correo o las conversaciones que ha tenido. Y una nueva versión de Skype ahora disponible agrega soporte para Cortana y puede soportar bots dentro de sus chats de video, para hacer cosas como transcribir llamadas de video cortas y estar accesible para todo tipo de servicios. Microsoft lo llamó usando Skype como un "lienzo de conversación". Esto tampoco parece ser una idea nueva: cosas como WeChat y Facebook Messenger han tenido bots durante mucho tiempo, pero muestra cómo Microsoft está tratando de convertir esto en una plataforma. También muestra cómo esto puede funcionar multiplataforma, con la demostración comenzando en una PC con Windows y concluyendo en Skype en un teléfono Android.

Pero la mayoría de las noticias reales parecen estar en nuevas ofertas para desarrolladores, con lo que ahora se conoce como Cortana Intelligence Suite (anteriormente Cortana Analytics Suite, un buen ejemplo de qué términos están de moda en un año determinado).

Este es efectivamente un tiempo de ejecución construido en la plataforma Azure que incluye un marco de bot, servicios cognitivos y aprendizaje automático.

El marco de bot hace que sea más fácil crear un bot o conectar uno a otros servicios. Los desarrolladores pueden crearlos en node.js o C #, y una demostración implicó la creación de un bot que ordena pizzas de Domino's. Lo que encontré más interesante aquí es que está destinado a ser un marco abierto, con bots que pueden funcionar no solo dentro de Cortana y Skype, sino también de Slack, Telegram, SMS simples y otros servicios. Por supuesto, algunos de los servicios alternativos más interesantes no estaban en esa lista, incluidos Siri de Apple, Alexa de Amazon, Messenger de Facebook o WhatsApp.

Otra demostración mostró cómo algunas herramientas futuras facilitarán a los desarrolladores agregar o cambiar las reglas de los bots y su comprensión del lenguaje natural. Puede sugerir otras palabras que las personas pueden usar que tienen significados similares, usar la comprensión del lenguaje natural basado en el aprendizaje automático para mejorar el vocabulario con el tiempo o entregar solicitudes a un asistente humano si el bot no entiende qué hacer.

Finalmente, la compañía introdujo un conjunto mucho más amplio de servicios cognitivos, pasando de 22 servicios distintos a 5 del año pasado. Estos servicios cubren una amplia gama de escenarios, incluidos el reconocimiento de objetos, el habla, el conocimiento y la búsqueda. Un ejemplo implicaba un Caption Bot que agrega títulos a las imágenes, usando una combinación de reconocimiento de objetos más lenguaje natural. Otra herramienta llamada CRIS (Servicio de Inteligencia de Reconocimiento Personalizado) parecía hacer un mejor trabajo de conversión de voz a texto que los métodos convencionales. Finalmente, demostraron el uso de las herramientas para realizar análisis en feeds de Twitter, muestreando imágenes de perfil para determinar la edad y el género de un afiche.

Por supuesto, Microsoft anunció una variedad de otras herramientas dirigidas también a los desarrolladores, haciendo un impulso particular de que Windows debería ser la plataforma que usan para desarrollar aplicaciones independientemente de la plataforma. La más sorprendente de estas nuevas herramientas, al menos hasta los rumores de la semana pasada, es la incorporación del shell BASH de Linux, pero otras herramientas incluyen un convertidor de aplicaciones de escritorio para mover aplicaciones de escritorio Win32 tradicionales a nuevas aplicaciones universales; un gran impulso para las herramientas de desarrollo cruzado de Xamarin, lo que sugiere que los desarrolladores pueden crear el núcleo de una aplicación multiplataforma y los cambios específicos para cada entorno, incluidos Android e iOS, así como Windows, todo en una plataforma Windows.

Además, Microsoft mostró el "modo de desarrollo", una herramienta para convertir una Xbox One en una máquina de plataforma de desarrollador, que se distribuye hoy; y dijo que la primera versión de HoloLens también estaba disponible para desarrolladores a partir de hoy.

Nadella comenzó la mañana hablando sobre cómo ahora estamos viendo más discusión sobre el papel de la tecnología en nuestra sociedad, porque la tecnología se ha convertido en una corriente principal e integrada en nuestra vida cotidiana, empresas y economías. Dijo que había preguntas sobre si la tecnología está impulsando el crecimiento económico para todos, o si el crecimiento económico se ha estancado a pesar del gasto en tecnología; si está permitiendo trabajos o desplazándolos; y si está habilitando o entorpeciendo valores perdurables, como la privacidad.

"Soy optimista", dijo, creyendo que la tecnología puede impulsar el crecimiento económico en todo el mundo, puede empoderarnos en nuestra vida cotidiana y respaldar nuestro valor duradero. Para hacer esto, dijo, debemos asegurarnos de usar la tecnología de manera que permita esto, volviendo a la declaración de misión actual de Microsoft de "empoderar a cada persona y cada organización en el planeta para lograr más". Esto, dijo, debe comenzar con los desarrolladores.

Terminó la presentación con un video que mostraba cómo Saqib Shaikh, un desarrollador ciego de Microsoft, ha podido usar técnicas cognitivas con los lentes inteligentes Pivothead para obtener información sobre el mundo que lo rodea. Los ejemplos incluyen escuchar a las personas que juegan en un parque y deslizar sus lentes para escuchar que era una niña lanzando un Frisbee. Este es solo un proyecto de investigación ahora, pero fue bastante inspirador, y Nadella llevó al desarrollador al escenario.

Para mí, vi la nota clave como un movimiento hacia el establecimiento de nuevas plataformas basadas en el aprendizaje automático y los bots, así como un reconocimiento de que, a pesar de lo exitoso que ha sido Windows, Microsoft está lejos de ser dominante en la nube y básicamente ha perdido la batalla. para convertirse en una importante plataforma de telefonía móvil. (De hecho, solo una demostración de toda la presentación se realizó en Windows Phone, y esa fue una demostración de Skype que podría haberse realizado en Android con la misma facilidad). No es sorprendente, entonces, que Microsoft esté mirando hacia la próxima plataforma, donde, por supuesto, se enfrentará a competidores tradicionales y nuevos.

Las herramientas cognitivas y de conversación ocupan un lugar central en Microsoft Build