Hogar Negocio 7 consejos para el éxito del aprendizaje automático

7 consejos para el éxito del aprendizaje automático

Tabla de contenido:

Video: ¡7 Ejercicios para Concentrarte Más! (Fáciles de usar) | Taller (Noviembre 2024)

Video: ¡7 Ejercicios para Concentrarte Más! (Fáciles de usar) | Taller (Noviembre 2024)
Anonim

La primera parte de nuestra Guía comercial para el aprendizaje automático (ML) desglosó cómo el concepto general de ML es mucho más matizado en un entorno empresarial. Las estrategias más efectivas analizan el LD en un sentido práctico, empleando tanto técnicas de aprendizaje profundo complejas como técnicas de "aprendizaje barato" menos intensivas para optimizar los procesos empresariales y obtener información tangible de inteligencia empresarial (BI).

El objetivo de implementar ML dentro de las aplicaciones de su negocio es mejorar sus resultados o aprovechar la ventaja competitiva de su empresa. Pero en el esquema más amplio de su organización, aprovechar al máximo el tiempo y los recursos que invierte en este proceso va mucho más allá de los algoritmos. Los tomadores de decisiones de TI en su negocio deben asegurarse de que todo lo que tenga en cuenta su impedancia de LD, desde los datos y la logística hasta la forma en que interactúa con los usuarios, funcione de manera coherente para maximizar la eficacia.

Ted Dunning, Ph.D., es el arquitecto jefe de aplicaciones en MapR, una compañía de software empresarial que ofrece varias distribuciones de Big Data y herramientas de gestión de datos. Dunning también es coautor de dos libros sobre lo que él llama "Aprendizaje automático práctico" y desarrolló tecnologías de ML para varias empresas a lo largo de los años, incluido el sistema de detección de fraude ID Analytics (comprado por LifeLock) y el software Musicmatch Jukebox, que luego se convirtió en Yahoo Music. Actualmente también se desempeña como Vicepresidente de Incubación de la Apache Software Foundation.

Dunning ha visto evolucionar el espacio ML durante décadas, y aprendió mucho sobre lo que funciona y lo que no funciona en un entorno empresarial práctico. A continuación, Dunning presenta siete mejores prácticas a seguir cuando se desarrollan soluciones comerciales basadas en ML.

1. No olvides la logística

El éxito de ML no se trata solo de elegir la herramienta o algoritmo adecuado. Dunning dijo que también debe determinar qué enfoque es el adecuado y diseñarlo para la situación particular que está abordando. Por ejemplo, Dunning habló sobre ML en una campaña de marketing en línea en lugar de escenarios mucho más complicados, como los algoritmos que guían un automóvil autónomo. Gastar sus recursos para una mejora incremental del algoritmo vale la pena para el automóvil, pero en el escenario de marketing, vería un retorno mucho mejor al optimizar toda la logística a su alrededor.

"A menudo, para las empresas, es la logística, no el aprendizaje, lo que le da el valor. Esa es la parte en la que debería dedicar su tiempo y recursos", dijo Dunning. "Ajustar el algoritmo te daría una pequeña mejora. Pero ajustar esa información, la GUI y cómo estás escuchando y relacionarte con tus usuarios podría darte una mejora del 100 por ciento. Pasar tiempo ajustando el algoritmo vale una fracción como tanto para las empresas como para escuchar a sus usuarios ".

Para ilustrar este punto, Dunning explicó cómo una vez construyó un modelo para identificar el fraude de aplicaciones (abrir cuentas falsas con identidades robadas) en la base de datos de clientes de una empresa. El modelo que construyó obtuvo excelentes resultados, pero Dunning notó que ponderaba mucho el género del solicitante.

Resultó que la logística estaba apagada. La forma en que funcionó el proceso de solicitud, el solicitante solo completó su género después de que ya se había convertido en un cliente y había pasado una serie de pasos de detección para filtrar a los estafadores. Entonces, al usar el campo de género, el modelo de ML estaba engañando la logística de todo el proceso de fraude. Eso no tiene nada que ver con el algoritmo, y todo tiene que ver con cómo la empresa estaba obteniendo sus datos en primer lugar.

2. Cuida tus datos

Dunning está lleno de cositas pegadizas de sabiduría. Después de comenzar con "es la logística, no el aprendizaje", dijo que la otra mitad de esa idea es "son los datos, no los algoritmos". Una gran parte de garantizar que sus algoritmos de ML estén entregando información valiosa es asegurarse de que les está proporcionando los datos correctos. Dunning dijo que si no obtiene el resultado que está buscando, la mayoría de las veces es porque no está utilizando los datos correctos.

"La gente se enfada y se une al ego con algoritmos particulares, pero hoy en día, debido a las herramientas disponibles, todos y su madre pueden y están inventando todo tipo de algoritmos nuevos", dijo Dunning. "Los datos son mucho más importantes y le darán mucho más impulso que ajustar sus algoritmos sin cesar. Si está trabajando en un problema difícil como el reconocimiento de voz o la visión por computadora, eso es una cosa. Pero este es un campo basado en datos. En la mayoría de los escenarios, se beneficiará mucho más ajustando los datos que obtiene y cambiando la pregunta ".

Eso es lo que hizo Dunning a mediados de la década de 2000 cuando construyó un motor de recomendación de video en una compañía llamada Veoh Networks. El equipo estaba trabajando para identificar pares de videos generados por los usuarios en los que la gente hizo clic más de lo esperado, pero el algoritmo no estaba funcionando. Pensaban en términos de música, donde los usuarios conocen a sus artistas y canciones favoritas por su nombre. Entonces cambiaron la pregunta ajustando la interfaz de usuario sin tocar el algoritmo mismo.

"En los videos generados por los usuarios, nadie conoce a los artistas y muchos videos tenían títulos realmente spam para obtener más vistas. Ciclar los ajustes de algoritmos nunca nos hubiera dado buenos resultados", dijo Dunning. "Lo que hicimos fue cambiar la interfaz de usuario para emitir una señal de baliza cada 10 segundos. Descubrimos que si usábamos la baliza en lugar de los clics para los datos sin procesar del recomendante, obteníamos resultados impresionantes. El aumento para este cambio fue varios cien por ciento de mejora en el compromiso debido a recomendaciones, sin cambios algorítmicos ".

3. Los algoritmos no son balas mágicas

Las implementaciones de ML prosperan en prueba y error continuos. No importa cuán buenos sean sus algoritmos, si su sistema está interactuando con humanos, entonces deberá ajustarse con el tiempo. Dunning enfatizó que las empresas deben medir constantemente la efectividad general de su implementación e identificar los cambios y las variables que lo mejoran y empeoran. Esto puede sonar como un tópico, pero Dunning dijo que, a pesar de lo obvio que suena, muy pocas personas lo están haciendo o lo están haciendo bien.

"Mucha gente quiere implementar un sistema o tomar alguna medida, y quieren que su algoritmo se ejecute perfectamente para siempre", dijo Dunning. "Ningún algoritmo será una bala mágica. Ningún diseño de interfaz de usuario se mantendrá para siempre. Ningún método de recopilación de datos nunca será reemplazado. Todo esto puede y sucederá, y las empresas deben medir, evaluar y reevaluar atentamente cómo el sistema funciona ".

4. Use un conjunto de herramientas diversas

Hay docenas de herramientas de ML disponibles, muchas de las cuales puede usar de forma gratuita. Tiene bibliotecas de marcos de código abierto populares como Caffe, H20, Shogun, TensorFlow y Torch, y bibliotecas ML en varios proyectos de la Fundación de Software Apache (ASF), incluidos Mahout, Singa y Spark. Luego están las opciones basadas en suscripción que incluyen Amazon Machine Learning, BigML y Microsoft Azure Machine Learning Studio. Microsoft también tiene un Kit de herramientas cognitivas gratuito.

Hay innumerables recursos disponibles. Dunning ha hablado con numerosas empresas, científicos de datos y profesionales de ML, y siempre les pregunta cuántos marcos y herramientas diferentes utilizan. En promedio, Dunning dijo que la mayoría dijo que usa un mínimo de 5-7 herramientas y, a menudo, mucho más.

"No puede pegarse a una herramienta. Tendrá que usar varias, y como tal, será mejor que construya su sistema de una manera que sea independiente", dijo Dunning. "Cualquiera que intente convencerte de que esta herramienta es la única que necesitarás es venderte una lista de productos.

"Algo podría suceder la próxima semana que altere el carrito de manzanas, y al ritmo de innovación que estamos viendo, eso seguirá sucediendo por otros cinco a 10 años al menos", continuó Dunning. "Mire un ejemplo de aprendizaje barato en el que tal vez esté reutilizando un clasificador de imágenes existente para analizar imágenes en un catálogo. Eso es aprendizaje profundo con visión por computadora incorporada. Pero hay herramientas que lo han empaquetado todo. Necesita para medir, evaluar y vacilar entre diferentes herramientas, y su infraestructura debe ser bienvenida para eso ".

5. Experimente con el aprendizaje híbrido

Dunning dijo que también se puede combinar el aprendizaje barato y profundo en una especie de híbrido. Por ejemplo, si toma un modelo de visión por computadora existente y reconstruye las pocas capas superiores donde se toma una decisión, puede cooptar un marco existente para un caso de uso completamente nuevo. Dunning señaló una competencia de Kaggle en la que los concursantes hicieron exactamente eso; tomaron un conjunto de datos y escribieron un nuevo algoritmo en la parte superior para ayudar a una computadora a distinguir a los gatos de los perros.

"Distinguir gatos y perros es algo muy sutil para un algoritmo de ML. Piensa en la lógica: los gatos tienen orejas puntiagudas, pero también los pastores alemanes. Los perros no tienen manchas, excepto los dálmatas, etc. Eso puede ser bastante difícil de reconocer en sí mismo ", dijo Dunning. "El tipo que ganó desarrolló un sistema que hizo esto con una precisión del 99 por ciento. Pero me impresionó más la persona que quedó en tercer lugar. En lugar de construir desde cero, tomó un programa de reconocimiento de imágenes existente de una tarea diferente, se quitó el capa superior, y puso un clasificador simple allí. Le dio algunos ejemplos, y pronto, fue 98 por ciento exacto en la diferenciación de gatos de perros. Todo el proceso le tomó al hombre tres horas ".

6. Barato no significa malo

A pesar de la connotación abierta, Dunning dijo que el aprendizaje barato no significa mal aprendizaje. La cantidad de tiempo que pasa en una implementación de ML no se correlaciona directamente con su valor comercial. La cualidad más importante, dijo, es asegurarse de que el proceso sea repetible y confiable. Si la empresa puede lograrlo sin invertir una cantidad indebida de recursos, entonces eso es mucho mejor.

"Barato no significa malo. Si funciona, funciona. Si es barato y funciona, eso es grandioso. Pero el esfuerzo que pones en construirlo no define el valor. Esa es una falacia de costo total", dijo Dunning. "Lo que define el valor es cómo mejora el negocio. Si mejora las ganancias o disminuye los costos o mejora su situación competitiva. Es el efecto, no el esfuerzo".

7. No lo llames AI

Dunning enfatizó que, al hablar sobre estas técnicas, las empresas deben usar la terminología precisa: ML, visión por computadora o aprendizaje profundo. Todo esto tiende a caer bajo el término general "inteligencia artificial" pero, para Dunning, la definición de IA es simplemente "cosas que aún no funcionan".

"La mejor definición que he escuchado para la IA es que son las cosas que aún no podemos explicar. Las cosas que no hemos descubierto", dijo Dunning. "Cada vez que tenemos algo para trabajar, la gente dice 'Oh, eso no es IA, es solo software. Es solo un motor de reglas. Realmente es solo una regresión logística'. Antes de darnos cuenta de algo, lo llamamos AI. Después, siempre lo llamamos de otra manera. En muchos sentidos, AI se usa mejor como una palabra para la próxima frontera, y en AI, siempre habrá una próxima frontera. AI es a dónde vamos, no a dónde ya hemos llegado ".

7 consejos para el éxito del aprendizaje automático