Técnico

Crea prototipos de tu proyecto de aprendizaje automático sin una sola línea de código con Azure

March 18th, 2024

Santiago Aznarez

Lead Machine Learning Engineer

Introducción

Crear un prototipo de una solución de aprendizaje automático es crucial, ya que actúa como piedra angular para la resolución efectiva de problemas. Porque permite probar y validar ideas rápidamente, lo cual es clave en un campo como el aprendizaje automático, que se caracteriza por algoritmos complejos y patrones de datos impredecibles. Mediante este proceso, los equipos pueden evaluar rápidamente la viabilidad de un proyecto, ahorrando tiempo y recursos que, de otro modo, podrían dedicarse a ideas inviables. En este blog, analizaremos cómo Azure permite la creación rápida de prototipos sin código en el aprendizaje automático. Además, puedes crear prototipos de una idea de proyecto sobre la marcha. Únase a nosotros para descubrir cómo puede crear prototipos de su solución de aprendizaje automático con las herramientas potentes y fáciles de usar de Azure, que hacen que el aprendizaje automático sea accesible para todos.

¿Por qué es importante la creación de prototipos?

Los proyectos de aprendizaje automático suelen estar cargados de incertidumbres; ¿es el proyecto alcanzable? ¿Los datos son lo suficientemente buenos? Sin embargo, preguntas difíciles como estas pueden responderse en la fase de creación de prototipos, lo que aporta claridad a todo el proyecto. En las próximas secciones, desarrollaremos un clasificador de aprendizaje automático destinado a predecir la insuficiencia cardíaca. Usaremos el Conjunto de datos de predicción de insuficiencia cardíaca, que está a disposición del público. Nuestro viaje abarcará varias etapas clave:

Proceso de etiquetado: Comenzaremos detallando cómo etiquetar el conjunto de datos de manera efectiva, preparándolo para un entrenamiento preciso del modelo.
Entrenamiento modelo: Entrenaremos nuestro modelo con la herramienta AutoML de Azure. Esta fase incluye la selección de los parámetros correctos y la ejecución del proceso de formación automatizado.
Despliegue del modelo: Por último, implementaremos nuestro modelo entrenado, creando un punto final operativo para uso práctico.

Configuración del espacio de trabajo de Azure

Para empezar con Azure, necesitará una suscripción. Si aún no tiene una, puede suscribirse a una suscripción de prueba en la dirección proporcionada eslabón. Tras adquirir la suscripción a Azure, proceda de la siguiente manera en Azure Portal:

Usa la barra de búsqueda para encontrar Grupos de recursos.
Cree un nuevo grupo de recursos. Sirve como contenedor para todos los recursos de la solución Azure relacionados.
En el grupo de recursos recién creado, seleccione crear recurso y mira hacia arriba Aprendizaje automático de Azure.
Siga adelante y establezca un recurso de aprendizaje automático de Azure. Tenga en cuenta que la configuración puede tardar unos minutos.
Cuando su recurso de aprendizaje automático de Azure esté listo, haga clic en Estudio de lanzamiento dentro de él.

Create a resource group in Azure is the first step to start your machine learning prototype

Cómo etiquetar tu conjunto de datos

En el aprendizaje supervisado, los algoritmos aprenden de conjuntos de datos etiquetados. Estas etiquetas son la verdad fundamental y guían al modelo para comprender las correlaciones entre las entidades de entrada y las salidas correspondientes. Por lo tanto, sin etiquetas, el modelo no tendría ningún punto de referencia del que aprender. Para nuestro prototipo, utilizaremos un conjunto de datos tabular preetiquetado, lo que eliminará la necesidad de etiquetar manualmente. Sin embargo, si su proyecto implica trabajar con imágenes, texto o datos de audio, la herramienta de etiquetado Azure ML puede simplificar considerablemente el proceso de etiquetado.

Labelling your dataset is crucial in prototyping the machine learning solution

La herramienta de etiquetado de datos de Azure ofrece varias opciones de etiquetado para tareas específicas de aprendizaje automático. Para los problemas de visión artificial, ofrece opciones como la clasificación de imágenes y la segmentación semántica. Del mismo modo, también hay diferentes opciones disponibles para los tipos de datos de texto y audio. La configuración de su proyecto de etiquetado de datos en Azure ofrece varias opciones beneficiosas:

Fuerza laboral: Puede optar por utilizar una empresa de etiquetado de proveedores de Azure Marketplace, que le proporcionará asistencia experta en el etiquetado de datos.
Actualización incremental: Esta función garantiza que su conjunto de datos se compruebe periódicamente en busca de nuevos puntos de datos. Cualquier adición, como imágenes nuevas en un conjunto de datos de clasificación de imágenes, se incluirá automáticamente como tarea en el proyecto de etiquetado.
Control de calidad: Implemente un sistema en el que cada activo reciba varias etiquetas. Luego, estas etiquetas se pueden revisar de forma colectiva para establecer una etiqueta de consenso que mejore la precisión de los datos.
Etiquetado asistido por ML: Aumente la eficiencia de su proyecto de etiquetado habilitando el etiquetado asistido por aprendizaje automático. Esta función entrena un modelo para etiquetar de forma preliminar los datos, que los etiquetadores pueden revisar y finalizar posteriormente.

Sube tu conjunto de datos

Para cargar el conjunto de datos en Azure, siga estos pasos:

Comience por descargar el conjunto de datos de Kaggle.
Navega hasta Datos en el menú de la izquierda de Azure ML Studio.
Haga clic en Crear activo de datos.
Seleccione Tabular como tipo de datos.
En la pantalla siguiente, seleccione Desde archivos locales como fuente de datos y continúe con el siguiente paso.
Elija el almacén de datos para almacenar el conjunto de datos. Por ejemplo, selecciona Azure Blob Storage.
Selecciona el conjunto de datos de tus archivos locales.
Para los próximos pasos, mantén las opciones predeterminadas.

Aprendizaje automático automatizado

El aprendizaje automático implica la automatización de las tareas repetitivas y lentas que intervienen en el desarrollo del modelo de aprendizaje automático. Esto permite a los científicos, analistas y desarrolladores de datos crear modelos de aprendizaje automático eficientes y productivos a gran escala, al tiempo que garantiza una calidad sostenida de los modelos. Además, democratiza el aprendizaje automático al no ayudar a ningún experto técnico a desarrollar este tipo de soluciones. Azure AutoML destaca como una excelente herramienta del servicio Azure Machine Learning, que agiliza los complejos aspectos del aprendizaje automático al centrarse en la selección de modelos y el ajuste de hiperparámetros. En el ámbito de la selección de modelos, esta herramienta automatiza de manera eficiente las tareas que tradicionalmente consumían mucho tiempo. Explora de forma inteligente diversos algoritmos de aprendizaje automático y elige el más adecuado para un conjunto de datos y un problema determinados. Además, otra capacidad crucial de Azure AutoML es la automatización del ajuste de los hiperparámetros. Los hiperparámetros desempeñan un papel importante a la hora de determinar la configuración óptima para los algoritmos de aprendizaje automático, ya que influyen directamente en el rendimiento del modelo. Azure AutoML soluciona este problema automatizando la exploración del espacio de hiperparámetros y buscando la configuración más eficaz para el algoritmo elegido. Como se ha mencionado, Azure AutoML cuenta con numerosas ventajas. Al automatizar la selección de modelos y el ajuste de los hiperparámetros, reduce considerablemente el tiempo y el esfuerzo invertidos en el desarrollo de modelos de aprendizaje automático de alta calidad. Además, su accesibilidad permite a las personas con diferentes niveles de experiencia aprovechar el poder del aprendizaje automático sin tener un conocimiento profundo de las complejidades de los algoritmos. Por último, una parte integral de Azure AutoML es su perfecta integración con el servicio Azure Machine Learning, lo que facilita una transición fluida del desarrollo del modelo a la implementación. Azure AutoML es una herramienta sólida y eficiente que permite a los científicos y desarrolladores de datos aprovechar el potencial del aprendizaje automático y, al mismo tiempo, mitigar las complejidades asociadas al desarrollo manual de modelos.

Ejecute un experimento de AutoML

Siga estos pasos para ejecutar un experimento de aprendizaje automático para predecir la insuficiencia cardíaca:

Iniciar un trabajo de AutoML: En Azure ML Studio, haga clic en ML automatizado en la barra lateral izquierda, luego selecciona Nueva tarea de aprendizaje automático.

Create the automated machine learning experiment

Complete la información básica: Proporcione los detalles necesarios sobre su trabajo de aprendizaje automático.
Seleccione la tarea ML: Elige Clasificación como tarea de aprendizaje automático, ya que el objetivo es predecir la insuficiencia cardíaca en función de los síntomas.
Elija conjunto de datos: Selecciona el conjunto de datos que has subido anteriormente.
Configurar los ajustes de la tarea:
1. Set Enfermedad cardiaca como columna de destino.
2. Luego, en Ver configuración adicional configuración, puede elegir la métrica principal para el rendimiento del modelo, excluir modelos específicos y más. Por ahora, dejemos las opciones predeterminadas.
3. En Ver la configuración de funciones, puede decidir cómo gestionar los datos faltantes y definir los tipos de variables (por ejemplo, categorizar una variable de entrada).
4. En Límites, puede configurar las opciones de parada temprana. Pero por ahora, limítese a los valores predeterminados.
Validar y probar:
1. Mantener Tipo de validación como Automatic.
2. Para Datos de prueba, seleccione la división entre el entrenamiento y la prueba y el 15% como Prueba porcentual de datos. Esto significa que el 15% del conjunto de datos se utilizará para probarlo y el 85% restante se utilizará para la formación.

Configuration of the machine learning experiment

Finalizar y enviar: Deje los demás ajustes por defecto y envíe el trabajo de formación.

Resultados del experimento AutoML

El puesto de formación aparecerá en el ML automatizado página. Una vez que haya terminado, haga clic en ella para ver los resultados. Dentro del trabajo de formación, vaya a Modelos + trabajos infantiles En esta pestaña, verás todos los algoritmos que se entrenaron durante el proceso, con sus métricas correspondientes.

Best models trained by the automated machine learning experiment

Como puede ver, se entrenaron muchos modelos diferentes, desde regresiones logísticas hasta XGBoosts. El modelo con mejor desempeño es el que está en la cima, un conjunto de votantes. Básicamente, es un conjunto de varios modelos que funcionan en conjunto para hacer una predicción. Haga clic en él para ver las métricas resultantes del modelo y otra información interesante al respecto. La información más interesante sobre el modelo se encuentra en Explicaciones y Métricas pestañas. En la pestaña de explicaciones, está disponible la información explicativa sobre el modelo, desde la información del conjunto de datos hasta la importancia de las características globales e individuales.

Most important features on the trained machine learning model

Por otro lado, en la pestaña Métricas, encontrará todas las métricas de rendimiento relacionadas con el modelo de aprendizaje automático, la precisión, la precisión, la puntuación de F1, etc. Además de algunos gráficos de curvas y matrices de confusión, para la validación y el conjunto de pruebas. [caption id="attachment_3017" align="aligncenter» width="660"]

Métricas de rendimiento del conjunto de pruebas [/caption] [caption id="attachment_3018" align="aligncenter» width="551"]

Matriz de confusión en el conjunto de pruebas [/caption] Así que, sin una sola línea de código, ¡tenemos un modelo que puede predecir la insuficiencia cardíaca con una precisión del 90%! Para terminar, implementemos el modelo en un punto final que funcione.

Implemente el modelo resultante

La implementación de modelos de aprendizaje automático entrenados es realmente fácil en Azure Machine Learning. Para implementar el mejor modelo desde su ejecución de AutoML, simplemente haga clic en «Implementar» en los detalles del modelo y seleccione la opción que mejor se adapte a su solución. Los terminales en tiempo real son ideales para escenarios que requieren inferencias inmediatas y baja latencia, y son especialmente adecuados para modelos más simples con tamaños de entrada más pequeños. Por otro lado, los «terminales por lotes» están diseñados para implementar modelos o procesos más pesados que requieren un procesamiento asincrónico, lo que permite gestionar tareas más grandes y complejas de manera eficiente. Para nuestro clasificador de insuficiencia cardíaca, optaremos por un criterio de valoración en tiempo real. Para esta implementación, podemos seguir con la configuración predeterminada de los terminales.

Una vez finalizado el proceso de implementación, el nuevo punto final aparecerá en Puntos finales en el menú de la izquierda. Dentro de la página de punto final, hay una gama de funcionalidades disponibles. Incluyen probar el terminal (hacer inferencias), acceder al código para su consumo, supervisar las actividades de solicitud y examinar los registros, entre otras cosas. Para hacer inferencias sobre el modelo, navegue hasta el Prueba pestaña dentro de la página de punto final. Complete la estructura JSON con las variables de entrada requeridas, como en la siguiente imagen, y luego haga clic en el botón «Probar». Verás los resultados de la inferencia en la parte derecha de la pantalla. Este proceso le permite evaluar el rendimiento del modelo utilizando entradas de datos reales.

Como se ve en la imagen de arriba, para los síntomas especificados en el campo «datos», el modelo predijo un «0», lo que significa que el corazón del paciente probablemente esté sano. Mientras que un «1» sugeriría un posible problema de salud cardíaca.

Reflexiones finales

Al terminar nuestro recorrido por el mundo de la creación de prototipos sin código con Azure, observamos algunas ideas clave. El proceso que va desde la configuración de un espacio de trabajo de Azure hasta la implementación de un modelo de aprendizaje automático totalmente funcional, sin necesidad de escribir una sola línea de código, pone de relieve los importantes avances realizados para hacer que el aprendizaje automático sea más accesible y eficiente.

Hacer que el aprendizaje automático sea más accesible: La interfaz intuitiva de Azure, junto con herramientas eficaces como AutoML y la herramienta de etiquetado Azure ML, hacen que el aprendizaje automático sea accesible para un público más amplio. Este cambio va más allá de la simple simplificación de los procesos; se trata de permitir que las personas sin experiencia técnica participen en la resolución de problemas basada en el aprendizaje automático.
Eficiencia y rapidez: El estudio de caso sobre el desarrollo de un modelo de predicción de la insuficiencia cardíaca destacó la velocidad y la eficiencia de las herramientas de aprendizaje automático de Azure. Azure automatiza las tareas que requieren mucha mano de obra, como la selección de modelos y el ajuste de hiperparámetros, lo que permite la creación rápida de prototipos.
Escalabilidad y adaptabilidad: La plataforma de aprendizaje automático de Azure no solo sirve para crear prototipos, sino que también se escala para admitir modelos de producción. Esta escalabilidad garantiza que la transición de un prototipo a un entorno de producción sea fluida, manteniendo la integridad y el rendimiento de los modelos de aprendizaje automático.

En resumen, el entorno de aprendizaje automático sin código de Azure presenta un cambio de paradigma en la forma en que abordamos el desarrollo de soluciones de aprendizaje automático. Su combinación de accesibilidad, eficiencia y potencia abre nuevas posibilidades de innovación, lo que la convierte en una excelente herramienta para quienes buscan aprovechar el potencial del aprendizaje automático.

Crea prototipos de tu proyecto de aprendizaje automático sin una sola línea de código con Azure

Introducción

¿Por qué es importante la creación de prototipos?

Configuración del espacio de trabajo de Azure

Cómo etiquetar tu conjunto de datos

Sube tu conjunto de datos

Aprendizaje automático automatizado

Ejecute un experimento de AutoML

Resultados del experimento AutoML

Implemente el modelo resultante

Reflexiones finales

News, Insights & Impact

Protocolo de contexto modelo: potencie a sus agentes con MCP

Explorando — Nvidia CuOpt

Explorando NVIDIA Isaac GR00T

Génesis: redefiniendo las simulaciones de robótica y física

Cada viaje de IA comienza con una conversación