Compartir

Soluciones de software y hardware empresarial diseñadas conjuntamente por HPE y NVIDIA aceleran el desarrollo e implementación de las aplicaciones GenAI

SAN JOSE, Calif. – 25 de marzo de 2024 – El día de hoy en NVIDIA GTC, Hewlett Packard Enterprise (NYSE: HPE) anunció actualizaciones a uno de los portafolios nativos de IA más completos de la industria para acelerar la operativización de las aplicaciones de IA generativa (GenAI, por sus siglas en inglés), aprendizaje profundo y aprendizaje automático (ML, por sus siglas en inglés). Las actualizaciones son:

  • Disponibilidad de dos soluciones GenAI completas codesarrolladas por HPE y NVIDIA.
  • Una versión preliminar del software HPE Machine Learning Inference.
  • Una arquitectura de referencia de generación aumentada de recuperación (RAG, por sus siglas en inglés).
  • Soporte para desarrollar productos futuros basados en la nueva plataforma NVIDIA Blackwell.

“Para cumplir la promesa de la GenAI y abordar con eficacia todo el ciclo de vida de la IA, las soluciones deben ser híbridas por diseño”, dijo Antonio Neri, presidente y CEO de HPE. “Desde entrenamiento y optimización de modelos localmente, en un centro de datos o en la nube pública hasta inferencia en la periferia, la IA es una carga de trabajo híbrida. HPE y NVIDIA tienen un largo historial de innovación colaborativa y seguimos ofreciendo soluciones de software y hardware de IA diseñadas conjuntamente para ayudar a nuestros clientes a acelerar el desarrollo y la implementación de GenAI desde el concepto hasta la producción”.

“La IA generativa puede convertir los datos de dispositivos conectados, centros de datos y nubes en ideas que pueden impulsar los avances entre las industrias”, dijo Jensen Huang, fundador y CEO de NVIDIA “. Nuestra creciente colaboración con HPE permitirá a las empresas entregar una productividad sin precedente al aprovechar sus datos para desarrollar e implementar nuevas aplicaciones de IA para transformar sus negocios”.

 

Entrenamiento y optimización de GenAI impulsados por supercomputación

Anunciada en SC23, la solución de supercomputación de HPE para la IA generativa ya está disponible para pedido para las organizaciones que buscan una solución integral previamente configurada y probada para el desarrollo y entrenamiento de grandes modelos de IA. Diseñada específicamente para ayudar a los clientes a acelerar sus proyectos de GenAI y aprendizaje profundo, la solución lista para usarse está potenciada por NVIDIA y soporta hasta 168 superchips Grace Hopper GH200. La solución permite a empresas grandes, las instituciones de investigación y las entidades gubernamentales optimizar el portafolio de desarrollo de modelos con una pila de software de IA/ML que ayuda a los clientes a acelerar los proyectos de GenAI y aprendizaje profundo, incluyendo LLM, sistemas de recomendaciones y bases de datos vectoriales. Entregada con servicios de instalación y configuración, esta solución lista para usarse está diseñada para que los centros de investigación de IA y las empresas mejoren el tiempo de obtención de valor y dupliquen o tripliquen la velocidad del entrenamiento.

Para más información o realizar un pedido, visite la solución de supercomputación de HPE para la IA generativa.

 

Optimización e inferencia de la GenAI empresarial

Anunciada en Discover Barcelona 2023, la solución de computación empresarial de HPE para la IA generativa ya está disponible para los clientes directamente o a través de HPE GreenLake con un modelo de pago por uso flexible y escalable. Diseñada en conjunto con NVIDIA, la solución de optimización e inferencia preconfigurada está diseñada para reducir el tiempo de producción y los costos, ya que ofrece los servicios de computación, almacenamiento, software, interconexión y consultoría que las organizaciones necesitan para producir aplicaciones de GenAI. La solución integral nativa de IA proporciona a las empresas la velocidad, escala y control necesarios para personalizar los modelos de base con datos privados e implementar aplicaciones de GenAI dentro de un modelo de nube híbrida.

Con un clúster de computación IA de alto rendimiento y software de HPE y NVIDIA, la solución es ideal para la optimización ligera de modelos, RAG, e inferencia de escalamiento horizontal. El tiempo de optimización para un modelo Llama 2 con 70,000 millones de parámetros que ejecuta esta solución, disminuye linealmente con el conteo de nodos, lo que toma seis minutos en un sistema de 16 nodos[1]. La velocidad y el rendimiento permiten a los clientes acelerar el tiempo de obtención de valor y mejorar la productividad empresarial con aplicaciones de IA como asistentes virtuales, chatbots inteligentes y búsqueda empresarial.

Impulsada por servidores HPE ProLiant DL380a Gen11, la solución está preconfigurada con NVIDIA GPUs, la plataforma Spectrum-X Ethernet networking de NVIDIA y NVIDIA BlueField-3 DPUs. La solución se ha optimizado por la plataforma de aprendizaje automático y el software de análisis de HPE, el software NVIDIA AI Enterprise 5.0 con el nuevo microservicio NVIDIA NIM para una inferencia optimizada de modelos generativos de IA, así como NVIDIA NeMo Retriever y otras bibliotecas de ciencia de datos e IA.

Para abordar la brecha de habilidades de IA, los expertos de HPE Services ayudarán a las empresas a diseñar, implementar y gestionar la solución, lo que incluye aplicar técnicas adecuadas de optimización de modelos.

Para más información o realizar un pedido, visite la solución de supercomputación de HPE para la IA generativa.

 

Del prototipo a la productividad

HPE y NVIDIA están colaborando con soluciones de software que ayudarán a las empresas a dar el siguiente paso al convertir las pruebas de concepto de IA y ML en aplicaciones de producción. Disponible para los clientes de HPE como versión tecnológica preliminar, el software HPE Machine Learning Inference permitirá a las empresas implementar modelos de ML a escala de manera rápida y segura. La nueva oferta se integrará en NVIDIA NIM para ofrecer modelos de base optimizados por NVIDIA utilizando contenedores previamente desarrollados.

Para ayudar a las empresas que necesitan desarrollar e implementar rápidamente aplicaciones de GenAI que incorporen datos privados, HPE desarrolló una arquitectura de referencia para RAG empresarial (ya disponible) que está basada en la arquitectura de microservicios NVIDIA NeMo Retriever. Esta oferta consiste en una base de datos integral del software HPE Ezmeral Data Fabric y HPE GreenLake for File Storage. La nueva arquitectura de referencia ofrecerá a las empresas un plano para crear chatbots, generadores y copilotos personalizados.

Para brindar asistencia en la preparación de datos, el entrenamiento de IA y la inferencia, la solución fusiona toda la variedad de soluciones y herramientas de código abierto del software HPE Ezmeral Unified Analytics y del software de IA de HPE, que incluye el software HPE Machine Learning Data Management, HPE Machine Learning Development Environment y el nuevo HPE Machine Learning Inference. El software de IA de HPE está disponible en las soluciones tanto de supercomputación como de computación empresarial de HPE, a fin de permitir que la IA generativa ofrezca un entorno consistente donde los clientes puedan gestionar sus cargas de trabajo de GenIA.

 

Solución de próxima generación basada en la plataforma NVIDIA Blackwell

HPE desarrollará productos basados en la recién anunciada plataforma NVIDIA Blackwell, que incorpora un motor transformador de segunda generación de para acelerar las cargas de trabajo de GenAI. Los detalles adicionales y la disponibilidad de los próximos productos de HPE con el Superchip NVIDIA Grace Blackwell GB200, el HGX B200 y el HGXB100 se anunciarán en el futuro.

 

Acerca de Hewlett Packard Enterprise

Hewlett Packard Enterprise (NYSE: HPE) es la compañía global de la periferia a la nube que ayuda a las empresas a acelerar los resultados al desatar el valor de todos sus datos, en todo lugar. Tras décadas de reimaginar el futuro y de innovar para mejorar la forma en que las personas viven y trabajan, HPE ofrece soluciones tecnológicas únicas, abiertas e inteligentes disponibles como servicio. Con soluciones que abarcan servicios en la nube, computación, computación de alto rendimiento e IA, periferia inteligente, software, y almacenamiento, HPE brinda una experiencia consistente en todas las nubes y periferias para ayudar a los clientes a desarrollar nuevos modelos de negocio, interactuar en maneras nuevas y aumentar el rendimiento operativo. Para más información, visite www.hpe.com

[1] Basado en pruebas de rendimiento internas iniciales de llama-recipes finetuning.py que siguieron el tiempo promedio de optimizar ocho nodos a 594 segundos y 16 nodos a 369 segundos con atención flash y optimización eficiente de parámetros.

Compartir