¿Por qué usar las instancias G4 de Amazon EC2?
Las instancias G4 de Amazon EC2 son las instancias GPU más rentables y versátiles de la industria para implementar modelos de machine learning, como clasificación de imágenes, detección de objetos y reconocimiento por voz, y para las aplicaciones con uso intensivo de gráficos, como estaciones de trabajo remotas de gráficos, streaming de juegos y renderización de gráficos. Las instancias G4 están disponibles con la opción de GPU NVIDIA (G4dn) o GPU AMD (G4ad).
Las instancias G4dn cuentan con GPU NVIDIA T4 y CPU Intel Cascade Lake, y están optimizadas para inferencia de machine learning y formación a pequeña escala. Estas instancias también le brindan alto rendimiento a aplicaciones con uso intensivo de gráficos, lo que incluye estaciones de trabajo remotas de gráficos, streaming de juegos y renderización de gráficos. Estas instancias también son ideales para los clientes que prefieren usar software NVIDIA, como RTX Virtual Workstation, y bibliotecas, como CUDA, CuDNN y NVENC.
Las instancias G4ad cuentan con las GPU más recientes de AMD Radeon Pro V520 y con los procesadores AMD EPYC de segunda generación. Estas instancias también le brindan la mejor relación entre precio y rendimiento en la nube para aplicaciones de gráficos, lo que incluye estaciones de trabajo remotas de gráficos, streaming de juegos y renderización de gráficos. En comparación con instancias similares, ofrecen una relación entre precio y rendimiento hasta un 45 % mejor para las aplicaciones con uso intensivo de gráficos.
Nuevas instancias G4ad de Amazon EC2
Instancias G4dn de Amazon EC2
Las instancias G4dn, con tecnología de GPU NVIDIA T4, son las instancias de menor costo basadas en GPU en la nube para la inferencia de machine learning y la formación a pequeña escala. Además, proporcionan un alto rendimiento y son una solución rentable para las aplicaciones gráficas optimizadas para las GPU NVIDIA que usan bibliotecas NVIDIA, como CUDA, CuDNN y NVENC. Proporcionan hasta 8 GPU NVIDIA T4, 96 vCPUs, red de 100 Gbps y 1,8 TB de almacenamiento local SSD basado en NVMe y también están disponibles como instancias bare metal.
Beneficios de G4dn
Características de G4dn
Instancias G4ad de Amazon EC2
Las instancias G4ad, con tecnología de GPU AMD Radeon Pro V520, ofrecen la mejor relación entre precio y rendimiento para aplicaciones con uso intensivo de gráficos en la nube. Estas instancias ofrecen una relación entre precio y rendimiento hasta un 45 % mejor en comparación con las instancias G4dn, que ya eran las instancias de más bajo costo en la nube, para las aplicaciones de gráficos, como las estaciones de trabajo remotas de gráficos, streaming de juegos y renderizaciones que aprovechan las API estándar de la industria, como OpenGL, DirectX y Vulkan. Proporcionan hasta 4 GPU AMD Radeon Pro V520, 64 vCPUs, redes de 25 Gbps y almacenamiento local SSD basado en NVMe de 2,4 TB.
Beneficios de G4ad
Características de G4ad
Testimonios de clientes y socios
Estos son algunos ejemplos de cómo los clientes y socios lograron sus objetivos empresariales con las instancias G4 de Amazon EC2.
-
Ubitus
Ubitus es una innovadora empresa que lidera la creación de tecnología de juegos en la nube. A través de sus plataformas, los usuarios pueden disfrutar una experiencia de juego AAA en cualquier dispositivo, como smartphones, tablets, consolas de juegos, televisores inteligentes y equipos, siempre y cuando estén conectados a una red de banda ancha.
Lea el caso prácticoUbitus aprovechó las capacidades de GPU de AWS para asociarse con IO Interactive y lanzar una versión en la nube de Hitman 3 en un dispositivo de juegos altamente portátil. Con la presentación de las instancias G4ad de Amazon EC2, pudimos incorporar hasta un 50 % más de transmisiones por instancia sin cambiar ningún código, lo que nos permite optimizar nuestros costos. La estructura de costos más baja nos permite ofrecer más juegos, como Hitman 3, a clientes de todo el mundo.
Wesley Kuo, director ejecutivo de Ubitus -
Land F/X
Land F/X aprovecha la aceleración de la GPU para ayudar a los profesionales del diseño mientras maximiza tanto el rendimiento como el costo. Anteriormente, Land F/X usaba instancias G4dn para su desarrollo y, con el lanzamiento de G4ad, pudo migrar rápidamente, lo que le permitió lograr una mejora del 67 % en el rendimiento de las renderizaciones y un ahorro del 25 % en comparación con el uso anterior de la GPU.
Jeremiah Farmer, director ejecutivo (CEO)/desarrollador de Land F/X -
Duolingo
Duolingo es una plataforma de educación en idiomas que se convirtió en la forma más popular para aprender idiomas online. Los científicos de aprendizaje de idiomas, los ingenieros de machine learning y los expertos en IA de Duolingo utilizan datos de más de 300 millones de estudiantes para aumentar constantemente la efectividad de la plataforma.
Lea el caso prácticoA medida que nuestros equipos de ML e investigación crecieron, decidimos actualizar nuestra infraestructura de computación basada en Amazon ECS para que sea compatible con los tipos de instancias basadas en GPU, P3 y G4 de Amazon EC2, lo que nos permite escalar mejor nuestro modelo de desarrollo. Las AMI de Amazon optimizadas para ECS nos ayudaron a poner en funcionamiento rápidamente el nuevo clúster, y notamos que las instancias G4 duplicaron nuestra velocidad de formación de ML en comparación con las instancias P2, lo que llevó a un ahorro del 33 % en los costos, mientras que las instancias P3 cuadruplicaron el rendimiento y nos facilitaron un 15 % de ahorro de costos. En general, las instancias G4 son adecuadas para nuestros casos de uso general, ya que ofrecen un buen equilibrio entre costo y rendimiento, mientras que las instancias P3 son ideales cuando se requiere velocidad adicional para una carga de trabajo específica.
Max Blaze, ingeniero de operaciones de personal - Duolingo -
Blacknut
Blacknut es el principal servicio independiente de videojuegos en la nube que ofrece al público general una experiencia de “click & play” en cualquier dispositivo, con un catálogo de más de 500 videojuegos. Para llevar a cabo nuestra misión de ofrecer latencia baja, tiempos de carga reducidos y una experiencia de juego fluida, necesitamos estar ubicados lo más cerca posible de los jugadores. Con las instancias G4dn de EC2, podemos brindar a nuestros jugadores un tiempo de carga promedio de 10 segundos o menos por juego, de modo que garantizamos una experiencia de juego positiva en su conjunto. También podemos implementar nuestra solución en nuevos mercados en menos de dos meses, y esta capacidad de reacción nos permitió implementar nuevos socios globales cada mes desde 2020, incluidos Telecom Italia, Swisscom, POST, Drei Austria y Ais en Tailandia. Nuestro servicio ahora está disponible en más de 40 mercados.
Pascal Manchon, director de tecnología de Blacknut -
Snap
En 2018, Snap Inc. (Snap), conocido por su aplicación de mensajería Snapchat, tuvo una curiosa nueva idea: crear una serie de videos animados protagonizados por el Bitmoji de cada usuario (el avatar personalizado que es la característica destacada de Snapchat). Cada semana, Bitmoji TV presentaría nuevos episodios con absurdos videos de 3 a 8 minutos, con guiones y animación profesional, en los que los Bitmojis de los usuarios y sus amigos serían las estrellas, y harían de todo, desde luchar contra zombis hasta competir sin gravedad en unas olimpíadas en la luna llamadas “Moonlympics”. Con las instancias G4 de Amazon EC2, Snap pudo crear un tipo de entretenimiento personalizado, divertido y audaz que se renderizó lo suficientemente rápido como para que millones de personas pudieran disfrutarlo al mismo tiempo, mientras que mantuvieron sus costos informáticos bajos.
Lea el caso prácticoCon las instancias G4 de Amazon EC2, a diferencia de las instancias G3 de Amazon EC2, obtuvimos un aumento del 50 % con un coste solo un 10 % más alto.
Brad Kotsopolous, ingeniero de Software en Snap Inc. -
Nearmap
Nearmap fue fundada en Perth, Australia, en 2007 y creció de una pequeña empresa emergente a una empresa líder en imágenes digitales. La empresa se especializa en crear imágenes 2D y 3D de fotos aéreas de paisajes, un valioso recurso para una amplia variedad de industrias. Para Nearmap, el impacto de pasar a instancias G4 de Amazon EC2 fue inmediato y profundo: la empresa pudo ejecutar tres veces más datos por el mismo costo que las instancias G2 de Amazon EC2, en un proceso cómodo y cuya integración se produjo sin problemas con las herramientas de AWS que ya se estaban utilizando.
Lea el caso prácticoNuestros clientes confían en nosotros para obtener modelos de realidad en 3D muy precisos y calculados mediante fotografía aérea multiángulo capaz de abarcar grandes extensiones. Utilizamos alrededor de 870 mil núcleos de GPU por día. Solíamos utilizar esta canalización en instancias G2 de Amazon EC2, pero nos cambiamos a las instancias G4 de Amazon EC2 y redujimos nuestros costes un 67 %.
John Corbett, director de Vision Systems -
Untold Studios
Untold Studios implementó varias configuraciones de estaciones de trabajo virtuales de AWS, incluidas las instancias G4, que cuentan con GPU NVIDIA T4 y tecnología RTX, y están optimizadas para flujos de trabajo VFX y de animación. Con opciones de instancias expandidas para elegir, Untold Studios puede combinar con mayor precisión los tipos de máquinas virtuales con cargas de trabajo específicas, un enfoque que es beneficioso tanto a nivel creativo como económico.
G4 tuvo un gran impacto en la forma en la que trabajamos. Podemos actualizar una flota completa de estaciones de trabajo con una sola línea de código para que los artistas puedan trabajar con más rapidez y mejorar así la creatividad en todo lo que hacemos.
Sam Reid, director de Tecnología de Untold Studios -
Hive VFX
Las estaciones de trabajo primero se implementaron con instancias G3 de Amazon Elastic Compute Cloud (Amazon EC2). Pero cuando estuvieron disponibles las instancias G4 de Amazon EC2 (con tecnología de GPU NVIDIA T4 Tensor Core, la última generación de GPU de NVIDIA, y la tecnología NVIDIA RTX, la última tecnología para simulaciones, renderizaciones y diseño de alto rendimiento), Hive VFX pudo actualizarse de forma rápida y fácil.
Pasar de la instancia G3 a la G4 fue sencillo y, en pocos minutos, los artistas pudieron acceder a una nueva generación de GPU de NVIDIA que ofrecen los gráficos y el rendimiento informático más recientes. El rendimiento que obtenemos de la estación de trabajo con las instancias G4 supera el de los grandes estudios y es más que suficiente para nuestras necesidades.
Bernie Kimbacher, fundador de Hive VFX -
Humen
La publicidad de Doritos para el Super Bowl de 2020 mostró una competencia de baile entre un actor de 75 años, Sam Elliot, y un rapero de 21 años, Lil Nas X. Esta competencia fue posible gracias a la tecnología de inteligencia artificial desarrollada por una empresa emergente llamada Humen, la empresa principal detrás de Sway. Esta pequeña empresa logró asociarse con la megaempresa Doritos para una campaña y lanzó Sway, una aplicación que superó todos los rankings de la App Store con la ayuda de Amazon Web Services (AWS). Para enfrentarse a la colosal carga de trabajo que implica lanzar una aplicación de uso intensivo de gráficos durante el Super Bowl, Hume utilizó instancias G4 de Amazon Elastic Compute Cloud (Amazon EC2) y logró resultados increíbles.
Lea el caso prácticoCon las instancias G4 de Amazon EC2 pude, en aproximadamente 6 meses, hacer que Sway sea capaz de manejarse a la gran escala del Super Bowl.
Jesse Myers, ingeniero en Humen -
The Molecule
El software de efectos visuales confía cada vez más en el poder de la GPU; cuando la necesitas, realmente la necesitas, aunque no todos los días. Al ser una empresa pequeña, no podemos darnos el lujo de comprar un auto de carrera para ir al supermercado; no podemos comprar algo que no utilizaremos todos los días. Tampoco podemos comprar 10 para un proyecto que tenga demandas únicas. Pero con las instancias G4, tenemos acceso a una flota de autos de carrera habilitados por GPU que son mejores y más rápidos que lo que podríamos comprar, pero sin la sobrecarga de pagar por ellos si no los necesitamos. Los artistas están emocionados por tener acceso a estos autos de carrera, y nosotros estamos felices de devolverlos cuando no los necesitamos.
Chris Healer, presidente de The Molecule -
PureWeb
En PureWeb, nos esforzamos por ofrecer la mejor plataforma del mundo para hacer streaming en tiempo real de contenido interactivo para empresas. Por eso, cuando se canceló el Geneva International Motor Show debido al COVID-19, Volkswagen se contactó con nosotros con la solución innovadora de ofrecer la experiencia de una sala de exposición virtual para sus clientes para poder adaptarse a esta cancelación. Al trabajar de cerca con AWS, y con nuestros socios creativos de la agencia, pudimos generar una réplica de la sala de exposiciones, creada en Unity Game Engine, que funcionara en nuestra plataforma mediante instancias G4dn de Amazon EC2 en solo tres semanas. Como resultado, miles de usuarios pudieron disfrutar del puesto de Volkswagen en el Geneva Motor Show desde la comodidad de sus hogares. Dadas las limitaciones de tiempo y técnicas del proyecto, podemos asegurar que AWS es el único proveedor en la nube que nos podría haber ayudado a llevar a cabo este trabajo y a ofrecer una experiencia del usuario estable, escalable, rentable y verdaderamente global.
Chris Jarabek, arquitecto sénior de Software de PureWeb
Detalles del producto
Tamaño de la instancia | GPU | vCPU | Memoria (GiB) | Almacenamiento de instancias (GB) | Ancho de banda de red (Gbps) | Banda ancha de EBS (Gbps) | Precio de la instancia bajo demanda por hora* | Valor por hora real en una instancia reservada por 1 año* (Linux) | Valor por hora real en una instancia reservada por 3 años* (Linux) | |
G4dn |
||||||||||
MV con una sola GPU | g4dn.xlarge | 1 | 4 | 16 | 1 x 125 SSD NVMe | Hasta 25 | Hasta 3,5 | 0,526 USD | 0,316 USD | 0,210 USD |
g4dn.2xlarge | 1 | 8 | 32 | 1 x 225 SSD NVMe | Hasta 25 | Hasta 3,5 | 0,752 USD | 0,452 USD | 0,300 USD | |
g4dn.4xlarge | 1 | 16 | 64 | 1 x 225 SSD NVMe | Hasta 25 | 4,75 | 1,204 USD | 0,722 USD | 0,482 USD | |
g4dn.8xlarge | 1 | 32 | 128 | 1 x 900 SSD NVMe | 50 | 9,5 | 2,176 USD | 1,306 USD | 0,870 USD | |
g4dn.16xlarge | 1 | 64 | 256 | 1 x 900 SSD NVMe | 50 | 9,5 | 4,352 USD | 2,612 USD | 1,740 USD | |
MV con varias GPU | g4dn.12xlarge | 4 | 48 | 192 | 1 x 900 SSD NVMe | 50 | 9,5 | 3,912 USD | 2,348 USD | 1,564 USD |
g4dn.metal | 8 | 96 | 384 | 2 x 900 SSD NVMe | 100 | 19 | 7,824 USD | 4,694 USD | 3,130 USD | |
G4ad |
||||||||||
MV con una sola GPU | g4ad.xlarge | 1 | 4 | 16 | 1 x 150 SSD NVMe | Hasta 10 | Hasta 3 | 0,379 USD | 0,227 USD | 0,178 USD |
g4ad.2xlarge | 1 | 8 | 32 | 1 x 300 SSD NVMe | Hasta 10 | Hasta 3 | 0,541 USD | 0,325 USD | 0,254 USD | |
g4ad.4xlarge | 1 | 16 | 64 | 1 x 600 SSD NVMe | Hasta 10 | Hasta 3 | 0,867 USD | 0,520 USD | 0,405 USD | |
MV con varias GPU | g4ad.8xlarge | 2 | 32 | 128 | 1 x 1200 SSD NVMe | 15 | 3 | 1,734 USD | 1,040 USD | 0,810 USD |
g4ad.16xlarge | 4 | 64 | 256 | 1 x 2400 SSD NVMe | 25 | 6 | 3,468 USD | 2,081 USD | 1,619 USD |
* Los precios que se muestran son para la región EE. UU. Este (Norte de Virginia) de AWS. Los precios de las instancias reservadas para 1 y 3 años son para las opciones de pago “parcial por adelantado”, y “sin pago por adelantado” para instancias sin la opción de pago parcial.
Introducción a las instancias G4dn
Utilice AMI y contenedores precreados de AWS
Al utilizar Deep Learning AMIs o Deep Learning Containers de Amazon, usted puede lanzar rápidamente instancias de Amazon EC2 preinstaladas con marcos e interfaces populares de aprendizaje profundo, como TensorFlow, PyTorch y MXNet, para formar modelos de inteligencia artificial personalizados y sofisticados, probar algoritmos nuevos o aprender nuevas técnicas o habilidades. Para obtener más información, ingrese a la página de producto de las AMI de aprendizaje profundo de Amazon o la página de producto de los contenedores de aprendizaje profundo de AWS.
Las AMI RTX Virtual Workstation de NVIDIA pueden ejecutar hasta cuatro pantallas 4K por GPU para las aplicaciones de visualización. Las AMI para videojuegos de NVIDIA ofrecen videos a 60 FPS y pueden ejecutar una pantalla 4K por cada GPU.
Cree su propia AMI personalizada con controladores NVIDIA
Los controladores del centro de datos de NVIDIA ofrecen el mejor rendimiento para las cargas de trabajo informáticas muy intensas que generalmente se encuentran en el aprendizaje profundo, la ciencia de datos y la HPC.
Los controladores RTX de NVIDIA pueden usarse para habilitar el software de NVIDIA RTX Virtual Workstation. RTX vWS admite hasta cuatro pantallas 4k por cada GPU. Los controladores de juegos de NVIDIA son compatibles con las tarjetas gráficas, las soluciones de juegos y las tecnologías de juegos más avanzadas. Este controlador admite una pantalla 4K por cada GPU.
Para aprender a instalar estos controladores en su instancia, ingrese a estos enlaces para Linux y Windows.
Introducción a las instancias G4ad
Utilice AMI precreadas de AWS
Los controladores de AMD Radeon Pro Software for Enterprise proporcionan gráficos de alto rendimiento para estaciones de trabajo virtuales, streaming de juegos y otras aplicaciones gráficas. Para comenzar rápidamente, puede utilizar las AMI proporcionadas por AWS que tienen AMD Radeon Pro Software for Enterprise preinstalado. Estas AMI están disponibles en el Marketplace de AMD Radeon Pro.
Cree su propia AMI personalizada con controladores AMD
Los controladores AMD Radeon Pro Software for Enterprise pueden utilizarse para configurar instancias con potentes gráficos de confianza y nivel profesional. Las estaciones de trabajo abastecidas con estos controladores pueden admitir hasta dos pantallas 4K.
Para aprender a instalar estos controladores en su instancia para crear su propia AMI personalizada, ingrese a estos enlaces para Linux y Windows.