yandex
Калькулятор ценТарифыАкцииДокументацияО насКарьера в Cloud.ruНовостиЮридические документыКонтактыРешенияРеферальная программаКейсыПартнерство с Cloud.ruБезопасностьEvolutionAdvancedEvolution StackОблако VMwareML SpaceВ чем отличия платформ?БлогОбучение и сертификацияМероприятияИсследования Cloud.ruЛичный кабинетВойтиЗарегистрироватьсяEvolution ComputeEvolution Managed KubernetesEvolution Object StorageEvolution Managed PostgreSQL®Облако для мобильных и веб‑приложенийАналитика данных в облакеEvolution Bare MetalEvolution SSH KeysEvolution ImageСайт в облакеEvolution DNSEvolution VPCEvolution Load BalancerEvolution Magic RouterEvolution DiskХранение данных в облакеEvolution Container AppsEvolution Artifact RegistryEvolution Managed ArenadataDBEvolution Managed TrinoEvolution Managed SparkАналитика данных в облакеEvolution ML InferenceEvolution Distributed TrainEvolution ML FinetuningEvolution NotebooksCurator Anti-DDoSCurator Anti‑DDoS+WAFUserGate: виртуальный NGFWStormWall: Anti-DDoSEvolution TagsEvolution Task HistoryCloud MonitoringCloud LoggingАренда GPUAdvanced Object Storage ServiceAdvanced Elastic Cloud ServerAdvanced Relational Database Service for PostgreSQLРазработка и тестирование в облакеAdvanced Image Management ServiceAdvanced Auto ScalingDirect ConnectCDNCross-platform connectionAdvanced Enterprise RouterAdvanced Cloud Backup and RecoveryAdvanced Data Warehouse ServiceAdvanced Elastic Volume ServiceAdvanced Cloud Container EngineAdvanced FunctionGraphAdvanced Container Guard ServiceAdvanced Software Repository for ContainerAdvanced Document Database Service with MongoDBAdvanced Relational Database Service for MySQLAdvanced Relational Database Service for SQL ServerCloud AdvisorAdvanced Server Migration ServiceAdvanced Data Replication ServiceAdvanced API GatewayAdvanced CodeArtsAdvanced Distributed Message Service for KafkaAdvanced Distributed Message Service for RabbitMQAdvanced DataArts InsightAdvanced CloudTableAdvanced MapReduce ServiceAdvanced Cloud Trace ServiceAdvanced Application Performance ManagementAdvanced Identity and Access ManagementAdvanced Enterprise Project Management ServiceVMware: виртуальный ЦОД с GPUVMware: виртуальный ЦОДУдаленные рабочие столы (VDI)VMware: сервер Bare MetalИнфраструктура для 1С в облакеУдаленные рабочие столыМиграция IT‑инфраструктуры в облако3D-моделирование и рендерингVMware: резервное копирование виртуальных машинVMware: резервный ЦОДVMware: резервное копирование в облакоVMware: миграция виртуальных машин
Поиск
Связаться с нами

Evolution ML Inference

Cервис для запуска и развертывания моделей машинного (ML) и глубокого обучения (DL)
Документация сервиса
hero_img

Стоимость
Возможности
Ответы на вопросы
Оставить заявку
iconПривет, я Клаудия. Ваш AI‑помощник, который упрощает работу в облаке.

Описание сервиса

Сервис для запуска ML-моделей из библиотеки Hugging Face на облачных мощностях с GPU, в том числе в пользовательских Docker-образах. Для более эффективного инференса Evolution ML Inference поддерживает среды исполнения vLLM, TGI, Ollama, Diffusers, Transformers, а также модели-трансформеры, диффузионные модели и большие текстовые модели (LLM).

Рассчитайте стоимость
Час
День
Месяц
Период расчета стоимости

Предварительный расчёт. Не является публичной офертой. Ресурсы предоставляются исключительно для тестирования. Не подразумевается их безвозмездное предоставление по смыслу пп.4 п.1 ст.575 ГК РФ

Возможности

Производительность и экономия

Совместное использование ресурсов графического ускорителя (Shared GPU) создает баланс стоимости, производительности и эффективности потребления облачных ресурсов.

Динамическое автомасштабирование

При повышении числа запросов инференса автоматически выделяются дополнительные мощности или наоборот один GPU используется совместно  несколькими инференсами.

Поддержка моделей из Hugging Face

Сервис позволяет запускать модели из популярной платформы Hugging Face, а также использовать библиотеки vLLM, TGI, Ollama, Diffusers для более эффективного инференса.

Мгновенный доступ к инференсу

Доступ к инференсу моделей открывается сразу после оплаты ресурсов. Счет за сервис выставляется по модели pay-as-you-go: плата начисляется только за использованные ресурсы.

Запуск моделей в Docker-образах

Docker RUN запускает модели с Docker-образами в контейнерной среде. Сервис обеспечивает автоматическое развертывание контейнеров и динамическое автомасштабирование.

Защита инфраструктуры

Платформа Evolution обеспечивает защиту виртуальных машин от несанкционированного доступа и антивирусную защиту, а также поддерживает межсетевое экранирование сетевых потоков сервиса.

Ответы на вопросы

Cloud.ru – ведущий провайдер облачных и AI‑технологий

*По объему выручки IaaS- и PaaS-сервисов за 2024 год (по данным iKS-Consulting), AI-сервисов за 2024 год (по данным CNews Analytics).

Больше чем просто поддержка

Полное сопровождение для решения ваших задач и понятный бизнес-результат
Индивидуальный подход к каждому клиентуПроведем бесплатную консультацию по вашему проекту, ответим на вопросы и подберем лучшие решения.
personal_manager
Круглосуточно на связиБесплатная техподдержка 24/7, на связи всегда реальные люди.

1 400+ экспертов в области IT, кибербезопасности и AI

Проверенные методологии и лучшие практики бесшовной миграции в облако

Персональный менеджер для сопровождения ваших задач

Заявка на консультацию

Дарим 20 000 бонусов юридическим лицам и ИП
*
*
+7
*
*
*
0/300