Поиск работы на сайте Jobvk.com
Разместить вакансию
Разместить резюме

DevOps-инженер (Трайб Data Office)

АО «ОТП Банк» (JSC «OTP Bank»)
  • Удаленная работа
  • Опыт: 3-6 лет
  • Полная занятость
  • Описание: Кого мы ищем? Мы в Банке строим ML-платформу нового поколения – инфраструктуру, которая обеспечивает полный MLOps-цикл: от экспериментов до продакшн-инференса. Это не просто среда для Data Scientists – это полноценная экосистема, в которой уже преднастроены фреймворки для анализа, обработки данных, мониторинга и оркестрации ML-процессов. Сейчас мы в поиске DevOps-инженера, который станет частью команды и поможет спроектировать и развернуть отказоустойчивую, масштабируемую ML-платформу на базе Kubernetes с нуля. У нас масштабные задачи, свежий стек и высокий уровень свободы в реализации идей. Наш стек: Runtime: Kubernetes (self-hosted), Airflow, Spark, Hadoop (HDFS, YARN, Hive), Seldon, Kubeflow ML сервисы: Kubeflow, MLFlow, Airflow БД и очереди: HDFS, PostgreSQL, Kafka, Redis, Minio Управление инфраструктурой: Ansible, ArgoCD CI/CD: Bitbucket, Teamcity, Nexus Мониторинг: Grafana, Zabbix Чем предстоит заниматься? Разворачивать и настраивать инфраструктуру для тренировки и сервинга ML-моделей; Внедрять и развивать ML-компоненты в концепции Model-as-a-Service; Разрабатывать backend-часть для моделей: API, обработку запросов, масштабирование, мониторинг; Автоматизировать развёртывание сервисов через CI/CD пайплайны; Настраивать логирование, мониторинг и алерты; Проводить R&D и внедрять перспективные open-source решения. Что мы ожидаем? Опыт администрирования Linux (RHEL, CentOS) от 2-х лет; Глубокие знания Kubernetes (развертывание, обновление в закрытых средах); Опыт работы с GPU; Понимание MLOps практик; Уверенное владение инструментами CI/CD; Навыки автоматизации с помощью Python/Bash; Опыт эксплуатации систем мониторинга (Prometheus, Grafana, Zabbix, ELK).