Назад

Сбер

Москва

Junior Data Engineer

Размещено 24.06.21

  • Стартовые вакансии и стажерские позиции
  • Требуемый опыт: 1-2 года

  • IT, Digital
  • Анализ данных

Информация

Привет! Мы - "Боты". Команда, которая автоматизирует клиентскую поддержку в Сбере. Мы верим, что однажды сможем полностью избавить операторов поддержки от рутинной работы и предоставить каждому клиенту всегда доступного и понимающего его потребности помощника.

Поэтому мы делаем:

  • IVR на номере 900,
  • Чат-бота в СберБанк Онлайн и на сайте sberbank.ru,
  • Виртуального Ассистента во всех каналах: СберБанк Онлайн, sberbank.ru, SberBox, и других.

Мы много работаем с данными, в частности:

  • Готовим данные для обучения моделей - делаем их предобработку и разметку,
  • Формируем витрины размеченных данных для продуктовых команд,
  • А еще мы развиваем внутренний сервис разметки - любая продуктовая команда банка может к нам прийти с сырыми данными, а уйти с размеченным датасетом.

Сейчас мы ищем Junior Data Engineer на поддержку и развитие ETL процесса.

Неизбежно произойдет погружение в бизнес и ты станешь немного DA, так как без понимания смысла, который несут данные, эффективно работать будет сложно (и скучно).

Круг задач на старте будет такой:

  • Построение и оптимизация ETL процесса разметки данных
  • Формирование витрин данных для DA/DS
  • Отображение статистики по разметке в понятном виде

Поскольку вакансия юниорская, нам сильно важнее твоё здравомыслие и мотивация, чем hard skills, хотя и к ним, конечно, есть базовые требования.

По твердым навыкам ожидаем:

  • Знание Python в части написания скриптов для анализа/обработки данных
  • Опыт работы с данными в качестве инженера, аналитика или ETL- разработчика
  • Знание SQL на хорошем уровне (подзапросы, хранимые процедуры, оптимизация запросов и т.д.)
  • Опыт работы с данными с использованием промышленных РСУБД (Oracle, Teradata, MS SQL, PostgreSQL, и т.д.)

Плюсом будет:

  • Опыт реализации витрин данных / хранилищ данных
  • Опыт работы со стеком технологий Big Data (Hadoop, Spark, Hive/Impala)