machine learning bigdata data science

Machine learning engineer ( intern ), Санкт-Петербург

Одноклассники

Одноклассники – одна из крупнейших социальных сетей. OK – самый высоконагруженный в мире сервис, написанный на Java. Большинство задач, которые возникают перед нами каждый день, не имеют готовых решений, поэтому мы используем большое количество собственных разработок. 

В проект Антиспам компании Одноклассники ищем специалистов по machine learning. Наша команда разработчиков делает безопасным не только портал Одноклассники, но и другие бизнес юниты Mail.ru, поэтому скучно не будет, так как мы решаем задачи из абсолютно разных доменных областей. В команде мы в основном практикуем end-to-end решения задач, поэтому предполагается, что кандидат не боится "испачкать руки" в продакшен коде.

Наш стек:

Языки: Python, Java, Scala;
Технологии которые часто используем в работе: PyTorch, DVC, MlFlow, Hadoop,Spark, Airflow, Kafka.

Примеры того, чем мы занимаемся:
Детекция спама, ботов и NSFW контента;
Автоматизация восстановления профиля на основе распознавания лиц и жестов;
Поиск дубликатов;
ML инфраструктурой и процессами;
Модерацией в ОК и Юле.


Задачи

  • поиск мошенников, используя поведенческие данные и контентные признаки;
  • анализ данных карточек товаров (картинки/текст) для автомодерации и дополнительных признаков для других детекторов.

Требования

  • уверенные навыки в программирования на Python и хотя бы одном статически типизированном языке;
  • хорошие знания базового ML;
  • понимание современного состояния NLP, и умение использовать базовые вещи(word2vec, cnn, эмбеддинги, faiss).

Будет плюсом

  • Опыт оптимизации DL решений на инференс;
  • Уметь прочитать, а затем воспроизвести в коде статью;
  • Работа с современным BigData стеком (Hadoop/Spark/Airflow);
  • Опыт применения DevOps практик в контексте разработки ML моделей;
  • Опыт применения ML в cybersecurity и общее представление об этой сфере.

Мы предлагаем

Официальная зарплата
Гибкий график работы
Офис в центре города
ДМС
Бонусы от партнеров
Интересные задачи