вернуться в ленту
Вакансия опубликована
12
August
2024
Senior
Data Scientist
Удалённо
З/П не указана
Senior
Удалённо
З/П не указана
— это большой и сложный продукт, в котором представлено несколько типов недвижимости и типов сделки, а также есть множество сервисов, информационных материалов и собственное медиа.Ежемесячная аудитория около 18,7 млн. человек. Растить число пользователей и решать их проблемы помогают уже больше 1000 человек.
О команде:
В Циан большая команда ML - DS, DE, своя MLOps-платформа.
Команда разделена на продуктовые стримы. Мы формируем самодостаточные команды (разработчики, аналитики, ML-инженеры) для решения задач бизнес-направления. С процессами интеграции моделей в продакшн нам помогает команда MLOps-платформы. В команде настроены процессы перфоманс ревью, регулярного обмена опытом, выделяем время на исследовательскую работу.
Мы ищем Senior Data Scientist в команду Ранжирования и рекомендаций: новое направление “поиск 3.0”
Сейчас направление фокусируется на развитии интеллектуального помощника для поиска недвижимости, основанного на чат ботах.
Стек:
— Пишем преимущественно на Python (Numpy, SciPy, Pandas, sklearn, PyTorch).
— Активно используем экосистему Hadoop (PySpark, Hive, Kafka), у нас свой большой кластер
— Для автоматизации запусков наших пайплайнов используем Airflow
— Для технических метрик — Grafana, для бизнес-метрик — FineBI.
Основные задачи:
Развитие интеллектуального помощника по поиску недвижимости:
— Руководство проектами по интеграции готовых решений от OpenAI, Яндекса и др.
— Внедрение новых сценариев поиска: text2image модели
— Ресерч возможностей opensource LLM моделей
— Написание микросервисов с моделями и выкатка их в АБ-эксперименты
— Разработка и внедрение в продакшн моделей машинного обучения для улучшения пользовательского опыта
Требования к кандидату:
— Образование: МФТИ, МГУ (желательно Мехмат, ВМК), ВШЭ, ИТМО, Бауманка, НГУ и др.
— Python: пишет легко читаемый и поддерживаемый код
— SQL запросы на продвинутом уровне — оконные функции, оптимизация запросов
— Знаком с Apache стек: HDFS/Kafka/Spark (DF API)
— Опыт в DL: обучение/дообучение собственных глубоких нейросетей
— Опыт разработки NLP моделей: от tfidf до llm
— Классический ML: бустинги, линейные модели.
— Имеет базовые знания CV: классификация, детекция, сегментация.
— Понимает ценность MLOps, и ценность переиспользования уже готовых решений внутри компании.
— Имеет кругозор или непосредственный опыт в реализации проектов для C и B пользователей.
— Способен самостоятельно коммуницировать с заказчиками и смежниками.
Что мы предлагаем:
— Удаленную работу с возможностью приходить в офис в Москве, Санкт-Петербурге и Новосибирске. В офисе – кухни, оборудованные всем необходимым, а также снеки, фрукты, кофе и чай, бесплатная авто и вело парковки;
— Технический рост. У нас есть успешные примеры роста с точки зрения ML, а также инженерии (разработка, архитектура приложений и сервисов) : есть возможность консультироваться с командой и брать инициативу по реализации крупных и сложных проектов.
— Рост и развитие: в первые месяцы у каждого сотрудника есть ментор, после появляется личный план развития и возможность прокачивать soft/ hard skills на практике, обучении, конференциях;
— ДМС с первого рабочего дня (со стоматологией, госпитализацией, страховкой выезжающего за пределы нашей страны);
— 5 day off в год, помимо основного отпуска;
— Кафетерий льгот Benefactory;
Важно: pедакция vseti.app не несет ответственности за любую информацию в этой публикации, в т. ч. текстовое описание и графические изображения, предоставленные нам авторами вакансии, публичными источниками сети интернет и другими пользователями интернета. Если вы нашли ошибку, пожалуйста, сообщите нам об этом help@vseti.app или в телеграм
Циан
Продуктовая IT-компания, которая входит в топ-15 самых популярных сервисов по недвижимости в мире
Подробнее о компанииДля отклика:
Стать заметнее для работодателей → здесь