Роль закрыта
· Опыт работы в роли инженера данных не менее двух лет.
· Навыки разработки на одном из языков, используемых в компании: Python, Scala, Java, C# либо C++. Опыт разработки на других языках будут плюсом.
· Знание SQL и опыт работы с реляционными и нереляционными СУБД.
· Навыки проектирования и реализации систем сбора и обработки данных.
· Опыт работы с инструментами и open-source фреймворками в области больших данных: Hadoop, Apache Cassandra, Scala, Apache Spark, Apache Hive и пр.
· Опыт работы с решениями, используемыми в компании (Vertica, Apache HBase, Apache Hive, Apache Impala, PostgreSQL, Apache Spark, Apache NiFi, Apache Kafka, ELK и ClickHouse), будет сильным плюсом
· Понимание основных этапов обработки и анализа данных, инструментов и методов, применяемых в этой области.
1. Разработать прототип загрузки информации в озеро данных.
2. Проработать источники данных из мастер-систем.
3. Разработать логику загрузчика на основе архитектуры данных, предоставленной лидером проекта.
4. Передать результаты работы команде и лидеру проекта.
Проект рассчитан на 4 месяца и предполагает полную занятость.
Работа по проекту будет вестись удаленно. Вы будете взаимодействовать с лидером проекта, архитектором данных и BI-разработчиком. Перед началом проекта вам будет необходимо подписать соглашение о конфиденциальности.
Вы получите вознаграждение по согласованию с лидером проекта.
Полнота информации в профиле — ваше важное преимущество в глазах лидера проекта. Прежде, чем откликнуться на проект, убедитесь, что ваш профиль заполнен: получив отказ, вы не сможете направить отклик на проект повторно.