Программа:
18.30 – 19.30: Денис Пирштук (Yandex):«Supervised Machine Learning in Practice: Tips & Tricks»
Ключевые идеи алгоритмов обучения по прецедентам и почему про них следует помнить при выборе алгоритма и его настройке, поиске оптимальных параметров. Какие подходы позволяют повысить качество модели, какие программные средства удобно использовать при проведении экспериментов и где спрятаны любимые “грабли”.
19.30 – 19.50: Coffee break
19.50 - 20.20: Дмитрий Толпеко (EPAM Systems):«Apache YARN - Управление ресурсами в Hadoop кластере»
Зачем разработчикам и data аналитикам нужно понимать как работает YARN. С чего нужно начинать оптимизацию производительности Hive, Map Reduce, Spark и других приложений.
Сосуществование Production, Development and Research сред в одном кластере.
20.20 – 21.00: Дискуссия на тему : «Перспективы развития Big Data» Какие технологии, подходы, направления будут наиболее востребованы.