Программа:
19.00 – 19.40: Игорь Бобак, Lead Software Engineer at EPAM
“Обзор Spark MLLib”
В докладе будет рассказано о том, что из себя представляют задачи машинного обучения и сделан обзор алгоритмов, моделей и подходов, реализованных в библиотеке Spark MLLib.
19.40 – 20.20: Валентин Базаревский, Senior Developer at Adform
“На темной стороне вероятностных структур данных”
Зачастую когда мы слышим про какую-нибудь новую технологию, алгоритм или структуру данных, мы слышим лишь сладкие речи. Уже потом, в процессе использования, мы сталкиваемся с ограничениями и недостатками (не смотря на то, что где-то она показывает эффективные результаты). На этом этапе многие опускают руки и начинают искать новую серебряную пулю.
В докладе, мы обсудим вероятностные структуры данных и связанные с ними алгоритмы, такие как фильтр Блума, HyperLogLog, MinHash, одну из разновидностей LSH, их достоинства и недостатки. С примерами из реальных проектов, связанных с обработкой больших массивов данных (15+ TB).
20.20 – 20.40: Кофе-пауза
20.40 – 21.20: Роман Меркулов, InData Labs
“Прогнозирование исходов спортивных событий с помощью машинного обучения”
Несмотря на множество успешных примеров применения методов машинного обучения в самых различных областях, вопрос об эффективности их использования в задачах прогнозирования исходов спортивных событий по-прежнему остаётся открытым. Постараемся на практическом примере построить модель спортивных прогнозов и оценить возможную пользу от неё.