Подборка докладов со SmartData 2017
#data_analysis@proglib #collection@proglib
1. CatBoost — следующее поколение градиентного бустинга
Speaker: Анна Вероника Дорогуш
Особенности нового открытого алгоритма градиентного бустинга CatBoost от Яндекса. В докладе пойдет речь о том, как разработали технологию, которая умеет работать с категориальными характеристиками, и зачем выложили ее в открытый доступ. Расскажут, где CatBoost применяется уже сейчас, где будет применяться и кому стоит обратить на него внимание.
2. Нет данных? Нет проблем! Deep Learning на CGI
Speaker: Иван Дрокин
В настоящий момент глубокие свёрточные сети являются state-of-the-art алгоритмами во многих задачах компьютерного зрения.
В докладе мы рассмотрим пример обучения глубоких свёрточных сетей для локализации ключевых точек объекта на полностью синтетическом наборе данных.
3. Deep Learning: Распознавание сцен и достопримечательностей на изображениях
Speaker: Андрей Бояров
В данном докладе пойдет речь о построении системы для решения задачи scene recognition при помощи state-of-the-art подхода, основанного на глубоких сверточных нейронных сетях. Задача распознавания достопримечательностей вытекает из распознавания сцен.Однако при решении этой задачи важно обеспечить низкий уровень ложных срабатываний. В докладе будет рассмотрено решение задачи распознавания достопримечательностей на основе нейронной сети для scene recognition.
4. Краудсорсинг: как приручить толпу?
Speaker: Артём Григорьев
В докладе, основанном на опыте создания и использования Толоки, краудсорсинговой платформы Яндекса, рассмотрим вопросы контроля качества, мотивации исполнителей, а также различные модели агрегации результатов разметки.
5. Neurona: зачем мы научили нейросеть писать стихи в стиле Курта Кобейна?
Speaker: Иван Ямщиков
Есть много примеров применения машинного обучения и искусственных нейронных сетей в бизнесе, но в этом докладе мы поговорим о творческих возможностях ИИ. Как делали Neurona (https://www.youtube.com/watch?v=c759T8zOe5A), Нейронную Оборону (https://music.yandex.ru/artist/4445922) и Пианолу (https://www.youtube.com/watch?v=5bfI3bhiRa4). Обсудим современные задачи в области построения творческого ИИ и поговорим о том, почему это важно и интересно.
6. Глубокие свёрточные сети для обнаружения объектов и сегментации изображений
Speaker: Сергей Николенко
Свёрточные нейронные сети давно стали основным классом моделей для обработки изображений. В докладе мы обсудим, как сети, распознающие отдельные объекты, превращаются в сети, выделяющие объекты среди массы других. Мы поговорим и о знаменитом YoLo, и о single-shot detectors, и о линии моделей от R-CNN до совсем недавно появившейся Mask R-CNN.
7. Распределённое ML на больших данных: опыт построения рекомендательной системы в ivi
Speaker: Борис Шминке
В докладе рассказывается о том, как из небольшого скрипта, перемножавшего матрицы, мы прошли путь до собственного Hadoop Data Lake, распределённого машинного обучения на Spark, фреймворка оффлайн-оценок на Scala и, в результате, высококастомизированной под нужды бизнеса рекомендательной системы.
8. Имя — это фича
Speaker: Виталий Худобахшов
Как бы странно это ни казалось образованному человеку, вероятность быть одинокой/одиноким «зависит» от имени. Мы поговорим про любовь и отношения, а точнее, что именно могут рассказать об этом данные социальной сети. Конечно, мы не обойдём вниманием вопросы статистической значимости таких наблюдений, влиянии ботов и ложных корреляций.