Подборка докладов со SmartData 2017 #data_analysis@proglib #collection@proglib 1. CatBoost — следующее поколение градиентного бустинга Speaker: Анна Вероника Дорогуш Особенности нового открытого алгоритма градиентного бустинга CatBoost от Яндекса. В докладе пойдет речь о том, как разработали технологию, которая умеет работать с категориальными характеристиками, и зачем выложили ее в открытый доступ. Расскажут, где CatBoost применяется уже сейчас, где будет применяться и кому стоит обратить на него внимание. 2. Нет данных? Нет проблем! Deep Learning на CGI Speaker: Иван Дрокин В настоящий момент глубокие свёрточные сети являются state-of-the-art алгоритмами во многих задачах компьютерного зрения. В докладе мы рассмотрим пример обучения глубоких свёрточных сетей для локализации ключевых точек объекта на полностью синтетическом наборе данных. 3. Deep Learning: Распознавание сцен и достопримечательностей на изображениях Speaker: Андрей Бояров В данном докладе пойдет речь о построении системы для решения задачи scene recognition при помощи state-of-the-art подхода, основанного на глубоких сверточных нейронных сетях. Задача распознавания достопримечательностей вытекает из распознавания сцен.Однако при решении этой задачи важно обеспечить низкий уровень ложных срабатываний. В докладе будет рассмотрено решение задачи распознавания достопримечательностей на основе нейронной сети для scene recognition. 4. Краудсорсинг: как приручить толпу? Speaker: Артём Григорьев В докладе, основанном на опыте создания и использования Толоки, краудсорсинговой платформы Яндекса, рассмотрим вопросы контроля качества, мотивации исполнителей, а также различные модели агрегации результатов разметки. 5. Neurona: зачем мы научили нейросеть писать стихи в стиле Курта Кобейна? Speaker: Иван Ямщиков Есть много примеров применения машинного обучения и искусственных нейронных сетей в бизнесе, но в этом докладе мы поговорим о творческих возможностях ИИ. Как делали Neurona (https://www.youtube.com/watch?v=c759T8zOe5A), Нейронную Оборону (https://music.yandex.ru/artist/4445922) и Пианолу (https://www.youtube.com/watch?v=5bfI3bhiRa4). Обсудим современные задачи в области построения творческого ИИ и поговорим о том, почему это важно и интересно. 6. Глубокие свёрточные сети для обнаружения объектов и сегментации изображений Speaker: Сергей Николенко Свёрточные нейронные сети давно стали основным классом моделей для обработки изображений. В докладе мы обсудим, как сети, распознающие отдельные объекты, превращаются в сети, выделяющие объекты среди массы других. Мы поговорим и о знаменитом YoLo, и о single-shot detectors, и о линии моделей от R-CNN до совсем недавно появившейся Mask R-CNN. 7. Распределённое ML на больших данных: опыт построения рекомендательной системы в ivi Speaker: Борис Шминке В докладе рассказывается о том, как из небольшого скрипта, перемножавшего матрицы, мы прошли путь до собственного Hadoop Data Lake, распределённого машинного обучения на Spark, фреймворка оффлайн-оценок на Scala и, в результате, высококастомизированной под нужды бизнеса рекомендательной системы. 8. Имя — это фича Speaker: Виталий Худобахшов Как бы странно это ни казалось образованному человеку, вероятность быть одинокой/одиноким «зависит» от имени. Мы поговорим про любовь и отношения, а точнее, что именно могут рассказать об этом данные социальной сети. Конечно, мы не обойдём вниманием вопросы статистической значимости таких наблюдений, влиянии ботов и ложных корреляций.

Теги других блогов: proglib collection data_analysis