Обработка данных в функциональном стиле с mPyPl

13 ноября

Тезисы

Невозможно переоценить важность Data Science в современном мире! Однако если посмотреть на среднестатистический код для преобразования данных и выделения признаков, то он обычно не очень хорошо структурирован. Мы с коллегами из Microsoft Commercial Software Engineering создали новую open source библиотеку mPyPl (Monadic Python Pipeline library), которая поддерживает ленивые конвейеры обработки данных с операцией «|» и позволяет писать код в функциональном стиле. Библиотека оперирует конвейерами с именованными полями данных, что позволяет естественным образом описывать преобразования данных. В доклада я расскажу про основные «боли», решаемые mPyPI, покажу примеры использования для классификации и обнаружения изображений, распознавания событий на видео, рендеринга видео, рисования когнитивных портретов и в других задачах.

Microsoft

Дмитрий Сошников

Дмитрий работает в Майкрософт уже 14 лет, десять из которых в роли технологического евангелиста. Он отвечал за организацию многих мероприятий для учащихся в России, в том числе Imagine Cup (в результате чего российские команды дважды стали победителями мирового чемпионата — в 2014 и 2015 гг.), разработал популярные онлайн-курсы по C# и F# на русском языке. Дважды выходил на одну сцену со Стивом Балмером. Дмитрий лично провёл более чем 20 обучающих студенческих хакатонов по всей России, был наставником ряда студенческих стартапов. В течение нескольких лет работал старшим специалистом в области разработки по направлению искусственного интеллекта и машинного обучения. Совместно с клиентами из Центральной и Восточной Европы он реализовал ряд проектов по обнаружению сложных событий на видео, а также по обнаружению объектов с использованием трехмерных моделей для обучения нейронной сети. Дмитрий любит функциональное программирование и F#, является автором первой книги по F# на русском языке. Он является основным разработчиком библиотеки Python mPyPl, которая упрощает Python-разработку за счет функциональных конвейеров данных. В свободное время Дмитрий ведет курсы по функциональному программированию и искусственному интеллекту в Московском физико-техническом институте, Высшей школе экономики и Московском авиационном институте, а также старается передать увлечение программированием и наукой своей 16-летней дочери. Дмитрий получил степень кандидата физико-математических наук, защитив диссертацию на тему распределенного представления знаний. А еще он интересуется технологическим искусством (работы были представлены в Электромузее Москвы и на Maker Faire), проводит чайные церемонии Гунфу Ча и любит технологические фокусы.

Дмитрий работает в Майкрософт уже 14 лет, десять из которых в роли технологического евангелиста. Он отвечал за организацию многих мероприятий для учащихся в России, в том числе Imagine Cup (в результате чего российские команды дважды стали победителями мирового чемпионата — в 2014 и 2015 гг.), разработал популярные онлайн-курсы по C# и F# на русском языке. Дважды выходил на одну сцену со Стивом Балмером. Дмитрий лично провёл более чем 20 обучающих студенческих хакатонов по всей России, был наставником ряда студенческих стартапов. В течение нескольких лет работал старшим специалистом в области разработки по направлению искусственного интеллекта и машинного обучения. Совместно с клиентами из Центральной и Восточной Европы он реализовал ряд проектов по обнаружению сложных событий на видео, а также по обнаружению объектов с использованием трехмерных моделей для обучения нейронной сети. Дмитрий любит функциональное программирование и F#, является автором первой книги по F# на русском языке. Он является основным разработчиком библиотеки Python mPyPl, которая упрощает Python-разработку за счет функциональных конвейеров данных. В свободное время Дмитрий ведет курсы по функциональному программированию и искусственному интеллекту в Московском физико-техническом институте, Высшей школе экономики и Московском авиационном институте, а также старается передать увлечение программированием и наукой своей 16-летней дочери. Дмитрий получил степень кандидата физико-математических наук, защитив диссертацию на тему распределенного представления знаний. А еще он интересуется технологическим искусством (работы были представлены в Электромузее Москвы и на Maker Faire), проводит чайные церемонии Гунфу Ча и любит технологические фокусы.