Эпизоды
-
Жизнь ML-специалиста — это постоянное исследование. Какие статьи и новости читать, чтобы не отстать от трендов? Разбираемся вместе с редакторами тематических Telegram-каналов.
Выпуск посвящен трем главным группам трендов.
Продукты, которые меняют мир: мультимодальные модели в разных доменах, общение ИИ с человеком и виртуальные друзья. Разберемся, куда двигаются большие корпорации и стартапы.
Исследовательские тренды: робототехника и LLM, ML в биотехе и медицине, железо для AI, интерпретируемость и alignment моделей.
ML и мир вокруг: политическая и этическая регуляция, виртуальные фотомодели, централизация в разработке AI, локализация и «AI для всех».
Также в подкасте — о том, как устроена жизнь и работа редактора новостного канала.
Гости выпуска:Влада Пухкало — co-founder XOR media, главный редактор канала Data Secrets (t.me/data_secrets), магистр ИТМО AI Talent Hub.
Иван Кущенко — founder XOR media, главный редактор канала XOR (t.me/xor_journal).
Ведущий:Андрей Дмитриев — программист, директор по производству в JUG Ru Group.
______________
Ссылки на обсуждаемые новости, полезные и интересные материалы:
— https://futuretodayinstitute.com/trends/— https://community.intel.com/t5/Blogs/Tech-Innovation/Artificial-Intelligence-AI/AI-in-Focus-Intel-Liftoff-s-2024-Trend-Analysis-and-Predictions/post/1570094
— https://www.dhs.gov/news/2024/04/26/over-20-technology-and-critical-infrastructure-executives-civil-rights-leaders
— https://www.nytimes.com/2024/04/06/technology/tech-giants-harvest-data-artificial-intelligence.html?smid=nytcore-ios-share&sgrp=c-cb
— https://datasecrets.ru/news/8
— https://nvidianews.nvidia.com/news/nvidia-blackwell-platform-arrives-to-power-a-new-era-of-computing
— https://www.reuters.com/technology/ai-chip-demand-forces-huawei-slow-smartphone-production-sources-2024-02-05/
— https://www.wired.com/story/openai-buy-ai-chips-startup-sam-altman/
____________
Подписывайтесь на наши соцсети, чтобы не пропустить следующие выпуски и новости предстоящей конференции.
— VK: https://vk.com/imlconf
— Telegram-чат: https://t.me/iml_chat
— Telegram-канал: https://t.me/iml_conf
Сайт I’ML: https://imlconf.com/ -
Общаемся про CV и не только с директором ML-департамента MTS AI Даниилом Киреевым.
В выпуске говорим про:
— Задачи, которые решает CV — на примере детекции драк на фото и видео.
— Эксперименты и работу с датасетами.
— Набор моделей, которые должен знать CV-инженер.
— Мысленный эксперимент с пет-проектом вселенского масштаба и его запуск на мобильном девайсе.
— Жизнь CV-инженера — от простого сотрудника до руководителя команды и директора, влияющего на бизнес.
— Успешный старт с новым продуктом и определение задач бизнеса.Ведущий: Дмитрий Савостьянов — создатель генератора Artifactory.ai и голосового помощника для геймеров GOSU.AI.
-
Пропущенные эпизоды?
-
Как ML и DS помогают строить финансовое будущее людям и крупным банкам? Выясняем в выпуске про автоматизированное машинное обучение.
Обсуждаем области применения AutoML в банках: персональные ассистенты, CV, документооборот, скоринги и боты для торговли на биржах. Рассматриваем Python-библиотеки для факторного анализа, LAMA и других задач, в которых хорош AutoML.
Гость выпуска:Андрей Сухань — CDO. Больше 10 лет использует цифры, чтобы искать неочевидное и объяснять происходящее в бизнесе простыми словами
Ведущий:Александр Толмачев — директор по машинному обучению и анализу данных в Ozon Fintech.
-
Как ML используют в доставке? Рассказывает Антонина Горячева из СберМаркета — Head of ML по жизни и ML-инженер в душе.
В этом выпуске:— Специфика ML в логистике: какие данные собирают и что предсказывают, как создают алгоритмы для разных доставок – плановой, быстрой и в периоды повышенного спроса.
— Где тестируют алгоритмы: платформа экспериментов и фокус-группы.
— Реальные бизнес-процессы: взаимодействие с клиентами, итеративность, метрики и прогнозы заказов для найма курьеров.
— Немного инсайдов из UX, маркетинга и полевой работы.
Ведущая выпуска: Елизавета Пушкарева — участница Программного комитета I’ML, победитель хакатонов, Data Scientist в Точке и стартапер в одном флаконе. -
Разбираемся, что такое ML System Design Document — когда его внедрять, кто этим должен заниматься, и что вообще подразумевается под System Design для ML-специфики.
В этом выпуске — шаблон и структура ML System Design Document, его отличие от требований BRQ и SRS, а также кейсы внедрения — успешные и не очень.
Гости выпуска:— Дмитрий Колодезев — инженер, консультант и предприниматель. Автор курса по ML System Design, соведущий канала ReliableML, главный по датазавтракам в Новосибирске.
— Ирина Голощапова — CDO Operations в Raiffeisenbank. Соведущая сообщества Reliable ML. PhD.
Ведущий: Александр Толмачев — директор по машинному обучению и анализу данных в Ozon Fintech. -
Вы обучили модель, а как объяснить ее профиты бизнесу? Об этом — в пятом выпуске подкаста I'ML. Разбираем нюансы NLP-метрик, их неочевидную связь с бизнес-метриками.
Смотрим на кейсы из практики оценки качества моделей, работающих с естественным языком: диалоговые системы, суммаризацию и машинный перевод.
Говорим про метрики для работы с кодогенерацией. Как оценить влияние Copilot на бизнес и жизнь разработчика. Поднимаем и философские вопросы — про доверие профессионалам и роль людей в создании новых метрик.
Гость выпуска: Валентин Малых — NLP-инженер с 10-летним опытом. Руководитель направления NLP-исследований в MTS AI.
Ведущий: Павел Филонов — независимый эксперт в областях C++, ML и Data Science.
-
Продолжаем говорить о доставке моделей в прод. На этот раз — о задачах, с которыми сталкивается компания на всех этапах.
Начинаем с данных, которые собирают Data Science-специалисты, продолжаем обучением моделей и заканчиваем пайплайнами для вывода в прод.
В выпуске обсуждаем:— с чего начать изменения;
— работу с датасетами, на которых учится модель;
— окружение — от хранилищ данных до пайплайнов;
— проверку экспериментов и доставку моделей в прод;
— инструменты и тесты моделей.
Гости выпуска:— Андрей Качетов — руководитель группы разработки сервисов и продуктов в Data Science и ML. Помогает находить в данных новую ценность для бизнеса и для людей.
— Иван Шмаков — ML-инженер. Начал катить модели в прод, когда VGG-16 была топовой.
Ведущие:— Александр Толмачев — руководит аналитикой, хранилищем и моделированием в Ozon.
— Максим Стаценко — руководитель службы подготовки и анализа больших данных в Яндексе.
Подписывайтесь на наши соцсети, чтобы не пропустить следующие выпуски и новости предстоящей конференции.— VK: https://vk.com/imlconf
— Telegram-чат: https://t.me/iml_chat
— Telegram-канал: https://t.me/iml_conf
Сайт I’ML: https://imlconf.com/ -
Не каждый инженер согласится строить ML-инфраструктуру и проводить непредсказуемые эксперименты. Но кто-то должен этим заниматься. Говорим об ML-инженерах, которые выбирают путь работы с инфраструктурой, и выясняем, как сделать эту работу качественнее.
В этом выпуске обсуждаем:— как выводить модели в прод быстро;
— что должен понимать руководитель команды, которая занимается ML-инфраструктурой;
— как взаимодействовать с разработчиками и передавать наработки команде инженеров.
Не забыли и техническую конкретику: Data-платформу как фундамент ML-инфраструктуры и работу с потоками данных.
Ведущий выпуска — Андрей Кузнецов, Андрей Кузнецов, директор по машинному обучению «Одноклассников».
Полезные ссылки:— Статья от Google «MLOps: Continuous delivery and automation pipelines in machine learning»: https://cutt.ly/0wKw50Xl
— Книга Мартина Клеппмана «Высоконагруженные приложения. Программирование, масштабирование, поддержка»: https://cutt.ly/GwKw6shl
— Доклад Михаила Марюфича «CI/CD для Ml-моделей и датасетов»: https://cutt.ly/swKw6EP8
Подписывайтесь на наши соцсети, чтобы не пропустить следующие выпуски и новости предстоящей конференции.— VK: https://vk.com/imlconf
— Telegram-чат: https://t.me/iml_chat
— Telegram-канал: https://t.me/iml_conf
Сайт I’ML: https://imlconf.com/ -
В этом выпуске говорим про мультимодальные модели: как они появились; на каких данных обучаются сейчас и будут обучаться в недалеком будущем; чем они похожи на нейронные сети внутри человека; к какой структуре придут мультимодальные модели.
Гость выпуска — Александр Крайнов, директор по развитию технологий искусственного интеллекта Яндекса.
Ведущий — Павел Филонов, независимый эксперт в областях C++, ML и Data Science.
-
Обсуждаем языковые модели, сдвиг парадигм в ML и челленджи, с которыми столкнулись при создании GigaChat от Сбера.
Среди тем выпуска:
работа с данными, претрейн и токенизация;
эксперименты с параметрами обучения;
кратно растущие требования к GPU и другому железу;
мультимодальность и встраивание LLM в экосистему;
починка фактологии и походы в поиск.
Гость выпуска: Сергей Марков — специалист в области ИИ, начальник управления экспериментальных систем машинного обучения в дивизионе общих сервисов «Салют» Сбера.
Ведущий: Александр Толмачев. Он руководит аналитикой, хранилищем и моделированием в Ozon. А еще преподает в Яндекс Практикуме, ВШЭ и Skolkovo.