🤖 Датаист
1.09K subscribers
8 photos
10 videos
47 links
Меня зовут Андрей Кузьминых, я технический директор ИИ-стартапов, ex-директор по данным и ИИ в Сбере. Рассказываю о своих проектах, объясняю, как работают все эти ИИ-чудеса, комментирую новости и рассуждаю о будущем индустрии

Для связи: @andre_andreevich
Download Telegram
Channel created
Привет! Меня зовут Андрей, я технологический предприниматель в сфере искусственного интеллекта (ИИ).

Я обладаю обширными знаниями в области ИИ, а также богатым практическим опытом разработки ИИ-продуктов любой сложности и их вывода на международный рынок. Если вам нужно запустить ИИ-стартап с нуля или внедрить ИИ в процессы вашей компании, я готов помочь. В моей команде работают профессионалы, увлеченные решением сложных задач: от интеллектуального анализа данных до разработки цифровых двойников и обучения беспилотных автомобилей.

В этом блоге я делюсь своими кейсами, простыми словами объясняю сложные технологические аспекты работы ИИ-продуктов, комментирую актуальные новости индустрии, делюсь своим мнением и видением будущего технологий, а также даю практические советы по созданию успешных ИИ-стартапов.

Коротко обо мне:

• Выпускник Вышки;
• Ex-Data Engineer в Accenture;
• Ex-Chief Data Officer в Сбере;
• Ex-Chief Data Scientist в Сбере;
• Ex-Куратор национальных проектов в области ИИ;
• Ex-Chief Technology Officer в венчурной студии для ИИ-стартапов;
• Chief Technology Officer в стартапе по созданию ИИ-ассистента для соцсетей;
• Создаю ИИ-сотрудников для автоматизации рутинной работы;
• Консультирую ИИ-стартапы и технологические компании.

История моего пути
О моей компании

Узнать больше о моей компании можно по ссылке

#обо_мне - о моем пути;
#технологии - анализирую текущие тренды;
#кейсы - делюсь своим опытом;
#мысли - размышляю о технологиях;
#гайд - инструкция по запуску ИИ-стартапа;
#новости - только самое интересное;
#анонс - анонсы о событиях и релизах.

Присоединяйтесь, будет интересно!
История моего пути

Я родился в Уссурийске, с детства увлекался компьютерами. Меня воспитывал дед со всей строгостью. Он говорил, что если я не буду учиться, то не выживу. В школе побеждал в олимпиадах по информатике, математике и программированию. Видеоигры любил с такой силой, что в 12 лет писал статьи в ЛКИ.

С 6 до 18 лет занимался соревновательным спортом: шахматы (выигрывал городские соревнования), кудо (чемпион Дальнего Востока), призер соревнований по армейскому рукопашному бою, кикбоксингу и джиу-джитсу.

Денег не хватало, поэтому много работал руками – разнорабочим, грузчиком, строил дома, чистил подвалы от грязи. Годам к 16 понял, что если не продолжу учиться всерьез, так и буду чистить подвалы.

В 17 поступил в ДВФУ и переехал во Владивосток. Закончил бакалавриат (бизнес-информатика + переводчик английского в сфере экономики и бизнеса, один из лучших выпускников).

С единоборствами пришлось закончить, чтобы сберечь голову. Увлекся силовым спортом: выигрывал соревнования по пауэрлифтингу, брал призы по бодибилдингу.

После бакалавриата переехал в Москву, поступил в магистратуру Вышки на факультет информационной бизнес-аналитики, закончил с двойным дипломом (+ международный институт бизнес-анализа, IIBA).

В 21 поработал инженером данных (Data Engineer) в Accenture. Выигрывал различные соревнования по машинному обучению, благодаря одной из побед получил работу в стратегическом блоке Сбера, готовил данные для модели прогнозирования эффективности сотрудников.

Выиграл всероссийскую олимпиаду по бизнес-информатике от Яндекса, благодаря этому мог выбрать аспирантуру любого ВУЗа страны.

Снова выбрал ВШЭ, занимался ИИ и анализом данных, вел семинары у магистрантов и работал в лаборатории интеллектуальных систем.

В 24 возглавил команду дата-инженеров в Сбере, занимался анализом данных для принятия стратегических решений топ-менеджерами банка.

В 25 стал директором по данным стратегического блока (Chief Data Officer), занимался политикой управления данными Сбера и экосистемы, организовал первое в банке защищенное хранилище конфиденциальных данных, строил модели машинного обучения для помощи в принятии управленческих решений.

В 26 стал директором по ИИ (Chief Data Scientist) стратегического блока Сбера, участвовал в разработке стратегии ИИ-трансформации Сбера, затем реализовал эту стратегию, сэкономив банку кучу денег. Был признан одним из лучших руководителей Сбера 2021 года. Курировал нацпроекты в центре при правительстве РФ (анализ сложности банковского регулирования, оптимизация выезда врачебных бригад в ковид, анализ загазованности воздуха и т.д).

Победил в бизнес-акселераторе Сбера с дейтинг-приложением на базе ИИ.

Мне понравилось делать стартапы, но я не знал, как на них зарабатывать. Поэтому в роли технического директора (CTO) пошел набираться опыта в международную венчурную студию, которая инвестировала в ИИ-стартапы, и в конце 2021 года отправился на Кипр, бросив аспирантуру.

В 27 начал работать над тремя стартапами:
1) Искал, кто промышленно ворует электроэнергию в России - нашел, решение передали заказчику;
2) Гоночная игра в смешанной реальности с настоящими GO-картами. Обучал беспилотники в симуляции, выступал с научной работой на международных конференциях, но бизнес-модель не сошлась;
3) ИИ-ассистент, который пишет в ваши соцсети вместо вас - стартап привлек дополнительное финансирование, и я в роли технического директора сосредоточился на его развитии. Начали получать доход, продукт стал продуктом дня и продуктом недели на Product Hunt.

Набравшись опыта в венчурной студии, я основал собственную компанию Andre AI Technologies. Мы предлагаем стартапам и технологическим компаниям услуги разработки и внедрения ИИ решений под ключ. Обычно речь идет о различных ИИ-агентах и оптимизации процессов с помощью ИИ.

Кроме того, я создаю ИИ-сотрудников для автоматизации своей рутины и думаю мои решения могут помочь и другим бизнесам.

Сейчас мне 29 лет, я верю, что технологии, особенно искусственный интеллект, способны сделать мир лучше, и планирую принять в этом самое активное участие.

#обо_мне
О моей компании

Моя компания Andre AI Technologies предлагает услуги технического директора как сервис (CTO-as-a-Service) для ИИ-стартапов и технологических компаний.

Мы разрабатываем и внедряем технологии, которые позволяют компаниям эффективно достигать бизнес-целей, в том числе:

• Создаем архитектуру высоконагруженных систем машинного обучения и других технологических решений;

• Разрабатываем и реализуем стратегии внедрения и использовании ИИ в бизнесе, создаем дорожные карты для ИИ-продуктов;

• С помощью внедрения ИИ в процессы компании сокращаем издержки и увеличиваем прибыль;

• Помогаем нанять компетентных сотрудников для технических команд и менторим технических руководителей;

• Проводим исследования передовых ИИ-технологий для внедрения лучших решений в продукты компании;

• Тренируем модели машинного обучения для решения различных бизнес-задач, от классического ML до создания цифровых двойников и беспилотных машин;

• Разрабатываем приложения, обеспечивающие уникальный пользовательский опыт и приносящие значительную ценность клиенту;

• Обеспечиваем обмен данными между различными системами для продвинутой аналитики, что позволяет принимать эффективные решения на основе данных;

Моя команда состоит из ведущих профессионалов в области AI/ML, которые способны справляться с проектами любой сложности и добиваться превосходных результатов. При этом нам одинаково интересно работать как с небольшими стартапами, так и с крупными компаниями.

Мы готовы работать с любыми бюджетами и предлагать оптимальные решения, соответствующие финансовым возможностям клиента. Для небольших проектов у меня есть команда готовых к работе специалистов, которые могут немедленно приступить к выполнению задач.

Если проект требует более масштабного подхода, я помогаю с набором высококлассных специалистов и созданием новой команды с нуля. Мой гибкий подход ориентирован на потребности клиента: стоимость моих услуг сопоставима с наймом высококвалифицированного технического директора, однако я работаю проектно и меня не нужно брать в штат.

Подробно обо мне и моем опыте можно прочесть в прошлом посте, а здесь расскажу совсем кратко:

Я работал как в крупных международных корпорациях, так и в небольших стартапах, у меня степень магистра в области бизнес-информатики одного из ведущих вузов. Благодаря академическому образованию и практическому опыту я глубоко понимаю потребности каждого клиента и способен решать задачи любой сложности.

Карьеру я начал в международной IT-консалтинговой компании Accenture, затем перешел в Сбер, где успешно провел ИИ-трансформацию управленческих процессов, значительно повысив операционную эффективность компании.

После этого я поработал техническим директором в венчурной студии, где создал ИИ-платформу с эффективными процессами для быстрой разработки различных ИИ-приложений для стартапов. Эта платформа стала основой для успешного запуска множества проектов, и я планирую рассказывать о них в своем блоге.

Я убежден, что качественные данные — это все, что нужно для создания надежных интеллектуальных систем. Если у вас есть данные, мы вместе найдем им применение и создадим решения, которые помогут вашей компании расти и приносить больше пользы вашим клиентам.

Давайте работать вместе, чтобы сделать мир лучше!

#обо_мне
Как снизить затраты бизнеса на 30% при помощи ИИ-ассистентов

Билл Гейтс считает, что через 3-5 лет появятся ИИ-сотрудники. Они смогут обучаться и выполнять задачи без постоянного контроля со стороны пользователя. Им не нужно платить зарплату, они работают 24/7 и не совершают человеческих ошибок. В недалеком будущем, подключив несколько таких ИИ-сотрудников, можно будет создать ИИ-компанию, в которой все процессы автоматизированы, а владелец занимается только стратегией.

Но это будет потом. Впрочем, уже сейчас доступны полумеры - автономные ИИ-ассистенты, которые пусть и не заменяют людей, но помогают им решать задачи, увеличивая производительность труда.

Например, такие ассистенты полезны в области SMM, продаж, HR и разработки софта. Скажем, Amazon только на софте экономит таким способом $260 млн в год, а в целом бизнес может сэкономить до 30% на внедрении ИИ-решений.

Что касается меня лично, то я использую HR-ассистента для первичного отсева резюме при найме, другой ассистент, который умеет анализировать записи совещаний, неоднократно набрасывал неплохие идеи, ну и конечно не представляю, зачем бы я сегодня стал писать код без ИИ-ассистента, это кратно ускоряет разработку без потери качества.

Самое интересное, что внедрение такого ассистента – не фантастика, не требует огромных денег или невероятной квалификации. Начните с анализа того, какие задачи требуют больше всего времени и ресурсов. Когда определитесь с этим, выберите один из вариантов, исходя из ваших потребностей и навыков:

1. Нужно писать код: есть несколько открытых библиотек для создания ИИ-ассистентов, в первую очередь это LangChain, LangGraph, CrewAI и AutoGen. Эти инструменты позволяют гибко настраивать промпт-архитектуры с использованием языковых моделей. Также с их помощью можно интегрировать вызовы различных инструментов, использовать долгосрочную память и продвинутые методы рассуждения и рефлексии, а также создавать мультиагентные системы для автоматизации более сложных процессов. Я использую именно эти инструменты для разработки ИИ-ассистентов.

2. Не нужно писать код: использование таких инструментов как Zapier, Make , DialogFlow позволяет автоматизировать процессы без программирования. Они предлагают простой интерфейс и интеграции с различными сервисами. Например, с их помощью можно подключить любую языковую модель и настроить ее для выполнения конкретных задач.

3. Нужно уметь писать промпты: можно использовать популярные платформы с LLM, такие как ChatGPT, Claude, Gemini и Perplexity AI, напрямую. Все платформы, кроме Claude, предлагают доступ в интернет, а OpenAI имеет маркетплейс ассистентов GPTs, в котором можно создать своего ИИ-ассистента, добавив к нему необходимые знания (загрузив в него любую текстовую информацию) и навыки (ручки к API различных систем, фактически дав ассистенту возможность вызывать нужные функции. Здесь конечно придется немного писать код). На этом сайте можно изучить лучшие промпты для ваших задач, а инструмент PromptWise помогает оптимизировать промпты для ChatGPT.

4. Готовые продукты: Pygma AI предлагает ИИ-ассистента для ведения блога в соцсетях, Bland AI звонит клиентам и продает товары, PyjamaHR позволяет в 10 раз быстрее нанимать кандидатов, GitHub Copilot уже используют многие программисты для помощи в написании кода, а tl;dv подводит итоги рабочих совещаний. Конечно, коробочные решения не такие гибкие, но если они решают именно ваши задачи, то можно пользоваться.

Сейчас самый подходящий момент, чтобы начать использовать ИИ-ассистентов. Это не только повысит эффективность и сократит издержки, но и подготовит вашу компанию к будущим изменениям, когда полноценные ИИ-сотрудники станут реальностью. Это вопрос выживания, поэтому не ждите, пока технологии достигнут идеала — начните уже сейчас, и вы окажетесь на шаг впереди конкурентов.

#технологии
Как сэкономить миллиарды за счет ИИ-трансформации бизнеса

В 2020 году я стал директором по искусственному интеллекту (Chief Data Scientist) в стратегическом блоке Сбера. Основная задача была весьма амбициозной: вывести блок в лидеры по развитию ИИ. При этом в тот момент мы отставали от всех других блоков, у нас не было ни одной работающей ИИ-модели.

Для начала я проанализировал положение дел и разработал стратегию ИИ-трансформации блока по 35 различным параметрам - от уровня менеджмента до качества научных исследований. Задача была сложной сама по себе, но сложнее всего было утвердить ее на уровне банка и экосистемы.

Затем я сформировал команду из примерно 20 специалистов по данным. Мы начали глубокое изучение процессов: беседовали с сотрудниками, анализировали рабочие потоки. Сложнее всего поддавались анализу управленческие процессы, эффективность которых трудно измерить количественно.

После этого мы приступили к сбору источников данных для каждого процесса. Процессов оказалось более 30, и все требовали соблюдения конфиденциальности данных. Для работы с данными нам пришлось совместно с отделом кибербезопасности создать отдельное защищенное хранилище - кстати, первое в Сбере хранилище такого рода.

После завершения подготовительного этапа началась разработка моделей. Для макроэкономистов мы создали инструмент стресс-тестирования банка. В результате появилась возможность моделировать различные сценарии развития событий и оценивать их влияние на ключевые показатели банка – без риска для реальных активов.

Отдельный инструментарий был создан для работы с банковскими рынками: под каждый сегмент рынка была создана модель, при помощи которой аналитики могли прогнозировать их динамику и принимать обоснованные решения.

Для стратегического отдела мы создали целый ряд полезных инструментов:

• Модель анализа эффективности сотрудников помогала оценивать продуктивность каждого специалиста;

• Модель для прогнозирования потенциальных увольнений - это оказалось очень полезным для HR-отдела;

• Модель ONA (Organizational Network Analysis) для оптимизации организационной структуры, выявляющая неэффективное распределение кадров и дублирующие функции;

• Модель для оптимизации нахождения сотрудников в офисе в пандемию и определения оптимальной рассадки;

• Интеллектуальный календарь для руководителей, оптимизирующий их рабочий график. Это позволило топ-менеджерам более эффективно управлять своим временем;

• Система генерации бизнес-идей для высшего руководства. Хотя это может показаться футуристичным, система работала довольно эффективно, предлагая интересные концепции, пригодные для дальнейшей проработки человеком;

• Для стратегического дашборда разработали модель, которая автоматически сегментирует клиентов и строит аналитику под каждый сегмент. Это позволило стратегам лучше понимать клиента и принимать более эффективные решения по выводу продуктов на рынок;

• Кроме того, были разработаны и другие ИИ-модели. Ежемесячно каждый из моих сотрудников внедрял по две модели.

В ходе работы мы также внедрили систему интеллектуального анализа документов, которая существенно сократила время поиска необходимой информации в больших массивах данных. Это значительно ускорило процесс обработки отчетов и поиска нужных данных.

Также мы использовали инструменты интеллектуального анализа процессов для проектирования большинства бизнес-процессов банка и инструменты автоматического машинного обучения для прогнозирования метрик этих процессов (их было более 2000), не тратя рабочее время исследователей данных.

В результате нам удалось достичь значительного прогресса. За несколько месяцев мы повысили индекс зрелости ИИ с нулевой отметки до 93%, став лидерами по динамике роста в банке. Через год был подсчитан экономический эффект, который исчислялся несколькими миллиардами рублей. Точную сумму, к сожалению, раскрыть не могу - NDA.

Ну и в качестве вишенки на торте - я был признан одним из лучших руководителей банка 2021 года.

Получить такую оценку лично от президента Сбера было, конечно, очень приятно.

#кейсы
Как правильно «вкатиться в ИИ»

Многие думают, что для начала работы в сфере ИИ достаточно научиться писать классные промпты к GPT-4o. Так тоже можно, но далеко на этом не уедешь.

Чтобы действительно разобраться с тем, как работают нейросети, как их обучать и использовать в своих целях, для начала будет полезно получить некоторые фундаментальные знания: пройти курсы матстатистики, теорвера, линейной алгебры - это база. Также будут очень полезны курсы по численным методам, дискретной математике и теории информации. Конечно, в идеале стоит закончить специализированный ВУЗ, но не у всех есть на это пять лет, так что можно ограничиться Курсерой либо аналогами - главное все это именно изучить, а не “пройти мимо”.

Затем нужно освоить инструменты для работы с данными. Прежде всего стоит изучить Python — для анализа данных, и SQL — для работы с базами данных. В Python следует изучить такие библиотеки как NumPy и SciPy для математических операций, Pandas для анализа табличных данных, а также Matplotlib и Seaborn для визуализации данных. Библиотека Scikit-learn предоставляет широкий набор инструментов для работы с машинным обучением (ML), а PyTorch применяется для обучения нейронных сетей. Со стороны баз данных я бы начал с PostgreSQL для работы с табличными данными, позднее можно перейти к MongoDB для работы с неструктурированными данными.

Параллельно с изучением теории важно постепенно учиться применять навыки на практике, иначе будет скучно и недостаточно предметно. Можно начать с решения простой задачи, например, с построения модели предсказания выживаемости пассажиров Титаника. Эта задача считается базовой для начинающих, здесь можно найти пример ее решения разными методами. Более сложные задачи можно найти на платформе Kaggle. Конечно, можно придумать собственную задачу, решение которой принесет вам конкретную пользу. Например, в магистратуре я планировал купить квартиру в Москве и для этого собрал датасет со всеми объектами недвижимости города и построил модель для анализа и прогнозирования цен.

В принципе где-то в этом месте уже можно искать полноценную работу в области ML, а применять полученные знания можно еще раньше: например, при изучении Pandas можно автоматизировать ту работу, которая ранее велась в Excel.

После освоения классического машинного обучения можно перейти к изучению глубоких сетей, например, к задачам компьютерного зрения (CV) или обработке естественного языка (NLP). Компьютерное зрение используется для распознавания лиц, автономного вождения, медицинской диагностики и т.д. Обработка естественного языка поможет создавать чат-ботов, автоматически анализировать тексты и создавать поисковые системы. Возможно, вы захотите заниматься обучением с подкреплением (RL) или рекомендательными системами. В любом случае, на этом этапе я бы рекомендовал чтение профессиональной литературы и прохождение продвинутых курсов — к этому моменту вы уже сами разберетесь, каких именно. Но самое главное — практика.

Постепенно вы будете сталкиваться со все новыми и новыми задачами, и несмотря на то, что вы уже будете неплохо разбираться в машинном обучении — а на нем построена вся отрасль ИИ — вам придется постоянно учиться. Ежедневно в области ИИ выходит более сотни научных работ, и не отследив вовремя прорыв в своей области знаний, вы рискуете отстать. Я бы рекомендовал поступить в аспирантуру — там научат работать со статьями и источниками, лично для меня это был крайне полезный опыт.

Но даже обучение это еще не все. Самое главное, чтобы вам было интересно, очень сложно будет заниматься этим только ради денег. Конкуренция в этой области сегодня такова, что, перефразируя Кэрролла, нужно бежать со всех ног, чтобы только оставаться специалистом, а чтобы стать круче, надо бежать как минимум вдвое быстрее.

#мысли
В эту субботу я выступаю с докладом на конференции Data Fest в Ереване. Мой доклад будет посвящен персонализации мультиагентных систем для автоматизации ведения блога в соцсетях.

Конференция пройдет 6-7 сентября. На ней выступят представители Nvidia, Google, AWS, Yandex и других крупных компаний - регистрация бесплатная.

#события
Пришествие ИИ в геймдев: от улучшения графики к созданию персональных игр

В детстве я делал моды для некоторых видеоигр и даже писал об этом статьи для известного компьютерного журнала. Как-то я попробовал настроить "искусственный интеллект" для NPC в “Ведьмаке”. Мне хотелось сделать их диалоги более динамичными. Тогда у меня ничего не получилось — не было соответствующих технологий.

Теперь, спустя годы, благодаря нейросетям появились новые возможности, и не только в области диалогов. В качестве примера можно привести мод для Skyrim, который использует ИИ, чтобы расширить возможности общения с NPC. Мод использует ИИ Whisper для преобразования речи игрока в текст, который затем обрабатывается через ChatGPT. В этом случае ChatGPT действует как виртуальный NPC, генерируя ответы на основе предоставленной информации о персонаже. Более того, ChatGPT сохраняет контекст беседы, чтобы персонажи "помнили" предыдущие разговоры, что делает диалоги более живыми и динамичными.

Сегодня ИИ используются практически во всех аспектах видеоигр: графика, частота кадров, процедурная генерация уровней и музыки, поведение персонажей, принятие решений и выбор оптимальной стратегии — все это при известном желании можно доверить ИИ.

Однако одной из наиболее впечатляющих инноваций является использование ИИ для создания не просто отдельных элементов игр, а целых игровых миров в реальном времени. Этот подход уже продемонстрирован в исследованиях на примере знаменитой игры Doom.

Недавно исследователи из Google разработали модель ИИ под названием GameNGen, способную симулировать игровой процесс Doom (1993) без использования оригинального программного кода.

GameNGen использует нейросеть для рендеринга игровых кадров в реальном времени, обеспечивая частоту выше 20 кадров в секунду. Это позволяет создать играбельный опыт, который визуально напоминает классический Doom. Модель опирается на технологию Stable Diffusion и анализирует более 900 миллионов кадров оригинальной игры, чтобы сгенерировать реалистичные сцены и адаптировать их под действия игрока.

Как и традиционные компьютерные игры, модель ИИ работает по принципу игрового цикла: игрок вводит команду, игровой мир обновляется, а результат отображается на экране. Модель может симулировать различные игровые сценарии, такие как открытие дверей или уменьшение здоровья при атаке врагов, создавая реалистичное взаимодействие с виртуальной средой.

Однако у GameNGen есть ограничения — модель «помнит» только около 3 секунд игрового времени, что иногда приводит к тому, что объекты появляются или исчезают без логического обоснования. Тем не менее, даже с этими недостатками, GameNGen демонстрирует огромный потенциал: в будущем представляется возможным создание в реальном времени полностью сгенерированных игровых миров.

Эти миры будут создаваться на основе предпочтений игрока и будут предоставлять тот опыт, который нужен пользователю именно сейчас, без заранее заданного сюжета, сеттинга и структуры. Таким образом, приключения смогут стать бесконечными и неповторимыми.

Сколько осталось ждать, будут ли такие игры востребованы и сильно ли они будут по ощущениям отличаться от кислотного трипа — посмотрим.

#технологии
Как мы обучали беспилотные машины в симуляции

Однажды на конференции CES 2022 был представлен беспилотный гоночный болид «Формулы-1», управляемый ИИ. Стейкхолдеры нашей венчурной студии решили сделать нечто подобное, но для начала используя менее дорогие машинки.

Итак, в роли технического директора венчурной студии я участвовал в проекте по созданию гоночной игры c машинками для картинга в смешанной реальности.

Идея заключалась в том, чтобы игрок мог, сидя у себя дома в любой точке мира, управлять настоящими гоночными картами и соревноваться с другими игроками и ИИ. Задача состояла в том, чтобы разработать ИИ-автопилот для машинок, адаптируя его в систему для устранения задержек при передаче данных.

Пока одни инженеры обвешивали машинки лидарами, радарами, GNSS (Global Navigation Satellite System), камерами и датчиками для измерения скорости, температуры двигателя и т.п., а другие инженеры строили трассу для игры, ИИ-инженеры решили не терять время и начали обучать беспилотники в симуляции без использования настоящих машинок и готовой трассы.

Обычно беспилотники обучают на реальных данных с использованием синтетических, имитируя различные погодные условия, время суток, типы поверхностей и уровни освещенности. В таком случае датасет для обучения получается больше и разнообразнее. Мы же решили попробовать обучить машинки используя только синтетические данные.

Сначала мы разработали базовый пайплайн обучения с подкреплением (RL) и научились решать задачу Reward Shaping на соревнованиях AWS DeepRacer (кстати, вошли в топ-4% мирового рейтинга), чтобы понимать, какую функцию вознаграждения использовать для бейзлайна. В итоге мы наказывали машинку за врезания в края трассы и поощряли за быстрое прохождение круга.

Далее мы начали изучать среды симуляции: Carla, LG SVL, Gazebo и даже рассматривали обучение в GTA 5. В результате анализа мы выбрали Carla, так как эта среда поддерживает различные сенсоры, собственные карты и хорошо интегрируется с ROS (Robot Operating System).

В среду симуляции мы встроили интерфейс OpenAI Gym для обучения с подкреплением, поместили модель настоящего гоночного карта, модель трассы и создали для него виртуальные лидары. Виртуальные лидары позволили создать для беспилотника дополненную реальность «вида сверху» (bird’s-eye-view) для более точного обучения. Мы организовали систему хранения данных из различных сенсоров и настроили необходимые ML-пайплайны.

Также мы использовали техники curriculum learning, постепенно обучая машинку сначала не врезаться в края трассы, потом избегать врезаний в другие машинки и следом учиться обгонять машинки. В результате мы получили систему для асинхронного обучения нескольких агентов в симуляции. Мы обучили около сотни агентов на одной трассе за 5 часов, выбрали лучшую модель и встроили ее в реальный карт.

Мы наблюдали, как настоящая машинка для картинга, обученная только в симуляции, поехала по реальной трассе. Беспилотник резво входил даже в крутые повороты на скорости до 40 км/ч. Также мы попробовали запустить машинку на других трассах — сработало! Модель хорошо управляла картом даже на незнакомых трассах.

К сожалению, при скорости более 40 км/ч машинка теряла управляемость — все-таки физика берет свое и обучение в симуляции не учитывало неровность асфальта и другие мелкие детали. Нас ожидала масштабная работа над Sim2Real transition.

Но в итоге мне и другим игрокам удалось, сидя дома, через браузер управлять настоящей машинкой, соревнуясь с другими машинками, управляемыми ИИ. Это были незабываемые ощущения, которые невозможно передать словами.

Не у всех стартапов сходится экономика, чтобы он оказался прибыльным, но зато нам удалось разработать собственный фреймворк для обучения любых машинок в симуляции, а также выступить с докладом на различных конференциях. Это был крутой опыт с Reinforcement Learning и Robotics, который определенно поможет в будущих проектах.

#кейсы
⚡️OpenAI выпустили новую модель o1-preview!

OpenAI o1 — это новая LLM, специально обученная для выполнения сложных задач с помощью RL (reinforcement learning). Главная особенность — способность «думать перед тем, как ответить», благодаря чему она генерирует внутреннюю цепочку рассуждений (Chain-of-Thoughts) перед выдачей результата. Это позволяет модели лучше решать задачи, связанные с логикой, программированием и наукой.

Основные характеристики:

• 89-й перцентиль на задачах программирования (Codeforces);
• Успешно решает 73% задач на уровне кандидатов наук по физике, биологии и химии;
• Входит в число 500 лучших участников на отборе в Олимпиаду по математике в США (AIME);
• Модель o1-preview уже доступна в ChatGPT и через API для избранных пользователей.

Ключевые особенности:

Прогрессивное мышление: модель использует «цепочку рассуждений» для поэтапного решения сложных вопросов, что улучшает качество выводов и позволяет эффективно исправлять ошибки.

Повышенная точность: по сравнению с GPT-4o, модель o1 показывает значительно лучшие результаты в задачах с высокими требованиями к логическому мышлению — в 7-8 раз лучше в математике и на 15% точнее в науках, таких как физика и химия.

Новая парадигма: теперь важно не только как много данных и ресурсов используется для обучения, но и сколько времени модель тратит на размышления.

Рефлексия и самокритика: модель умеет «думать вслух» и анализировать свои ответы, что существенно повышает ее способность к самокоррекции.

В будущем OpenAI планирует значительно ускорить и удешевить модель, делая ее доступной для широкой аудитории.

Думаю, OpenAI o1 станет важной вехой в развитии ИИ благодаря способности размышлять, что кардинально меняет подход к использованию языковых моделей. Ранее нам приходилось использовать подход Chain-of-Thought самостоятельно, но теперь это делают за нас.

Возможно, скоро нас ждет интеграция и других методов рассуждений (Tree-of-Thoughts, Graph-of-Thoughts и т.д.), что позволит решать еще более сложные логические задачи.

#новости
🤖 Датаист
Как мы обучали беспилотные машины в симуляции Однажды на конференции CES 2022 был представлен беспилотный гоночный болид «Формулы-1», управляемый ИИ. Стейкхолдеры нашей венчурной студии решили сделать нечто подобное, но для начала используя менее дорогие…
This media is not supported in your browser
VIEW IN TELEGRAM
А вот и демо того, как мы учили беспилотники в симуляции.

На видео показано, как несколько машинок учатся одновременно в Carla-симуляции. Вид сверху создан с помощью виртуальных лидаров, а реальный карт едет по трассе самостоятельно.

#кейсы
ИИ на распутье: продолжится ли стремительный рост или нас ждет замедление?

В последние годы мы наблюдаем бум искусственного интеллекта (ИИ). Кажется, что ИИ скоро сможет заменить человека во всех сферах — от генерации контента до управления бизнесом. Но так ли это на самом деле?

Термин «искусственный интеллект» появился в 1950-х годах, когда считалось, что создание «настоящего ИИ» — вопрос ближайших лет. Однако оптимизм быстро угас из-за недооценки сложности задач и недостатка вычислительных мощностей, что привело к скептицизму и сокращению финансирования в 1970-х.

В 1980-е годы интерес к ИИ возродился благодаря экспертным системам для узкоспециализированных бизнес-задач, но высокие затраты и трудоемкость снова привели к спаду интереса через десятилетие.

К концу 1990-х интерес вновь вырос благодаря увеличению вычислительных мощностей и победе IBM Deep Blue над Гарри Каспаровым. В 2010-х ИИ пережил расцвет благодаря глубокому обучению, большим данным и дальнейшему росту мощностей. В 2016-м алгоритм AlphaGo победил чемпиона мира по го Ли Седоля, а появление трансформеров в 2017 году дало начало моделям GPT и современным достижениям.

Но не ждет ли ИИ следующая зима? Все зависит от ожиданий общества, инвесторов и экспертов относительно способностей ИИ. Сейчас многие прогнозируют появление AGI (общего ИИ) в ближайшие годы, как и в 1960-х. Однако современные системы ИИ основаны на хорошо известных математических методах: векторные пространства, перемножение матриц, методы оптимизации. Трансформеры лишь предсказывают вероятность следующего токена. Можно ли это назвать интеллектом?

Проблема в том, что мы пока не знаем, что такое интеллект как феномен. Существует множество определений интеллекта, однако общее одно - способность решать когнитивные задачи. Сегодня мы имеем дело с «узким» ИИ (Artificial Narrow Intelligence), способным решать специфические задачи: распознавание лиц, машинный перевод и т.д. ИИ уже применяется в разных индустриях, от медицины до банкинга, принося значительную прибыль. Мы действительно живем в эпоху 4-й промышленной революции, где ИИ помогает решать задачи быстрее и качественнее, а иногда заменяет человеческий труд.

Насколько далеко расширится применение ИИ? Ждет ли нас замедление этого взрывного роста?

Есть несколько сдерживающих факторов:

- Алгоритмы. Помимо трансформеров и диффузионных моделей для генерации картинок, музыки и видео, нет качественно новых алгоритмов, требующих меньше данных для обучения. Методы обучения с подкреплением развиваются, но на горизонте не видно прорывных решений (о KAN-сетях Колмогорова-Арнольда пока судить рано).

- Данные. Для обучения ИИ нужны большие объемы качественных данных. OpenAI уже сталкивается с тем, что данные в интернете истощаются, а наполнение синтетическими данными может вести к деградации моделей. Нужно либо больше данных, либо новые алгоритмы обучения. Вероятно, необходимо и то, и другое.

- Вычисления. Закон Мура, предсказывающий удвоение числа транзисторов каждые два года, больше не обеспечивает прежнего прироста мощностей. Большие языковые модели требуют огромных вычислительных ресурсов, и это создает новые вызовы. Необходим качественно новый тип вычислений — например, квантовый. Тема квантового машинного обучения набирает обороты, но работающие квантовые компьютеры для прикладных задач пока недоступны.

В результате мы видим, что ИИ уже сегодня совершает революцию в различных индустриях и что многие ожидают от него и стоящих за ним в сущности банальных математических методов чего-то сверхъестественного. Прогресс продолжается: ИИ учится рассуждать и решать все более сложные задачи.

Но есть, как водится, две новости — хорошая и плохая. Плохая новость состоит в том, что однажды мы упремся в ограничения — по одной причине или по совокупности нескольких. Хорошая новость — это случится не сегодня.

Я думаю, что ИИ недалекого будущего поможет нам преодолеть эти ограничения, если мы будем применять его в науке и технике, ускоряя общий технологический прогресс. Мы живем в удивительное время, и хочется верить, что зима не близко.

#мысли
ИИ в медицине: революция в лечении и диагностике

Сегодня хочу поговорить про то, как исскусственный интеллект творит чудеса в медицине. Вот лишь несколько шокирующих (в хорошем смысле) примеров:

Предсказание структуры молекул: Проект AlphaFold 3 помогает ученым быстрее разрабатывать новые лекарства.

Ранняя диагностика рака: ИИ научился находить рак легких на КТ-снимках с точностью 87%. Живые врачи так не могут.

Системы поддержки врачебных решений: Система использует языковые модели для анализа текстов и изображений, геномных данных и медицинских руководств. Результаты показали 97% случаев корректного применения соответствующих инструментов, 93,6% правильных заключений, 94% полноты предоставленных рекомендаций, 89,2% полезных рекомендаций и 82,5% корректных ссылок на релевантные источники.

Персонализированная медицина: ИИ анализирует данные пациентов и помогает подобрать наилучшее лечение. Например, он может предсказать, поможет ли химиотерапия конкретному человеку с точностью более 80%.

Умные носимые устройства: Теперь ваши часы могут следить за здоровьем и предупреждать о проблемах еще до того, как вы их заметите.

Робот-стоматолог: Звучит как фантастика, но это уже реальность! Робот может подготовить зуб для коронки всего за 15 минут вместо обычных двух часов.

Редактирование генов: ИИ помогает создавать инструменты для изменения ДНК. Это может помочь в борьбе с наследственными заболеваниями.

Несмотря на кажущиеся огромные успехи, использование ИИ в этой области поднимает серьезные этические вопросы. Как далеко мы готовы зайти в редактировании генов? Одним из таких вопросов является возможность несанкционированного редактирования генов у эмбрионов, что может привести к нежелательным мутациям. Регулирование в отрасли необходимо для того, чтобы эта технология использовалась этично и безопасно.

Кроме того, хотя ИИ имеет огромный потенциал для улучшения диагностики, разработки лекарств и редактирования генов, он сталкивается с рядом серьезных вызовов.

Во-первых, ИИ требует большого объема качественных данных для обучения. Если данные недостаточно разнообразны или неполны, это может привести к ошибочным результатам. ИИ может быть предвзятым, если он обучался на данных, которые не отражают всю популяцию, что может ухудшить результаты диагностики или лечения для недостаточно представленных групп пациентов.

Во-вторых, остается вопрос доверия к ИИ. Пациенты и врачи должны быть уверены в безопасности и надежности алгоритмов. Кроме того, важна интерпретируемость ИИ-решений — врачи должны понимать, как и почему ИИ принял то или иное решение, чтобы использовать его рекомендации обоснованно.

Наконец, есть проблемы с конфиденциальностью данных. Большие объемы медицинских данных требуют надежных механизмов защиты, чтобы предотвратить утечки.

Но я верю, что преимущества перевешивают риски. Вполне возможно, скоро мы сможем победить болезни, которые сегодня считаются неизлечимыми.

#технологии
ИИ-стартап: путь к успеху

Я знаю по опыту, что большинство стартапов терпят неудачу, и с этим ничего не поделать. Но также я знаю, что принятие верных и быстрых технологических решений может помочь одной из десятка идей пройти весь путь до финальной стадии и привести команду к большому успеху.

Недавно я написал об этом статью на Хабр. Дал ей отлежаться, слегка переписал и теперь хочу рассказать о ней и здесь.

В ней говорится о том, как устроен запуск стартапа с точки зрения технологий, а не инвестиций и бизнеса.

Какой софт использовать для создания структуры бизнес-модели и архитектуры технического решения? Как прототипировать? Как максимально быстро собрать MVP продукта, чтобы получить первый фидбек от пользователей? Как подключить платежки и аналитику, какие для этого использовать решения? Как правильно масштабироваться, если получилось начать расти? Наконец, как поддерживать готовый зрелый продукт? Обо всем этом я рассказываю в статье.

Буду рад, если это окажется полезным.

#гайд
Как ИИ помогает принимать стратегические решения

Люди эмоциональны и потому необъективны. Ты вкладываешься в проект, в который веришь, он приносит убытки и нет никаких причин, чтобы ситуация поменялась в будущем. Но ты продолжаешь верить, что проект вот-вот «выстрелит», и сжигаешь в нем все больше денег.

Было бы классно, если бы в этот момент кто-то мог бы честно и непредвзято проанализировать ситуацию и дать совет. Это вполне мог бы быть искусственный интеллект – чего у него точно нет, так это когнитивных искажений. Он оперирует только фактами.

Как раз такую задачу мы решали для «Сбера». Нужно было разработать систему для топ-менеджеров, которая помогала бы им принимать обоснованные объективные решения. Для работы мы использовали фреймворк CRISP-DM (Cross-industry standard process for data mining):

Определили бизнес-задачу. Мы определили ключевые процессы, на основе которых топ-менеджмент принимает решения, и согласовали методологию расчета KPI для каждого процесса. Например, мы проанализировали шаги выдачи кредитной карты — от получения клиентской заявки до активации карты. А затем написали KPI по всем этапам — время обработки заявки, процент одобрений и т.д.

Получили текущие данные по процессам. Это было сложно — пришлось искать в нескольких системах и договариваться с менеджерами. Но мы справились!

Привели данные в единый формат. Данные были неполными и в разных форматах. Мы очистили их и дополнили сведениями из дополнительных источников.

Построили ИИ-модели для прогнозирования метрик. Сделали это на основе полученных данных и выработанных KPI. Логистическая регрессия показала неплохие результаты.

Провели A/B-тестирование моделей, разделив данные на контрольную и тестовую группы. Сравнили эффективность модели с текущими показателями и убедились в ее надежности. Также проверили, чтобы модели соответствовали требованиям безопасности банка.

Внедрили модели в промышленный контур банка и настроили мониторинг качества. Чтобы модели не деградировали со временем, разработали процесс регулярного переобучения, используя MLOps-практики.

Также мы учли сложные взаимосвязи между процессами, чтобы предсказывать комплексные события. Например, рынок меняется из-за макроэкономических процессов, и это влияет на внутреннюю работу банка.

Чтобы связать модели и спрогнозировать влияние одного процесса на другой, мы использовали композитное моделирование и инструменты автоматического машинного обучения FEDOT и LightAutoML.

Конечно, ИИ пока не способен заменить людей в принятии решений. Но он может стать помощником, если вы хотите принимать бизнес-решения не на основе убеждений и интуиции, а руководствуясь точными и непредвзятыми данными.

#кейсы
Будущее OpenAI: что ждет компанию после ухода технического директора

Не успела OpenAI представить нового голосового ассистента, способного адаптироваться к эмоциям пользователя, как объявила о своем уходе Мира Мурати, технический директор компании. Она занимала свою должность более шести лет и отвечала за техническое руководство компанией, а также за внедрение инноваций. Во многом именно благодаря ей OpenAI стала той компанией, которую мы все знаем.

Кроме чисто технических аспектов, Мурати также занималась стратегическим планированием и построением партнерских отношений с другими компаниями и организациями.

Ее уход может серьезно повлиять как на темпы, так и на направления развития компании. Будущее OpenAI будет во многом зависеть от того, как руководство справится с текущими изменениями и продолжит инновации в быстроразвивающейся и очень конкурентной индустрии ИИ.

Не пытаясь гадать о причинах ухода Мурати, скажу, что хорошо понимаю, с какими вызовами ей приходилось справляться ежедневно. OpenAI прямо сейчас необходимо решить множество проблем: для обучения более мощной модели требуется огромная инфраструктура, что-то нужно делать с вопросами безопасности и соответствия модели морально-этическим нормам. Под сомнением находится прозрачность источников данных — например, когда журналист спросил, откуда берутся данные для обучения SORA, Мира аккуратно ушла от ответа.

А впереди маячит следующая глобальная задача — обучение GPT-5, и там все эти проблемы снова встанут во весь рост.

Впрочем, инвесторы продолжают предлагать OpenAI больше денег, чем компания готова принять: если верить Bloomberg, компания вскоре получит еще 6,5 миллиардов долларов.

#новости
ИИ для гуманоидных роботов: от механики к разуму

Все мы видели красивые видеоролики, на которых более или менее человекоподобные роботы выполняют сложные задачи: от точных движений руки до самостоятельного передвижения по комнате и даже сальто.

На первый взгляд, кажется, что это достижение чисто механической инженерии и сравнительно несложного программирования: есть карта помещения, есть датчики для определения своего положения в пространстве, есть сведения об устройстве и возможностях своих подвижных частей и уравнения, описывающие физические взаимодействия.

Казалось бы, совместить все это — дело техники. Однако такой механистический подход может работать только в полностью заданной среде либо при наличии внешнего управления (почитайте, как такую задачу «решили» в 18-м веке), а роботу предстоит действовать самостоятельно и в средах с динамическим окружением.

Конечно, у робота есть сенсоры и камеры, он получает информацию об окружающем мире, но эту информацию нужно обработать, проанализировать и принять адекватные решения. И тут без ИИ не обойтись.

Семантические сети, онтологии и языковые модели помогают роботу «понимать» контекст и связывать разрозненные данные из окружающего мира. Современные когнитивные архитектуры представлены в виде цепочек и графов мыслей, а также других форм рассуждений. Несмотря на то, что уже сейчас можно имитировать базовые формы человеческих рассуждений, до полноценного «понимания» еще далеко. Тем не менее, эти технологии позволяют роботам эффективно анализировать информацию и адаптироваться к новым ситуациям.

Чтобы просто пройти через комнату, не натыкаясь на препятствия, робот использует алгоритмы планирования и навигации. Технологии вроде SLAM (Одновременная локализация и построение карты) и алгоритмы поиска кратчайших путей (например, A* или алгоритм Дейкстры) помогают ему прокладывать маршрут и адаптироваться к изменяющейся среде. Без этих методов робот не смог бы эффективно перемещаться в неизвестных условиях.

Благодаря ИИ роботу может учиться на собственных ошибках, используя обучение с подкреплением. Когда робот сталкивается с трудностями, он анализирует свои действия, получает обратную связь и улучшает свои стратегии. Это особенно важно для задач, требующих адаптации, таких как ходьба по неровной поверхности или манипуляция объектами.

Не менее важны и симуляции. Перед тем как выйти в реальный мир, робот проходит обучение в виртуальных средах, таких как Carla или Gazebo. В этих симуляциях он может безопасно отрабатывать различные сценарии, что ускоряет процесс обучения и повышает надежность его действий.

Наконец, управление движениями требует точных алгоритмов стабилизации и координации. Такие методы, как PID-регулирование и адаптивные алгоритмы, обеспечивают плавное и безопасное движение робота, позволяя ему быстро реагировать на изменения и точно выполнять поставленные задачи.

В ближайшем будущем развитие робототехники будет сосредоточено на промышленных многофункциональных роботах для использования на безлюдных объектах и некоторых специализированных применений. Домашнее использование гуманоидных роботов пока остается в отдаленной перспективе: предстоит снизить стоимость, улучшить полезность, решить проблемы безопасности.

Но уже сегодня ИИ превращает гуманоидных роботов в интеллектуальных и автономных помощников, способных выполнять сложные задачи и адаптироваться к новым условиям. Если эти машины могут видеть, рассуждать, планировать и учиться, то чем мы принципиально отличаемся от них, кроме того, что наше «железо» построено на органической элементной базе?

Здесь придется перейти к разговору о сути сознания. К сожалению, мы еще далеко не до конца понимаем, что это такое — что, впрочем, не мешает нам рассуждать на эту тему.

Но об этом — в следующем посте.

#технологии