Немного унылый - и как раз поэтому впечатляющий своей будничностью кейс использования разных генеративных инструментов в пайплайне подготовки традиционной рекламной кампании. На фестивальную рекламу результат и близко не тянет, зато:
1. весь процесс создания рекламной кампании от придумывания концепции до получения готовых к размещению материалов занял 4 недели. Поскольку не стояла задача использовть ИИ там, где люди еще лучше справляются, первые три недели в основном трудились люди, а доставшаяся ИИ работа была выполнена за неделю безо всякой спешки (в традиционной версии с белковыми креаторами аналогичные компании занимали 3-4 месяца).
2. Расходы составили примерно на миллион долларов меньше, чем если б то, что делала связка Sora, Runway, Midjourney, Topaz Labs и Adobe’s Photoshop и Premiere делалось без ИИ-инструментария опытными людьми. Не то, чтоб кто-то кого-то заменил, но расходы на ФОТ сократили изрядно.
Самое важное в этом кейсе в том, что не стояла задача поразить инновационностью, внедрить ИИ ради внедрения или реализовать прежде нереализуемое. Нет, нужно было сделать обычную работу максимально эффективно с точки зрения стоимости и длительности.
И вполне норм получилось.
https://www.marketingdive.com/news/atera-video-ad-campaign-entirely-gen-ai/730469/
1. весь процесс создания рекламной кампании от придумывания концепции до получения готовых к размещению материалов занял 4 недели. Поскольку не стояла задача использовть ИИ там, где люди еще лучше справляются, первые три недели в основном трудились люди, а доставшаяся ИИ работа была выполнена за неделю безо всякой спешки (в традиционной версии с белковыми креаторами аналогичные компании занимали 3-4 месяца).
2. Расходы составили примерно на миллион долларов меньше, чем если б то, что делала связка Sora, Runway, Midjourney, Topaz Labs и Adobe’s Photoshop и Premiere делалось без ИИ-инструментария опытными людьми. Не то, чтоб кто-то кого-то заменил, но расходы на ФОТ сократили изрядно.
Самое важное в этом кейсе в том, что не стояла задача поразить инновационностью, внедрить ИИ ради внедрения или реализовать прежде нереализуемое. Нет, нужно было сделать обычную работу максимально эффективно с точки зрения стоимости и длительности.
И вполне норм получилось.
https://www.marketingdive.com/news/atera-video-ad-campaign-entirely-gen-ai/730469/
Marketing Dive
How — and why — this brand created an ad campaign entirely with AI
IT management platform Atera used generative AI tools including Sora and Midjourney to save up to $1 million on video ad production.
Forwarded from Futuris (Anton)
Nvidia сделала презентацию своей системы для обучения роботов 🤖 Хуанг хочет и этот рынок захватить 🌚
https://youtu.be/uhLDHA9skFk?si=TnaKN33GcAaUaztG
https://youtu.be/uhLDHA9skFk?si=TnaKN33GcAaUaztG
YouTube
The Next Wave of AI: Physical AI
Advancements in accelerated computing and physics-based simulation, have led us to the next frontier of AI: Physical AI.
Physical AI models can perceive, understand, interact and navigate the physical world with generative AI. This new frontier of AI manifests…
Physical AI models can perceive, understand, interact and navigate the physical world with generative AI. This new frontier of AI manifests…
В продолжение темы. С огромным интересом слежу за тем, что Nvidia и Китай делают в области человекоподобных роботов. Есть, конечно, шумный Маск со своими Оптимусами, но пока там все негромко (кроме самого Маска, конечно). А вот вполне вызывающие игры Хуанга со словами “Building foundation models for general humanoid robots is one of the most
exciting problems to solve in AI today. The enabling technologies are coming together for leading roboticists around the world to take giant leaps towards artificial general robotics,” — настойчиво напоминают, что не AGI единым;)
А Китай, как известно, собрался запускать массовое производство таких роботов аж в 2025, и это не опечатка.
И вот свеженькое: “…like electric cars, AI-powered humanoid robots will soon become affordable enough to reside in everyday homes and workplaces” — слова VP of Omniverse and Simulation Technology из Nvidia.
“I believe that they’re going to become so common, they’ll be like our cell phones,” — смелый, но увлекательный прогноз, похлеще обещаний стартаперов, потеющих над очередной носимой ИИ-штучкой:)
https://www.techradar.com/pro/ai-powered-humanoid-robots-are-closer-than-we-think-says-nvidia-exec
exciting problems to solve in AI today. The enabling technologies are coming together for leading roboticists around the world to take giant leaps towards artificial general robotics,” — настойчиво напоминают, что не AGI единым;)
А Китай, как известно, собрался запускать массовое производство таких роботов аж в 2025, и это не опечатка.
И вот свеженькое: “…like electric cars, AI-powered humanoid robots will soon become affordable enough to reside in everyday homes and workplaces” — слова VP of Omniverse and Simulation Technology из Nvidia.
“I believe that they’re going to become so common, they’ll be like our cell phones,” — смелый, но увлекательный прогноз, похлеще обещаний стартаперов, потеющих над очередной носимой ИИ-штучкой:)
https://www.techradar.com/pro/ai-powered-humanoid-robots-are-closer-than-we-think-says-nvidia-exec
TechRadar
AI-powered humanoid robots are closer than we think, says Nvidia exec
The next wave of AI will come in the form of robots, experts predict
А креативная публика все продолжает возмущаться, но большие дяди на этой поляне их все чаще не радуют. В сентябре Джеймс Кэмерон вошел в совет директоров Stability AI, заявив, что ИИ “will unlock new ways for artists to tell stories in ways we could have never imagined”.
А теперь тему сторителлинга подхватил Дисней, заявив устами директора, что компания "uniquely poised to integrate AI," причем не только в департаментах, ответственных за теле- и кинопроизводство, но и в своей империи парков развлечений.
Don’t fixate on its ability to be disruptive — fixate on tech’s ability to make us better and tell better stories.
Позиция самого автора статьи в MovieWeb предсказуема, но все более заметные перемены в позиции индустрии она вряд ли остановит.
https://movieweb.com/how-disney-ai-initiative-affects-film-tv/
А теперь тему сторителлинга подхватил Дисней, заявив устами директора, что компания "uniquely poised to integrate AI," причем не только в департаментах, ответственных за теле- и кинопроизводство, но и в своей империи парков развлечений.
Don’t fixate on its ability to be disruptive — fixate on tech’s ability to make us better and tell better stories.
Позиция самого автора статьи в MovieWeb предсказуема, но все более заметные перемены в позиции индустрии она вряд ли остановит.
https://movieweb.com/how-disney-ai-initiative-affects-film-tv/
MovieWeb
Disney Is Reportedly Announcing a Huge AI Initiative That Affects Film & TV
What would Walt think? Well, some might argue that he'd approve.
Forwarded from Системный Блокъ
Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP
Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более глубокой истории. Закат ABBYY — это фиксация проигрыша последней битвы лингвистов за автоматическую обработку языка. Мир Data Science победил. Главный редактор «Системного Блока» Даниил Скоринкин, работавший ABBYY в 2013–2017, подводит итоги и пытается сформулировать уроки из этой истории.
Что за ABBYY и при чем тут лингвисты и NLP?
История ABBYY началась в 1989 году, когда студент МФТИ Давид Ян решил сделать электронный словарь для подготовки к экзамену. Так появились Lingvo, а затем — система распознавания символов FineReader. Продукты ABBYY развивались, и компания стала глобальным лидером оптического распознавания в 1990-е и 2000-е. Затем ABBYY двинулась покорять машинный перевод.
На вооружение они взяли идеи известных лингвистов — в первую очередь Модели «Смысл ⇔ Текст» (прочитать о ней можно в нашем интервью с И. А. Мельчуком). Амбиция была в том, чтобы разобрать человеческие языки как формальные структуры на базе семантической иерархии. Но естественный язык устроен противоречиво и постоянно изменяется, подход оказался негибким и немасштабируемым
Что пошло не так?
В 2006-м появилась первая версия Google Translate. Она была несовершенной, но главное, что в ней был другой — статистический — подход. И масштабируемость. Для её улучшения не нужны были сотни лингвистов, только еще больше примеров перевода. В 2010-х стало ясно, что никаких шансов тягаться с Google Translate у ABBYY не было. С перевода ABBYY переключилась на задачи информационного поиска и извлечения информации из текста, но и там столкнулась с теми же проблемами: описания языка на базе лингвистической теории оказались немасштабируемыми, а решения уступали подходам на основе чистого машинного обучения.
C новой проблемой компания столкнулась весной 2022 – им пришлось выехать из России, чтобы сохранить зарубежных клиентов. Следующим ударом стали большие языковые модели, который научились выполнять те же задачи, что и классические системы распознавания от ABBYY. Сейчас от компании осталась только вывеска, действующие продукты и небольшое количество менеджеров и специалистов по продажам.
Какие уроки мы извлекаем?
За 70 лет исследований ИИ стало ясно, что самые общие методы, опирающиеся на масштабирование вычислений, намного эффективнее всех остальных. А желание ABBYY сделать универсальную NLP-систему с опорой на лингвистическую теорию оказалось утопией.
И всё-таки ABBYY успела сделать много важного: открывала кафедры на Физтехе и в РГГУ, оцифровывала наследия Льва Толстого и архива Большого театра. А еще благодаря ей появился «Системный Блокъ», ведь сооснователи издания познакомились именно там. И именно там вы сможете прочитать полную версию поста с мемами, фотографиями и более детальным описанием цифровой «Вавилонской башни», которую пыталась строить ABBYY.
🤖 «Системный Блокъ» @sysblok
Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более глубокой истории. Закат ABBYY — это фиксация проигрыша последней битвы лингвистов за автоматическую обработку языка. Мир Data Science победил. Главный редактор «Системного Блока» Даниил Скоринкин, работавший ABBYY в 2013–2017, подводит итоги и пытается сформулировать уроки из этой истории.
Что за ABBYY и при чем тут лингвисты и NLP?
История ABBYY началась в 1989 году, когда студент МФТИ Давид Ян решил сделать электронный словарь для подготовки к экзамену. Так появились Lingvo, а затем — система распознавания символов FineReader. Продукты ABBYY развивались, и компания стала глобальным лидером оптического распознавания в 1990-е и 2000-е. Затем ABBYY двинулась покорять машинный перевод.
На вооружение они взяли идеи известных лингвистов — в первую очередь Модели «Смысл ⇔ Текст» (прочитать о ней можно в нашем интервью с И. А. Мельчуком). Амбиция была в том, чтобы разобрать человеческие языки как формальные структуры на базе семантической иерархии. Но естественный язык устроен противоречиво и постоянно изменяется, подход оказался негибким и немасштабируемым
Что пошло не так?
В 2006-м появилась первая версия Google Translate. Она была несовершенной, но главное, что в ней был другой — статистический — подход. И масштабируемость. Для её улучшения не нужны были сотни лингвистов, только еще больше примеров перевода. В 2010-х стало ясно, что никаких шансов тягаться с Google Translate у ABBYY не было. С перевода ABBYY переключилась на задачи информационного поиска и извлечения информации из текста, но и там столкнулась с теми же проблемами: описания языка на базе лингвистической теории оказались немасштабируемыми, а решения уступали подходам на основе чистого машинного обучения.
C новой проблемой компания столкнулась весной 2022 – им пришлось выехать из России, чтобы сохранить зарубежных клиентов. Следующим ударом стали большие языковые модели, который научились выполнять те же задачи, что и классические системы распознавания от ABBYY. Сейчас от компании осталась только вывеска, действующие продукты и небольшое количество менеджеров и специалистов по продажам.
Какие уроки мы извлекаем?
За 70 лет исследований ИИ стало ясно, что самые общие методы, опирающиеся на масштабирование вычислений, намного эффективнее всех остальных. А желание ABBYY сделать универсальную NLP-систему с опорой на лингвистическую теорию оказалось утопией.
И всё-таки ABBYY успела сделать много важного: открывала кафедры на Физтехе и в РГГУ, оцифровывала наследия Льва Толстого и архива Большого театра. А еще благодаря ей появился «Системный Блокъ», ведь сооснователи издания познакомились именно там. И именно там вы сможете прочитать полную версию поста с мемами, фотографиями и более детальным описанием цифровой «Вавилонской башни», которую пыталась строить ABBYY.
Please open Telegram to view this post
VIEW IN TELEGRAM
Системный Блокъ
Горький урок ABBYY: как лингвисты проиграли последнюю битву за NLP - Системный Блокъ
Недавно СМИ облетела новость об увольнении всех российских программистов из компании ABBYY (тоже в прошлом российской, а теперь уже совсем нет). Теперь, когда страсти вокруг обсуждения дискриминации сотрудников по паспорту улеглись, хочется поговорить о более…
Microsoft выпустил свой традиционный годовой отчет; он начинается обращением Сатьи Наделлы. Как-то я не задумывался, что компания готовится встретить свой весьма достойный круглый юбилей — полувековой.
Как еще одну веху Наделла упоминает, что второй год компания проживает AI platform shift.
Я не фанат Microsoft и давно сбежал с Windows, но тут и правда есть чем компании гордиться.
Оставаться в группе лидеров на динамичном рынке, очень вовремя и адекватно реагировать на новинки (в т.ч. и ИИ) — не у всех получается.
Надела выделяет три главных функциональности, характерных для “эры ИИ”:
1. Новый мультимодальный (как на вход, так и на выход) пользовательский интерфейс
2. Длинную память, которая аккумулирует персональный контекст, данные на всех устройствах и информацию из интернета
3. Появление у устройств способности рассуждать и планировать, что снижает когнитивную нагрузку на человека
Ну, а дальше — никаких особых откровений: копайлоты и агенты вокруг нас. Впрочем, послание к инвесторам и партнерам от лица такого гиганта и должно быть в меру консервативным, сильно новаторским прогнозам в нем не место. В любом случае, такой взгляд на технологический мир впечатляет. А для любителей конкретики в тексте по ссылке есть немало кейсов крутого влияния ИИ на бизнес в разных областях, от ритейла до образования.
https://www.microsoft.com/investor/reports/ar24/
Как еще одну веху Наделла упоминает, что второй год компания проживает AI platform shift.
Я не фанат Microsoft и давно сбежал с Windows, но тут и правда есть чем компании гордиться.
Оставаться в группе лидеров на динамичном рынке, очень вовремя и адекватно реагировать на новинки (в т.ч. и ИИ) — не у всех получается.
Надела выделяет три главных функциональности, характерных для “эры ИИ”:
1. Новый мультимодальный (как на вход, так и на выход) пользовательский интерфейс
2. Длинную память, которая аккумулирует персональный контекст, данные на всех устройствах и информацию из интернета
3. Появление у устройств способности рассуждать и планировать, что снижает когнитивную нагрузку на человека
Ну, а дальше — никаких особых откровений: копайлоты и агенты вокруг нас. Впрочем, послание к инвесторам и партнерам от лица такого гиганта и должно быть в меру консервативным, сильно новаторским прогнозам в нем не место. В любом случае, такой взгляд на технологический мир впечатляет. А для любителей конкретики в тексте по ссылке есть немало кейсов крутого влияния ИИ на бизнес в разных областях, от ритейла до образования.
https://www.microsoft.com/investor/reports/ar24/