ИИволюция 👾
10.4K subscribers
740 photos
328 videos
1 file
697 links
Авторский канал Сергея Пахандрина про AI, нейросети, вайб-разработку, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
Download Telegram
Forwarded from пустоe
Реставрация фотографии церкви

Новосёлы из села Сельцы (Рязанская область) решили восстановить Церковь Покрова Пресвятой Богородицы. От здания церкви осталось совсем немного. Сейчас они собирают деньги на восстановление, в том числе через продажу сувениров.

Уже к 1938 году церковь потеряла колокольню, а лучшая сохранившаяся фотография была не очень хорошего качества. Ксюша, которая делала макеты для сувенирных кружек, поделилась со мной этой фотографией.

Реставрация старых фото — интересная задача для работы с нейронками. Она имеет жёсткие ограничения и конкретный образ результата, в отличие от обычных нейрогенераций, где можно играться с детальностью и образом.

Опыт получился занятным. Процесс (скорее, общую логику процесса) я зафиксировал на карточках.

1) От здания мало что осталось, но и современные фотографии тоже могут пригодиться в процессе.

2) Начинаю с поиска инструментов автоматической реставрации. Но с ними не всё так просто. Большинство инструментов делают то, что я могу сделать сам (поиграться с уровнями и контрастностью, например). Какие-то сервисы удаляют трещины и царапины, но эту задачу легче решить генеративной заливкой в фотошопе. В общем, готовые сервисы мне не помогли, но немного пригодились нейро-фильтры фотошопа. Фильтр «реставрация фото» подтянул контрастность, а «колоризация» наметила цветовые пятна.

3)Этап предварительной подготовки фотографии очень важен. Мы можем использовать изображение с фотографии в качестве основы для новой генерации. Но с такими генерациями всегда приходится балансировать. Можно задать нейронке высокий уровень схожести с оригиналом, но тогда перенесутся все нежелательные артефакты. Если выставить низкий уровень схожести, архитектура начнёт искажаться. Я перепробовал несколько инструментов (Leonardo, FireFly, MJ), но все они давали либо слишком искажённый результат, либо не вносили значимых изменений. Этот этап занял у меня больше всего времени. И я пошёл в vizcom.

4) У vizcom есть две очень хорошие черты. Во-первых, он аккуратен с исходным контуром. Во-вторых, он неплохо понимает объём. К тому же у меня был референс стены настоящей церкви. Поэтому в vizcom я скрестил свою слегка улучшенную фотографию с фотографией остатков здания. И произошло чудо. Мыльно, с артефактами, но vizcom здорово поймал атмосферу. С первой же генерации. С этим результатом уже можно работать.

5) Теперь, когда цвета и фактуры пойманы, можно возвращаться в Leonardo. Загружаю изображение в Image Guidance (так там называется control net) и экспериментирую с параметрами денойзинга. Много генераций, несколько десятков, но результат меня уже почти устраивает. Закидываю несколько генераций в фотошоп, выборочно подчищаю, снова возвращаю в Леонардо (уменьшаю денойз). Несколько проходок — и готово.

6) Когда с крупными деталями покончено, можно закидывать в krea на энханс. Иногда возвращаюсь в фотошоп, чтобы подтереть очевидные несуразности. Немного цветокоррекции — готово.

7) Анимация. Это совсем не нужно, но я решил протестировать Gen3. Работает отменно!

Я понимаю, что результат далёк от идеала. На фотографии не всё можно разглядеть, а сам я совершенно ничего не смыслю в архитектуре церквей. Стоило бы взять консультацию, но сжатые сроки и нулевой бюджет... Энивей, получилось занятно.
🔥106🤩2🤷‍♂1🗿1
Таааааак, это что еще за загадки?

Аккаунт ChatGPT в твиттере пишет, что все мы еще с прошлой недели пользуемся обновленной моделью gpt4o, но это не gpt-4o-2024-08-06 (о чем уже в реплаях спросили). Т.е. они релизнули что-то в тихую, никому не сообщив, собирали фидбек в стелс режиме, а мы даже ничего не заметили?

А вы заметили какие-нибудь улучшения в ответах?

За-га-д-ка!

ИИволюция - AI и нейросети на доступном
🤷‍♂5🗿4👍3🔥2
Люди начали шептаться, что все эти фразочки со стороны Сэма и OpenAI “AGI achieved internally” просто попытка регулярно подогревать к себе интерес и ничего более. Но до текущего дня, она отлично работала и поднимала хайп. Будет ли дальше?

Как в притче про мальчика и волков, когда мальчик кричал «Волки», но волков не было. А когда они реально появились, ему никто не поверил 😈

Достигнем ли мы AGI в обозримом будущем (3-5 лет) или всё это попытка прогревать «хомячков» и инвесторов заносить больше кэша? 🤔

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
👻12
This media is not supported in your browser
VIEW IN TELEGRAM
Просто вау!

Когда руки из нужного места, AI инструменты позволяют творить такие штуки.

Пайплайн: Midjourney, upscale в Magnific, Gen-3 (генератор эмоций), lipsync в LivePortrait, video face upscale в Remini, голос ElevenLabs.

ИИволюция
🔥23👍5🗿5🤨3🤩1
This media is not supported in your browser
VIEW IN TELEGRAM
Ребята, каждый раз удивляюсь какие вы у меня классные подписчики!😍

Сегодня мне прислали вот такое видео (сгенерированное), автор Артем. Он режиссер, при этом не боится новых подходов и уже начинает активно внедрять AI инструменты в свою работу.

Ролик лишь проба пера, чтобы понять как и что работает. Пайплайн был такой:

Генерация картинок в MJ, дальше Gen-3/Kling (оба), дальше апскейл каждой генерации видео в Topaz, местами там же перевод в слоумо, параллельно Suno, Elevenlabs, ну и финал - Premiere pro для сборки и цвета. Единственное, что не генерация - несколько звуковых эффектов, это взято в Энвато.

Оно далеко не идеально, есть чуток артефактов, еще мне не нравится качество звука голоса (хотя уже и обработан), ну и качество звука музыкального трэка. И главное - мальчик разный, полного сходства добиться не удалось.


Артем, спасибо! Ролик классный, концовка еще лучше! 😁

ИИволюция
🔥26👍20❤‍🔥1👀1
Поставщик клубничного хайпа сдулся 🍓

Не так давно в Твиттере захайповал один аккаунт, который начал плодить слухи о грядущем релизе новой модели “Straberry” от OpenAI. А получил он широкую поддержку благодаря тому, что на него подписался оф. аккаунт ChatGPT и был реплай от Сэма Альтмана под одним из его твитов.

Тут понеслось, слух за слухом, слив за сливом. И вот, прошедшей ночью (по моему часовому поясу), должен был состояться якобы долгожданный релиз или анонс чего-то большого от OpenAI.

Нооооо! Ни-че-го (Олег Тинькофф сказал бы другими словами) не случилось. А чтобы этот хайп закончился, оф. аккаунт ChatGPT отписался от этого поставщика клубнички (удивляюсь, находятся же те, кто следит за такими действиями в Твиттере и сообщает всем), тем самым показав, что никакой правды за ним нет. Но никто не знает, кто стоит за этим аккаунтом и поговаривают, что это один из аккаунтов Сэма (в наше время вообще не удивительно).

А анонс от OpenAI вчера случился, но совсем о другом. Я вчера публиковал информацию, что в ChatGPT еще с прошлой недели обновлена модель gpt4o (но никто об этом не знал и нигде это не анонсировалось). И только вчера оф. аккаунт ChatGPT об этом сказал и позже подкрепил ссылкой с деталями.

Подробности об обновлении gpt4o

ИИволюция - AI и нейросети на понятном
👍5🤣32🔥1
И сразу следующая волна хейта прилетела в Div Garg (CEO сервиса MultiOn), выпускают AI агентов. Сервис кстати интересный, но речь о другом

Он начал заявлять, что наш знакомый уже поставщик клубничного хайпа является ни чем иным как AI агентом на базе их Agent Q. Хотел хайпануть, но с него попросили пруфы, на что он слился и давай всех банить, а свой пост удалил. Фу, бяка! Div хотел хайпануть на хайпе, который и так вёл к провалу. Зачем-то попытался связать клубничного со своей компанией, а теперь сливается.

Но в Твиттере есть спец, который постоянно добывает системные промпты любых моделей. И он не обошел стороной эту несправедливую историю и Div’a с его компанией MultiOn, добыл их системный промпт и начался шантаж Div’a, что если он не предоставит пруфы, что клубничный это их AI агент, то он сольет их системный промпт в сеть.

Как думаете, были пруфы? И снова фраза от Тинькова: НИ-ЧЕ-ГО!

Системный промпт слит в сеть, а я на всякий прибрал его к себе в коллекцию и делюсь с вами (промпт длинный, кину текстовым файлом в комменты)

ИИволюция
👍5🔥51👏1
Как AI помогает решать задачи быстрее и креативнее

У мобильного приложения в App Store есть средний рейтинг, который складывается из количества оценок 5 звезд, 4 звезды и т.д. до единицы.

Текущая средняя оценка у приложения 4.5 , а мне нужно понять сколько еще оценок 5 звезд нужно добавить, чтобы поднять среднюю оценку до 4.6 (при прочив равных и если другие оценки не будут расти).

Иду в Claude и прошу написать калькулятор расчета, ввожу простейший промпт из головы без всяких там замудренностей и получаю рабочее решение за 1 минуту. Вот запаблишил сам калькулятор (без регистрации и смс): калькулятор.

Промпт:
У мобильного приложения в аппсторе есть рейтинг, который складывается из количества оценок 5 звезд, 4 звезды, 3, 2 и 1. Мне нужен калькулятор, куда я введу количество оценок 5 звезд, кол-во оценок 4 звезд, 3/2/1 звезд и калькулятор скажет, сколько еще оценок 5 звезд нужно получить, чтобы поднять средний рейтинг на 1 десятую. Напиши калькулятор на HTML 5 + JS, нужен красивый, стильный интерфейс, будь креативен

Вот как AI в реальности оптимизирует работу. Вручную я бы считал дольше и мне было бы сильно ленивее этим заниматься.

ИИволюция - про AI и нейросети на доступном
105👍20🔥81
Forwarded from AI Happens (Alexey Hahunov)
Регулярно сталкиваюсь с комментариями в фб о том, что AI — это пузырь, и в отрасли наступила "зима". Решил покопаться в числах и сравнить "классические" бизнесы с компанией OpenAI на фоне текущего рынка. Взял компании, близкие к AI, и добавил супер параметр — Value/Revenue, который показывает, как заработок компании соотносится с её оценкой.

Справочно:
- B — миллиарды
- Revenue — все получаемые деньги
- Market Cap — по какой оценке можно купить долю в компании

Хронология:
- В конце 2022 года оценка компании OpenAI составляла 10B$ (на самом деле меньше, но опустим этот факт).
- Май 2023 года: Revenue — 1.6B$.
- Май 2024 года: Revenue — 3.4B$.
- Market Cap 2024 года — 80B$.
- Value/Revenue ≈ 25 (скорее ближе к 20).

Сравним с рядом стоящими гигантами:

- Meta:
Market Cap — 1.33T
Value/Revenue — 8.76
- Nvidia:
Market Cap — 2.90T
Value/Revenue — 36.16
- Amazon:
Market Cap — 1.79T
Value/Revenue — 3.03

Пу-пу-пууууум. Ну коэффициент высоковат, но учитывая, что это частный бизнес, являющийся топ-1 в индустрии, он не выглядит драматично. Поискал данные по perplexity и Midjourney, там все непонятно. В Midjourney была инфа, что выручка около 200М$, оценки не было, а работает всего 11 человек. А у perplexity 35M$ выручки и 1B$ оценка.

К этому надо добавить, что в текущий момент вся история в LLM/GPT - проходит стадию лишь early adopters, то есть в среднем только 2-3% населения так или иначе используют эти технологии. Посмотрим как на это повлияет Apple, так как Google явно не справляется :)

@aihappens
👍76🔥5
Apple планирует брать по $20 в месяц за свои Apple Intelligence фичи

Напомню, что Apple представила обновленную Siri, генерацию изображений, генерацию ответов на емейл и прочее. И кажется часть возможностей всё же будет бесплатна (вероятно, для которых требуется только локальная обработка на девайсе), а те фичи, что используют ресурсы ChatGPT (помним о партнерстве Apple и OpenAI) и собственную LLM Apple вне устройства, будут доступны по подписочке.

Кстати, откуда вообще пошла эта мода брать по $20 в месяц за AI сервис? Почему именно $20? Теперь же это выглядит стандартом. У меня уже 2 таких подписки, и готов ли я буду покупать её еще и у Apple? А вы?

У Apple есть единая подписка Apple One за $19.95 и в неё входит доступ к разным сервисам. Один из вариантов, что эта подписка будет расширена и на AI фичи.

Учитывая, что AI сейчас в основном используют early adopters, то релиз AI фич для обывателей на айфонах, вероятно, может изменить ситуцию (или нет). А Apple снова озолотится (скорее да, чем нет).

ИИволюция
👍51
This media is not supported in your browser
VIEW IN TELEGRAM
Хаха, парни решили сделать имитацию AI видео. Получилось очень даже кайфово!

Намечается новый тренд в тиктоках? 🤣

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣43🔥5🗿1
Это не реальное фото с камеры, а AI генерация.

Фото сгенерировано в Grok с промптом: CCTV footage of a robber with a gun at a cashier counter.

Кажется, это нам еще аукнется 🤔

ИИволюция
😢18🤣4👍3🔥32🗿2
Вот и новость, которая снова заставляет задуматься о том, как легко можно оказаться под прицелом бездушной корпорации. OpenAI только что закрыла несколько иранских аккаунтов ChatGPT, с которых якобы генерировался контент про выборы в США. Опять двадцать пять. Вроде тюнят свои модели, чтобы не генерился неугодный контент, но всё не дотюнят. Ну как тут не вспомнить старую поговорку: не всё разрешено в ChatGPT, даже если это не указано в правилах использования. Правила могут измениться в любой момент, и ваш аккаунт вполне может попасть под раздачу при следующей проверке.

Если вы думаете, что ваши шутки и комментарии в ChatGPT – это просто веселье, возможно, стоит задуматься дважды. Попросили сгенерировать шутку про Байдена или запросили фотку у DALLE, где Байден обнимается с Трампом (примеры, конечно, надуманные) – и всё! Завтра может прилететь бан, и вы потеряете свою переписку с чатиком, нажитую непосильным трудом.

Зависимость от корпораций только растёт. Если вы блогер, то легко можете попасть под прицел, порой даже случайно, и потерять свой аккаунт в Instagram или TikTok. Если вы IT предприниматель, то, к примеру, в App Store/Google Play та же песня – аккаунты банятся на ура, и никто вам толком не поможет.

А теперь и с ChatGPT нужно вести себя сдержанней?

Будущее явно за персональными локальными моделями, и кажется, пора начинать в этом разбираться👨‍💻

ИИволюция — про AI и нейросети на доступном
Please open Telegram to view this post
VIEW IN TELEGRAM
3👍19🔥3😢2
Вы уже пробовали новый Grok2?

Grok сейчас в трендах со своей генерацией картинок (поговаривают, что там Flux под капотом). Очень хорошо работает с текстом (поговаривают, что лучше всех остальных, потому что Flux под капотом).

Забавный промпт, сделать изображение в стиле Симпсонов с фразой:

In the style of the Simpsons, ( Subject ) , with a text bubble "abc"


ИИволюция – про AI и нейросети на доступном
3🔥18👍41👏1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Крипово, но драйвово. Прям смотрел и пританцовывал 😁 И кайфово, что зациклено.

Результат получен из:

- 6 фото из Midjourney.
- 7 видео генераций в Kling.
- 1 генерация музыки в Suno.

Ничем не хуже Голливуда и Болливуда 😅

ИИволюция – про AI и нейросети на доступном
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥14🤣6🗿1
Сегодня прочитал интересную мысль…

А что если ваша Тесла, пока она простаивает (вечером, ночью, в рабочее время), будет таксовать как автопилот такси?

Вы потратили ХХХ денег на её покупку, кредит, всё такое. И что если часть затрат автомобиль сможет сам отбить?

Вы указываете в приложении в какое время она простаивает и когда наступает момент, ваше авто подключается к базе такси и начинает сама брать заказы и развозить клиентов. И заранее возвщарается к дому/работе, а может по пути заедет еще и на мойку и чистку, чтобы вы сели в чистое авто.

Звучит как какая-то фантастика, но не вижу проблем, чтобы это не стало реальным через 3-5 лет.

Вы бы “разрешили” своему авто таксовать? 👀

ИИволюция - про AI и нейросети на доступном
🔥25🤣10👍9👏4🗿2
This media is not supported in your browser
VIEW IN TELEGRAM
Красивое с помощью Dream Machine v1.5 от Luma

Кайфовые вещи всё таки можно делать с помощью AI. Хотел бы себе такой же таймлайн, который каждый год бы обновлялся (и вгонял бы в депрессию, что время уходит)

Правда, модель почему-то быстро состарила девушку. Не порядок! К 36 седина, к 50 уже бабуля. Какой-то кривой датасет был при обучении модели, но сама идея таймлайна зачёт! 😅

ИИволюция
9🔥7👍3🤣1
Топ AI приложений, которые сейчас на волне

В мире AI-приложений всё бурлит и меняется на лету. Одни проекты взлетают на вершину, другие быстро исчезают. Что сейчас реально в тренде? В отчете от a16z собраны самые актуальные AI-приложения:

Саммари из отчета:

1. Креатив: 52% приложений в топ-100 заняты созданием и редактированием контента. Новички, такие как Luma, которая заняла 14-е место, и Viggle на 21-м, уже в деле, активно завоёвывают аудиторию.

2. Видео и музыка выходят на сцену: Раньше 41% контента составляли изображения, но теперь на первый план выходят видео и музыка. Luma и Viggle в топе, а музыкальный генератор Suno взлетел с 36-го на 5-е место.

3. Битва ассистентов: ChatGPT всё ещё держит первое место, но Perplexity на третьем и Claude на четвёртом не отстают. Perplexity, кстати, даже обгоняет ChatGPT по продолжительности визитов — более 7 минут на сессию.

4. Bytedance наступает: ТикТок — это только начало. Bytedance запустила шесть новых приложений, которые уже в топ-100, включая Hypic (19-е место) и Cici (34-е место). А Doubao вошел в мобильный топ-26.

5. Красота и свидания 2.0: LooksMax AI и Umax не только помогают вам выглядеть лучше, но и анализируют ваш голос и даже показывают, как бы вы выглядели на все 10 из 10. LooksMax уже имеет 2 миллиона пользователей.

6. Discord как инкубатор: Midjourney остаётся на первом месте по трафику приглашений в Discord (как это изменится, когда Midjourney делает ставку на веб морду?), показывая, что сообщество — это всё. Половина топовых Discord-серверов теперь связаны с генерацией контента, что говорит о важности этой платформы для роста AI-продуктов.

Много деталей в отчете, поэтому очень советую на него взглянуть, если вам интересен мировой рынок AI.

ИИволюция
11👍344🔥4👏1