ИИволюция 👾
10.3K subscribers
738 photos
326 videos
1 file
695 links
Авторский канал Сергея Пахандрина про AI, нейросети, вайб-разработку, ChatGPT (и другие LLM). Рассказываю о своём опыте и экспериментах с AI.

По всем вопросам: @pakhandrin
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic готовит к релизу Harmony: AI агента для работы с локальными файлами

В Claude.ai можно будет предоставить доступ к локальной директории и Claude сможет работать с этим контекстом.

Что может делать Harmony:

– Сканировать локальную директорию и добавлять ссылки на определённые файлы в ответе
– Редактировать файлы и показывать различия для подтверждения пользователем
– Искать использование определённого ключевого слова
– Работать как минималистичная IDE (привет Cursor?)

А еще спецы обнаружили упоминание фичей “memory”, “web_seach” и “tasks” в коде веб-приложения Claude.ai

Кажется, скоро подвезут годноту!

ИИволюция
🔥3110👍3
Вайб-разработчики захватывают мир!

Всё ещё считаете вайберов дилетантами? Появляется всё больше и больше стартапов, где почти весь код сгенерирован.

25% стартапов нового набора YCombinator на 95% написаны целиком с помощью AI. Или это вам тоже не показатель?

“It’s not like we funded a bunch of non-technical founders. Every one of these people is highly technical, completely capable of building their own products from scratch. A year ago, they would have built their product from scratch — but now 95% of it is built by an AI”


Да, вы всё еще должны быть хорошо технически подкованы, но писать код руками становится зашкварным делом для стартапов, ведь нужно быстро выкатываться на рынок, и AI отлично в этом помогает. Да, вы должны понимать какое качество кода генерирует вам AI, но не стоит упарываться и писать код руками в наше время.

“Let’s say a startup with 95% AI-generated code goes out [in the market], and a year or two out, they have 100 million users on that product. Does it fall over or not?”


Если вы еще пишите код руками, вы уже в отстающих.

Всем плюс-вайб!

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥223👏2🗿2
Anthropic снова радует утечками

В Cursor засветились новые модели “Claude 3.7 Sonnet MAX” и "Claude 3.7 Sonnet Thinking MAX"

Для Max заявлено: “модели MAX обладают более высоким уровнем интеллекта по сравнению со стандартными моделями.”

Вероятно модели и не новые, а расширение 3.7. Что-то вроде low-medium-high для моделей ChatGPT, когда необходимо регуляровать количество вычислительных мощностей и стоимость запросов.

Плюс-вайб всем вайберам!

ИИволюция
👍17🔥53
Дополнение по Claude 3.7 Max в Cursor.

Это новый режим в Cursor, Anthropic тут не при делах! 🍔

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9🤣2🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
Воу, игровое видео сгенерированное в google veo 2

Не перестаю удивляться каждый день новому уровню!

ИИволюция
🔥333
Google выкатывает фичу Canvas для Gemini

Такое уже есть в ChatGPT и называется так же Canvas, а в Claude это называется Artifacts. Эта фича позволяет удобнее работать с документами, вносить правки в разных местах, генеририровать код и даже запускать его в Preview режиме.

В общем друг за другом все по очереди повторяют.

Требуем инноваций каждый день, а не копипасты!

ИИволюция
🔥20
This media is not supported in your browser
VIEW IN TELEGRAM
Робот сам учится ходить за покупками

Робот не делал этого ранее, его не обучали этому заранее. Робот сам учится выполнять действий используя Reinforcement Learning (обучение с подкреплением). Именно учится!

RL — это один из методов машинного обучения, где система (в данном случае робот) "учится" через взаимодействие со средой, получая "вознаграждение" или "наказание" за свои действия. Это похоже на обучение через проб и ошибки, как у человека или животного.

Робот использует RL для координации движения всего своего тела (ног, рук, туловища) и выполнения манипуляций с объектами (например, удержание корзины или складывания продуктов в корзину применяя разную силу для удержания в “руке”).

RL позволяет роботу адаптироваться к новым объектам и ситуациям, даже если он их раньше не видел.

А теперь представьте, что один робот в “полевых” условиях обучается одному навыку, а тысячи роботов используя RL учатся осваивать другие навыки и освоив, передают все эти знания всей “армии” роботов.

Кажется, следующими на замещение будут курьеры, зп которых уже приближается к мидлам в IT 😬

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥152
О, в Grok подвезли режимы для DeepSearch и выбор персон

Теперь для исследования можно задействовать больше мощностей и ризонинга (и видимо дольше по времени). Grok классный тем, что он быстрый, имеет доступ к свежим актуальным данным и он как хиппи в мире нейросетей. Что не дозволено другим, дозволено Grok.

А еще появился выбор персон, потестил романтику 18+ и Grok там без прекрас зажигает (на скриншоте еще цветочки) 💀

Доступно в веб приложении на grok.com

ИИволюция
🔥21🤣5👍3
Я так понимаю, Илон Маск, вводя в Grok виртуальных персонажей, решил «подвинуть» такие проекты, как Character AI, чья оценка уже пробила потолок в $1 млрд.

Особенно с учётом того, что Grok, в отличие от многих конкурентов, без тормозов и легко общается на темы 18+.

А мы уже привыкли к тому, что любой крупный релиз от OpenAI, Маска или другой большой корпорации — это сразу десятки или сотни стартапов, которые исчезают за одну ночь. Просто потому, что их ключевая фича перестала быть уникальной.

И учитывая фирменный подход Маска: «запускаем без лимитов, пока сервера не лягут» — рынок AI-чатов накаляется до предела 😎

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
👍242
This media is not supported in your browser
VIEW IN TELEGRAM
Dreams come true!

С помощью AI сгенерировали эффект полёта во сне. Смотришь видео и прям ощущаешь как паришь. Блин, ну реально же во снах такой эффект.

Есть у вас такое ощущение при просмотре? В VR хочу такое посмотреть 😍

ИИволюция
🔥42👍73
Forwarded from Сиолошная
o1-pro появилась в API OpenAI, но на бенчмарках мы, видимо, её почти не будем видеть — цена просто конская, ещё дороже, чем GPT-4.5: $150 за миллион токенов на вход и ШЕСТЬСОТ ДОЛЛАРОВ ЗА МИЛЛИОН НА ВЫХОД

(но система — не модель — реально стоящая, за неё Pro подписку и плачу)

Страница модели

Пошёл брать кредит чтобы прогнать на «Быках и коровах» 😀

UPD: Доступна всем пяти тирам разработчиков, то есть любому аккаунту, который хоть раз пополнили хотя бы на доллар.

UPD 2: цены для сравнения:
— GPT-4.5: $75/$150
— GPT-4o: $2.5/$10
— DeepSeek R1: $0.55/$2.19
Please open Telegram to view this post
VIEW IN TELEGRAM
6😢5👍3🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
Раньше жена говорила: "Купи мне Dyson".

Скоро робот: "Купи мне Dyson, иначе я не смогу убирать каждый день ваш срач в квартире" напевая песню Фредди Меркьюри "I want to break free".

ИИволюция
🤣17
This media is not supported in your browser
VIEW IN TELEGRAM
Обычный дэйлик в команде вайб-разработки ⌨️

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🤣27🔥7
OpenAI представила новое поколение аудио-моделей: точнее Whisper 3 и с эмоциями!

Теперь любой разработчик может использовать мощнейшие голосовые модели прямо в API:

Speech-to-Text (доступна в API):

- Новые модели GPT-4o-transcribe и GPT-4o-mini-transcribe значительно превзошли по точности Whisper v3 и другие популярные решения.
- Они показывают лучший результат (более низкий WER) даже при сложных условиях: шумном фоне, акцентах или быстрой речи.
- Идеально подходят для колл-центров, расшифровок встреч и подкастов.

Text-to-Speech (доступна в API):

- Новая модель GPT-4o-mini-tts умеет не просто озвучивать текст, но и выражать эмоции и интонации по вашей инструкции.
- Например, можно попросить модель говорить «как сочувствующий оператор поддержки», профессиональный диктор или даже рассказчик историй.
- Голосовой AI становится максимально естественным и персонализированным.
- Whisper 3 был хорош, но OpenAI подняла планку ещё выше: новые модели дают точность и гибкость, которых раньше не было.

Официальная новость: https://openai.com/index/introducing-our-next-generation-audio-models/

Послушать разные варианты озвучки можно на этой площадке: www.openai.fm

Пора пробовать в проектах!

ИИволюция
🔥11👍43
Еще никогда ранее не было так просто интегрировать такого уровня синтезированную речь в своих проектах.

Вот код на Python с демо текстом и демо инструкцией:

import asyncio

from openai import AsyncOpenAI
from openai.helpers import LocalAudioPlayer

openai = AsyncOpenAI()

input = """Woohoo! Let's get those meetings scheduled, superstar!\n\nAlright, first up—Monday at 10 AM, you've got a check-in with the team. Go, teamwork! Next, we're locking in Wednesday at 2 PM for that client presentation—you got this!\n\nOh, and don't forget Friday at 4 PM, a strategy session to wrap up the week. Finish strong!\n\nNeed to move anything around? No worries—I'm here to keep your schedule totally winning! Just say the word, and I'll make it happen! Let's do this!"""

instructions = """Personality/affect: a high-energy cheerleader helping with administrative tasks \n\nVoice: Enthusiastic, and bubbly, with an uplifting and motivational quality.\n\nTone: Encouraging and playful, making even simple tasks feel exciting and fun.\n\nDialect: Casual and upbeat, using informal phrasing and pep talk-style expressions.\n\nPronunciation: Crisp and lively, with exaggerated emphasis on positive words to keep the energy high.\n\nFeatures: Uses motivational phrases, cheerful exclamations, and an energetic rhythm to create a sense of excitement and engagement."""

async def main() -> None:

async with openai.audio.speech.with_streaming_response.create(
model="gpt-4o-mini-tts",
voice="coral",
input=input,
instructions=instructions,
response_format="pcm",
) as response:
await LocalAudioPlayer().play(response)

if __name__ == "__main__":
asyncio.run(main())


Здесь больше места занимает сам текст озвучки и инструкция, чем сам код!

В потрясающее время мы живём! Создавайте, творите, будьте на вайбе!🍸

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥16👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Anthropic выкатил web поиск в Claude.

На-ко-не-ц-то!

Но есть но, доступен пока только в США и по подписочке. В остальном, медленно, но верно нагоняет остальных игроков на рынке.

После выхода новости, на всех площадках самый главный вопрос вайберов: “А будет ли web search работать в Cursor и когда?” 😆

UPD: говорят, что в Cursor уже завезли!

ИИволюция
🔥15
Разработчики до появления ИИ: тратили 10 часов, чтобы автоматизировать задачу, которую вручную можно сделать за 1 час.

После появления ИИ: 10 минут «вайб-кодинга», чтобы автоматизировать задачу на 1 минуту.

Когда уже вайб-разработка с AI достигнет уровня как на фото, но с одной кнопкой “Да”? 💀

ИИволюция
19🤣11🔥5
Частная школа в Техасе внедрила AI-тьюторов, и результаты учеников взлетели до топ-2% по стране!

– В школе Alpha в Остине дети проводят два часа в день с AI, который помогает им учиться в индивидуальном темпе.
– Остальное время они посвящают развитию навыков вроде ораторского искусства, финансовой грамотности и командной работы.
– Сооснователь школы Маккензи Прайс говорит, что благодаря персонализированному подходу ученики учатся быстрее и лучше.
– Сейчас в Alpha обучаются сотни детей, и модель расширяется по США.

AI не заменяет учителей, а освобождает их для более глубокой работы с детьми — вот в чем магия!

Хочется в ближайшие 2 года увидеть больше таких кейсов.

Почитать новости: тут и тут.

ИИволюция
🔥40👍161
Сэм Альтман заявил, что учиться кодить уже не модно — теперь надо осваивать AI-инструменты (все вайберы сейчас орнули от радости?).

“The obvious tactical thing is just get really good at using AI tools.”
«Очевидный тактический шаг сегодня — просто стать очень хорошим в использовании ИИ-инструментов.»


Сэм говорит (хотя скорее предполагает), что AI уже пишет 50% кода в крупных компаниях:
“I think in many companies, it's probably past 50% now.”
«Думаю, во многих компаниях уже больше 50%.»


И дальше — классика:
“Each software engineer will just do much, much more for a while. And then at some point, yeah, maybe we do need less software engineers.”
«Каждый разработчик будет делать больше... А потом, возможно, да — разработчиков потребуется меньше.»


Новый навык — не писать код руками, а правильно использовать AI, который делает это за тебя.

Так что, запасайтесь AI-скиллами или готовьте плед и чай — AI уже топит газ в пол.

ИИволюция
18🤣3
This media is not supported in your browser
VIEW IN TELEGRAM
Андрей Карпатый (главный инфлюенсер в вайб-разработке, кажется он и изобрел этот термин) написал за час Swift приложение для iOS не зная самого Swift.

Он написал простой калькулятор калорий: задаёшь BMR, добавляешь/вычитаешь калории, видишь прогресс, лог последних действий — и всё это без единой строки кода, написанной вручную.

Весь код — 400 строк. Всё работает. Он собирается заливать в App Store, но говорит это уже лениво, ведь для этого нужно снова потратить около часа на общение с ChatGPT.

Но суть не в самом приложении, а то что вы не зная нужного языка разработки, но будучи технически подкованным, легко создадите что-то рабочее на любом языке и под любую платформу. Самое интересное, что он поделился всеми диалогами с чатиком, чтобы вы могли посмотреть, как спецы вайб-кодят и составляют свои запросы:

1: https://chatgpt.com/share/67e02d8a-994c-8007-bf44-a63127cbbbb2
2: https://chatgpt.com/share/67e02d99-5e68-8007-b30c-80c9ed7f3693
3: https://chatgpt.com/share/67e02da3-8e7c-8007-ae63-530d5ca18065
4: https://chatgpt.com/share/67e02db4-9908-8007-b440-a6d2789c9f73
5: https://chatgpt.com/share/67e0a3de-8808-8007-a522-3b2358df619e
6: https://chatgpt.com/share/67e0af84-966c-8007-96c4-b8811e345df4

Тред в Твиттере: тут

Порядок возможно нарушен, но можно посмотреть как вайб-кодит главный вайб-кодер в мире 👨‍💻

ИИволюция
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥25👏72👍1