Tool Building Ape × Gleb Kalinin
380 subscribers
135 photos
8 videos
2 files
109 links
@glebkalinin пишет о технологиях, ИИ и жизни в будущем. @Experimentally @mentalhealthtech
Download Telegram
Очень сложно жить, не имея хотя бы среднесрочного плана

Год-другой так пожить можно, и даже, наверное, пять.

Но жить дольше в режиме постоянного тушения пожаров, хаоса и непредсказуемости утомительно. Нервная система для такого не создана. Уму хочется создать хоть какое-то подобие плана.

Но как планировать? Ведь мы получаем громкие сигналы о том, что социально-экономические изменения, вызванные целым каскадом причин, и технологии тут играют всё больше роли, неизбежны?

Не знаю, как вам, а мне точно нужна хоть какая-то картинка будущего. Ведь совершенно разные решения будет иррационально принять, если мы исходим из того, что до апокалипсиса или, наоборот, рая сингулярного остались считанные месяцы. И наоборот, если считаем, что прогресс будет постепенным, будет много времени для перестройки, и возможностей, которые эта перестройка несет, будет больше, чем рисков.

Мы рациональные люди и понимаем, что попытка по waterfall спланировать даже на полгодна — безумие, обереченное на провал даже в более стабильные времена. Значит, первое, что нам нужно прокачивать, — это способность быть в порядке при непредсказуемостью. Дружить с изменчивостью. Как говорил Майк Тайсон: «У каждого есть план, пока ему не врежут по лицу».

Мне очень сложно смотреть на жизнь через пессимистическую линзу. Такая оптика затемняет и не даёт увидеть всю сложность мира, и через неё тяжелее уведеть мотивацию действовать.

Поэтому я выбираю умеренно-оптимистическую позицию.

Это именно выбор — я сознательно его сделал, как прагматически более полезный (меньше вероятности свалиться в депрессию, лучше здоровье), и намеренно практиковал, приучая ум не бегать по проторенным дорожкам пессимизма, а строить новые нейронные тропы более оптимистичных сценариев. Это навык, который пришлось тренировать, зато теперь он автоматический, ну и к счастью жизни не один раз сбывались и оптимистичные прогнозы.

Я выбираю верить, что технологии хотя бы в отдельных частях мира принесут очень много пользы, продлят жизнь, освободят нам время, помогут с governance, а общество сможет под это гибко перестроиться.

Я понимаю, что это займет время, и считаю, что разгоняться будет достаточно медленно, чтобы мы успели подготовиться и перепридумать важные для устойчивости системы. Я верю, что на земле достаточно всего для всех, что мы можем обратить часть урона, нанесенного экологии и найти способы жить в гармонии с этой планетой.

Это моя базовое убеждение, похожее на религиозное.

Про будущее я думаю, что оно будет так же и более сложно и неоднообразно, как настоящее. В разных областях жизни мы увидим и удивительный прогресс, и совершенно непредсказуемые и глобальные проблемы.

Думаю, это важно знать, например, если ты новое партнерство начинаешь. Я не хочу партнёрства с тем, кто ждёт зомби-апокалипсис, разные картины ведут к разным ценностям и реальным выборам, реальному поведению.
19🤩1
Про время — очень нравится идея «длинного сейчас»

Постепенно прицеливаюсь к масштабу nowadays, мыслить в масштабе Long Now пока очень сложно

Посмотрите The Long Now Foundation, я был большим фанатом их лекций

https://longnow.org/
5
технология в масштабе длинного сейчас

Если смотреть на то, что происходит в технологиях хотя бы со второго масштаба в 30 лет, то даже без глубокого анализа становится понятно, что сейчас мы на самой-самой ранней стадии этого технологического витка.

Мы на стадии 64-битных компьютеров, попукивающих при подключении диалапа US Robotics Sportster, пятидюймовых дискет и BBS (эстетика которых уже вернулась). Нужно ещё несколько волн хайпа и залива денег, чтобы по-настоящему полезные приложения появились и стали привычными, чтобы эффект если не замены чего-то там ИИ, а банальной автоматизации, которую с помощью ИИ можно сделать, стал заметным.

То, как будет выглядеть наше технологическое будущее, ещё только придумывают — и вы тоже можете придумывать.

Моя простая максималисткая гипотеза: Если сервис или приложение использует экраны как единственный интерфейс — это software 2.0.

Для меня настоящее Software 3.0 — это такое, которое возникает и встраивается в мою жизнь с адекватным понимаем контекста, и которое доступно в любых удобных мне формах (голос, видео, жесты, вибрация и тактильность, биомаркеры и тд).
12👍1👏1
Великолепный обзор того, что произошло в мире LLM за первые полгода 2025.

Во-первых, Саймон прекрасный нерд, который умеет рассказывать.

Во-вторых, тестировать LLM рисованием пеликана на велосипеде замечательно.

В-третьих, скорость прогресса удивительная: фактически все важные модели вышли с начала года.

Выводы:
- пора снова посмотреть на локальные открытые модели (mistral small 3 24b), общий тренд — все более маленькие модели

- amazon nova micro — самая дешевая llm (сайт-сравнение цен — https://www.llm-prices.com/ )

- gpt4.1 отличная модель для работы с большим контекстом (1m), gpt-4.1nano самая дешевая их модель ever


- основной прогресс сейчас — ризонинг плюс использование инструментов. o3 крута, потому что это лучшее сочетание tool using (поиска) и ризонинга

- gemini рисует лучших пеликанов на велосипеде

Жаль в выступление kimi k2 не попала

https://youtu.be/YpY83-kA7Bo?si=OgQeucn6-gLkCbjl

Текстовое описание
👍3🕊1👀1
В ChatGPT на Plus-тарифе (за 20 баксов) появилась запись длинных встреч с удобной расшифровкой. После обработки записи сразу же создаёт canvas с саммари (подробность можно регулировать, как и у любых текстов в canvas), с привязкой ко времени. Естественно, можно сразу же задавать вопросы к тексту в чате

Расшифровка и диаризаций на уровне, причин запускать Fathom или Гранолу или Limitless никаких
👍65
…Сегодня нас окружают толпы рьяных Тевтов, одноглазых пророков, видящих лишь то, что новые технологии способны сотворить, и не умеющих вообразить, что они способны разрушить. Таких людей можно назвать технофилами. Они взирают на технологию так же, как влюблённый на предмет своей страсти — не замечая изъянов и не испытывая ни малейшей тревоги за будущее.

Нил Постман. Технополия


...we are currently surrounded by throngs of zealous Theuths, one-eyed prophets who see only what new technologies can do and are incapable of imagining what they will undo. We might call such people Technophiles. They gaze on technology as a lover does on his beloved, seeing it as without blemish and entertaining no apprehension for the future.

Neil Postman. Technopoly
2
Пост-знакомство

Поскольку этот канал потихоньку растёт и уже чуть больше моей технической записной книжки, пора представиться.

Глеб Калинин

У меня 2 основных бэкграунда:
→ IT (20 лет в ролях от фронта до CPO)
→ Работа с людьми (коучинг по стандартам ICF, психология, майндфулнесс и еще огромное количество практик).

Оба из них оказываются сейчас нужны и важны, потому что ИИ — штука очень сложная и для многих эмоциональная. Мне с этой эмоциональность окей.

Последние пару лет я обучал людей на лабораториях AI Mindset (ушёл из проекта), а пока я готовлю новые программы, у меня есть время для личной работы.

Как я могу помочь:

→ Выработать личную стратегию и освоить критичные навыки работы с ИИ. Как коуч и ментор, я помогу вам выработать цели, составить программу, помогу подобрать инструменты и оптимальные паттерны их использования.

→ Сформулировать и упаковать идею вашего проекта или продукта, провести исследование и даже сделать прототип. Я активно слежу, тестирую и пишу про современные технологии, умею проводить исследования и могу помочь подобрать оптимальный стек, а также найти команду, которая поможет реализовать продукт.

С кем я обычно работаю:
→ Предприниматели, руководители и специалисты (продакты, разработчики, аналитики), но несколько раз я работал — и мне понравилось — с подростками про их AI-based продукты

Я не теоретик: активно пользуюсь современными моделям и агентами, разрабатываю свои AI-based приложения, пишу про всё это в своём канале.
Ссылки о себя положу в комментариях.

Если вам актуально — предлагаю бесплатный получасовой звонок.

Написать мне

Базируюсь в Берлине и с радостью работаю с компаниями по всему миру.

Мои другие каналы:
Mental health tech
Опытным путём
16👍3🥰3
https://www.youtube.com/watch?v=yIlnyoIxNPI

UltraZoom — система, создающая гигапиксельные изображения из обычных снимков, сделанных на смартфон. На вход — общий кадр и один-два крупноплановых фото, автоматически совмещает крупные планы с общим изображением, оценивает масштаб и строит пары «низкое → высокое» разрешение. Далее предобученная генеративная модель дообучается на этих парах. Результат — плавный пан-и-зум по всему объекту с фотореалистичной детализацией при минимальном исходном материале.

https://ultra-zoom.github.io/
Следить за вакансиями OpenAI и ко всегда интересно — на деле отражает убеждения компании относительно будущего профессий.

К примеру, ищут фронтенд-инженера:

https://openai.com/careers/front-end-software-engineer-marketing/

$255K – $405K + Offers Equity


А вот вакансии Антропиков — https://www.anthropic.com/jobs — тоже любопытно посмотреть в контексте громких заявлений Амадея.

Ни одной вакансии для агентов, все — для людей
👍2
Я не большой фанат распространения промтов, но вот этот мне дал удивительно любопытные результаты в ChatGPT:

What advice have you been trying to give me that i havent been able to hear?

Можно добавить Respond in Russian. 4o и o3, русская и английская версии вернули немного разные результаты.

Один совет ChatGPT по ощущениям был очень похож на один из мощных моментов в моей работе с психотерапевтом. На больших объемах и с постепенно улучшающейся памятью LLM смогут давать нам уникальную перспективу на наши когнитивные и эмоциональные процессы.
13
Сейчас много пишут (я в том числе в канале Mental health tech) про риски взаимодействия с ChatGPT, но такие истории тоже важно подсвечивать.

Людей, для которых ии-инструменты могут стать искусным средством для движения к стоящей жизни наверняка больше, а не меньше, чем тех, кто столкнется со сложностями.
6
Птицы, рыбы, насекомые и другие животные объединяются в большме группы, чтобы эффективнее добывать пищу, обеспечивать себе защиту и решать сложные задачи.

Роевой интеллект (swarm intelligence) — таким термином описывают коллективное поведение, увеличивающее интеллект больших децентрализованных групп. Вспоминаем муравьев, обошедших в решении задачи группу людей (впрочем, один человек всё равно оказывается умнее).

Могут ли люди проявлять роевой интеллект? Безусловно, да — от скоординированного движения толпы, адаптирующейся под изменения среды, до масштабных децентрализованных проектов с открытым кодом.

Создатели платформы Thinkscape задались вопросом — возможно ли повысить коллективный интеллект человека?

Мы знаем, что эффективное обдумывание в формате беседы (conversational deliberation) — когда группе нужно что-то спланировать или принять решение — наиболее комфортно проходит в группе от 4 до 7 человек. В таком формате каждый получает возможность внести свой вклад в разговор.

Thinkscape предлагает разбивать большие группы людей (сейчас до 400 человек, но в перспективе — безлимитно) на группы по 4-7 человек, наподобие breakout rooms в Зуме. Каждая группа ведёт отдельное обсуждение на заданную тему. Разговоры всех групп в реальном времени мониторит и анализирует ИИ-агент, обнаруживая в разговоре консенсусы, несогласие и инсайты. Эти данные передаются всем агентам, которые делятся ими с участниками других групп.

Например, если группа обсуждает планирование большого пикник, агент может периодически указывать на нюансы, упомянутые в других группах, но упущенные в этой, например, что делать в случае плохой погоды.

Как рассказывают в интервью один из создателей, доктор Луис Розенберг, одним из самых сложных аспектов, помимо разработки, была калибровка того, когда и что именно говорит агент. Агент вмешивается слишком часто? Это воспринимается навязчиво. Люди, со слов Розенберга, воспринимают агентов как полноценных участников разговора, и доверие здесь — ключевой фактор.

В небольшом исследовании группы в 75 человек, участники отметили, что такой формат был эффективней, чем простые чаты, был более продуктивным, чем сессии мозгового штурма, способствовал появлению идей более высокого качества, более сильное чувство причастности к итоговым решениям, ощущение, что их голоса были лучше услышаны.

Пока Thinkscape работает в закрытом режиме, но можно записаться на участие в тестовых разговорах.
🔥5🤔2
Я (как, не сомневаюсь, и вы) регистрируюсь в десятках сервисов в месяц. Иногда вспоминаю про них, когда они присылают письмо о том, что закрываются. Так я вспомнил про nette.io — A Research OS for the Web, который закроется 15 августа.

Попробовал — очень классный интерфейс с миро-подобной доской и генеративными фичами, в духе are.na и подобных минималистичных сервисов.
В ChatGPT на Маке подвезли агента.

Пытаюсь свежим взглядом посмотреть на интерфейс. В этом не так просто ориентироваться, даже когда ты следишь за нарастанием функциональности с момента выхода приложения. Если начинаешь с нуля — good luck with that :)

3 (!) способа взаимодействия с моделью через аудио, каждый из которых работает по-своему
Второй день тестирую Ash — The first AI designed for therapy.


Несколько решений там сделаны, на мой взгляд, очень верно.

1) Голосовой диалог. С Ash можно подумать и помолчать (хоть и не всегда достаточно), когда говоришь. Агент отвечает с задержкой, и, увы, его нельзя перебивать, как Advanced voice mode. При этом ответы Ash иногда довольно длинные.

2) Карточки по результатам диалогов, которые оно показывает — прекрасные.

3) Переключение между голосом и текстом — в любой момент можно перейти из одного в другой


Что не понравилось

Как и ии-боты общего назначения, эта штука естественно не знает, что для вас полезно, а что травматично. Например, в одном из диалогов я для контекста обозначил довольно заряженную для меня тему. Приложение начало поднимать эту тему и пытаться находить связи и параллели во всех диалогах, даже на самые нейтральные и даже радостные темы. Когда я эксплицитно попросил этого не делать, вроде бы перестал.

Общее впечатление — это очень хорошо, когда ты знаешь чего ты хочешь получить (и есть опыт живой терапии).
4
Сижу в кофейне, а вокруг, как и 20 лет назад, люди сидят за лэптопами, которые выглядят и работают как 20 лет назад, и даже дешевле особо не стали.

Я понимаю, что приходя работать — я прихожу сидеть и смотреть в экран, что-то, что я активно делаю с 1997 года.

Не хочу верить, что это — будущее работы и предел возможностей человеческого сотрудничества.

Я хочу делать технологии, которые помогут нам освободиться от экранного рабства. Пусть интерфейсом будет тело, пространство, движение самого разного уровня детализации. Пусть интерфейс будет фоновым и адаптивным.

Хочу технологии, с которыми можно двигаться — заниматься самым естественным для нас как вида делом.

Фото сделал сегодня. Я рад, что в моём детстве не было смартфонов
19❤‍🔥4🔥2💯2