542 subscribers
347 photos
87 videos
15 files
426 links
Data Engineering Technologies.
SQL, Python, Kafka, Spark, Pandas, Airflow, Clickhouse, Greenplum, Postgres, dbt, LLM agentic systems, AI, robots, drones etc.

Boost channel - https://t.iss.one/boost/data_engi
Download Telegram
Forwarded from Адель и МЛь
Claude выращивает томат. 🍅

Интересный эксперимент, где Claude вот уже 37 дней выращивает томат в контролируемой среде.
У него есть датчики температуры, влажности воздуха и почвы, давления, уровня СО2, температуры листьев.
И он может управлять светом, подогревом почвы (через подогрев коврика), вентиляцией, подачей воды.
Посмотреть, что там сейчас и почитать лог можно тут: https://autoncorp.com/biodome/

Автономные теплицы все ближе!

Автор
6❤‍🔥2
Forwarded from Сиолошная
Первая новостная заметка от TheInformation в новом году: OpenAI наращивает усилия по разработке аудио-моделей в преддверии выпуска новых девайсов. Тезисно:

— Когда пользователи общаются с ChatGPT голосом, чат-бот использует аудиомодель, отличную от текстовой. Голосовая 4o не получила никаких обновлений после выхода GPT-5, она не умеет думать итд.

— Более того фича общения голосом хоть и относительно популярная, всё равно большая часть пользователей использует текст. OpenAI должны сначала приучить пользователей общаться вслух с такими продуктами, как ChatGPT, чтобы перейти к выпуску девайсов.

— По словам одного из источников, за последние два месяца OpenAI объединила несколько инженерных, продуктовых и исследовательских команд для работы над улучшением аудиомоделей для будущих устройств компании. Компания планирует выпустить новую аудиомодель в первом квартале 2026 года.

— Новая архитектура аудиомодели позволяет генерировать ответы, которые звучат более естественно и эмоционально, а также предоставлять более точную и полную информацию, сообщил источник. Новая модель сможет говорить одновременно с пользователем (чего не умеют текущие модели) и будет лучше реагировать, когда её перебивают.

— по словам нескольких источников, OpenAI разрабатывает не одно устройство, а целое семейство девайсов, которые планируется выпускать постепенно. Среди идей, которые обсуждала компания — умные очки и смарт-динамик без дисплея. Ожидается, что взаимодействие с этим устройством будет осуществляться преимущественно с помощью голоса.
❤‍🔥42
Forwarded from Сиолошная
ВОСЕМЬ советов от создателя Claude Code, чтобы перестать вайбкодить в Новом году и стать 10x инженером:

1) Запускать 5 терминалов в параллель + 5-10 вкладок на веб-сайте
2) Использовать только Opus 4.5 с размышлениями, который хоть и медленнее, но лучше остальных
3) Файл CLAUDE.md общий для всей команды проекта и обновляется несколько раз в неделю: туда заносятся типовые ошибки и способы их решения (например: «всегда используй Х» или «вместо Y всегда пиши Z»)
4) Изменения в CLAUDE.md пусть вносит сам Claude — можно даже тегнуть его в PR или в слаке и заставить описать проблему
5) Начинать почти все сессии в режиме планирования, детально обсуждать требования и тонкости имплементации. После этого переключиться в режим принятия правок, и обычно Claude с первого раза делает что нужно и как нужно
6) Задолбались по 10 раз в день делать одно и то же? Автоматизируйте рутину через слеш-команды для простых скриптовых задач и суб-агентов для задач чуть сложнее.
7) Если вы не крейзи чтобы использовать --dangerously-skip-permissions, но не хотите каждые 5 минут дергаться и читать команды в баше — настройте список одобреных команд
8) Самое главное: дайте инструменту возможность проверять свою работу. С такой обратной связью качество может вырасти в 2-3 раза. А если вы занимаетесь веб-разработкой — используйте Claude Chrome. Для всего другого нужно придумать и написать тесты — тогда дело начнёт спориться, а вы не будете тупить над ошибками (над ними будет работать Claude)

Забирай себе на стену и ищи успеха в 2026-м году!
6👏2❤‍🔥1😁11
Media is too big
VIEW IN TELEGRAM
Hindsight – интересный проект, показывающий, как можно организовать память для AI-агента.

Проект Open Source. Ставится из официального репозитория в docker.

Всё, что требуется от пользователя – заполнить API Key для OpenAI (или другого провайдера). Как альтернатива – можно поднять Hindsight на локальных моделях.

Её (память) разделили на 4 типа:

1. Факты о мире, которые формируются на основании загруженных пользователем документов.

2. Опыт агента. Факты, которые агент знает о себе. То, что делал он сам. Давал рекомендации, совершал действия и т.д.

3. Мнения. Это суждения и взгляды агента на окружающий мир. Здесь у каждого мнения может быть показатель уверенности от 0 до 1. Чем ниже значение, тем выше вероятность, что AI-агент подвергнет конкретное суждение пересмотру.

4. Наблюдения. Сводки о сущностях, которые система формирует в фоновом режиме.

При этом опыт, мнения и наблюдения формируются в процессе взаимодействия с пользователем. То есть мы имеем обучающуюся и развивающуюся систему, которая изменяется при взаимодействии с пользователем.

В любой момент можно посмотреть, в результате чего сформировался опыт или мнение агента.

Модель достаточно быстро формирует записи в графе. 1000+ "воспоминаний" загрузились буквально за пару минут. Что достаточно быстро для темпорального графа.

С другой стороны, извлечение информации AI-агентом из системы мне показалось медленным. Но это то, что мы имеем из коробки. Я планирую к API Hindsight подключить собственную систему AI-агентов и посмотреть, насколько эффективным будет работа с такой системой памяти.

Если хотите глубже изучить теоретическую базу, которая лежит в основе Hindsight, статья на arxiv в помощь.
7
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 SmolVLM-webcam — real-time AI прямо с камеры!

Новый open-source проект на GitHub показывает, как SmolVLM (500M) + llama.cpp могут делать распознавание видео с веб-камеры в реальном времени — всё локально без облака.

🤔 Что умеет:
🔘Захват камеры через браузер/HTML demo
🔘Отправка кадров модели SmolVLM через llama.cpp сервер
🔘Мгновенные описания того, что видит камера
🔘Приватно и без внешних API 💪

🚀 Простой старт:
Запустить llama-server с SmolVLM-500M
Открыть index.html
Нажать Start и смотреть как ИИ описывает сцену

📦 Репо: github.com/ngxson/smolvlm-realtime-webcam
⭐️5000+ и активно обсуждается сообществом.
Please open Telegram to view this post
VIEW IN TELEGRAM
5❤‍🔥21
🚀 OpenAI запускает ChatGPT Health — новое пространство внутри ChatGPT, где можно безопасно работать с личными медданными и здоровьем.

📈 Теперь можно подключать медицинские записи и wellness-приложения (Apple Health, MyFitnessPal и др.) и получать понятные объяснения анализов, советы по тренировкам и питанию, помощь в подготовке к приёму у врача и др.

🔒 Вся информация защищена, хранится отдельно и не используется для обучения моделей.

🩺 Это не замена врачу, а помощь в понимании и самоорганизации здоровья.

🌍 Сейчас доступ ограничен для части пользователей, полный релиз в ближайшие недели.

#chatgpt #ai #health #llm #чатжпт #ии #здоровье #бям
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥53
Forwarded from Фанклуб свидетелей Егора Коновалова (егористическая регрессия)
Oh, you're using Copilot? Everyone's on Cursor now. Just kidding, we're all on Windsurf. We're using Cline. We're using Aider. We have an in-house MCP server mesh with custom tool schemas but wait, OpenCode just dropped so we're migrating to that instead. Our PM is on Gemini CLI. The team lead was on Codex but now she's back to copy-pasting into ChatGPT. If you're not on Amp, you're ngmi. Our intern is building on Goose for our internal tooling. Our CFO approved Claude Max so now we're porting our workflows to computer use. Our CTO is working on an agent-less RAG pipeline so we won't need vibe coding anymore. Our CEO thinks we're talking about actual vibrations. We're building clankercloud.
😁9
🚀 Apache Gravitino — что это за зверь?

📌 Gravitino — это высокопроизводительный, гео-распределённый и федеративный Metadata Lake. Проще говоря: единая система для управления метаданными данных и AI-активов из разных источников по всему стеку.

🌟 Основная идея:
🔘Gravitino не просто каталог — это унифицированный слой метаданных и управления ими для разных источников: реляционные базы, data lake, файлы, стримы, модели, топики и др.
🔘 Он не копирует метаданные куда-то в центральное хранилище, а работает напрямую с источниками через коннекторы.

🧠 Что умеет Gravitino:
🔘 Единая модель метаданных
Объединяет разные форматы и источники под одним API.
🔘 Гео-распределённость
Несколько инстансов в разных регионах/облаках могут делиться видимыми метаданными.
🔘 Поддержка нескольких движков
Можно использовать Trino, Spark, Flink, Daft для запросов метаданных и данных — без изменения SQL.
🔘 AI Asset Management
Цель — также управлять метаданными моделей, фичей и других AI-объектов.

📌 Что внутри 1.1.0
Версия 1.1.0 усиливает платформу:
🔘 Расширена поддержка каталогов (в т.ч. новый Lance REST сервис для векторного AI-данных).
🔘 Укреплён уровень безопасности и авторизации.
🔘 Поддержка Hive3, мультикластерных файловых наборов и пр.

🤔 Ок, но зачем?
✔️ Если у тебя разрозненные каталоги (Hive, MySQL, Iceberg, Kafka и др.), Gravitino поможет объединить метаданные под одной крышей без миграции.
✔️ Подходит для multi-cloud/мульти-региональных стеков.
✔️ Единое место для доступа, безопасности, аудита и политики — от BI до ML/AI.

📌 В итоге:
Gravitino — это новый взгляд на каталог метаданных, который не заменяет твои источники, а связывает их в единое, управляемое пространство. 🚀

#gravitino #apache #de #architecture
Please open Telegram to view this post
VIEW IN TELEGRAM
8
1😁16
Выращиваем код в огороде

Всех с прошедшими 🎉 Открываю год статьёй от Cursor про построение долго работающих автономных кодинг агентов.

Ребятам удалось создать систему из сотен параллельно работающих агентов, которая может работать недели (!) над одним проектом и не разваливаться.

Одна из задач в статье – построить с нуля браузер. За неделю система собрала кривовато работающий браузер, что невероятный успех. Браузер традиционно считается одной из самых сложных задач в разработке. Как будто ещё годик и можно будет создать браузер в домашних условиях.

Считаю что будущее разработки за такими автономными долго работающими системами. Код будет выращиваться как в огороде. Разработчик будущего – проектировщик огорода и специалист в выборе удобрений, семян и теплиц.

Всем Копатыч 🌟

https://cursor.com/blog/scaling-agents
Please open Telegram to view this post
VIEW IN TELEGRAM
❤‍🔥6👏31