Data Coffee
2.62K subscribers
174 photos
7 videos
225 links
Еженедельный подкаст о данных🎙️

Сайт https://datacoffee.link
Чат Telegram @datacoffee_chat
Чат Signal https://t.iss.one/datacoffee/286
Для связи [email protected]
Download Telegram
153 (S6E05). Эпизод, в котором щемят Ha{censored}op, наслаждаются багетом и (sic!) свежими новостями

В этом без лишней лести и чрезмерного самолюбования выделяющимся среди прочих выпусков ничем, в общем-то, эпизоде ведущие искали ответы на волнующие их самих вопросы:

— сколько нужно ведущих, чтобы зачитать больше одной новости? 
— какие слова нельзя произносить в приличном DE-обществе и при чем тут Had{censred}op?
— выдержат ли читатели очередную историческую справку или скипнут этот эпизод?
— доверяют ли ведущие подкаста облакам также сильно, как слушатели - ведущим? 
— возможно ли обсудить Claire Obscure без спойлеров? 
— какое из всех возможных применений AI моделей самое практичное и почему это Lego GPT?
— как долго можно обсуждать Stanford AI Market Report в кругу не открывавших этот 456-страничный отчет? 

Бонус для тех, кто дослушает эпизод, подпишется на платный бусти и вышлет свои пароли от рута: Как сделать из свинца золото?

01:57 Мёртв ли Хадуп
26:54 Clair Obscur
42:14 ИИ развлекается вместо нас
46:50 Золото из свинца
54:25 Заменит ли ИИ дата-инженеров
56:10 Симуляция физики


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
10❤‍🔥1
154 (S6E06). Ностальгия и деменция

Очередной выпуск, в котором вопросов строго больше ответов

— сколько выпусков нас ещё ждет и на каком сезоне надо было заканчивать? 
— будут ли фотки с козлятами и голым торсом у Маска нашего Илона? 
— Грок, это правда? 
— сколько раз еще придется плакать навзрыд, проходя Claire obscure? (спойлер: на один раз больше, чем вы думаете) 
— можно ли шутить про деменцию ведущих подкаста? 
— Грок, это правда? 
— каким мессенджером пожилые люди возраста наших ведущих пользуются в повседневной жизни? 
— сколько ретро-игр смогут вспомнить ведущие? 
— что вошло в новый публичный дата-сет Яндекса ?
— застали ли сокращения в бигтехах врасплох наших ведущих?
— какую идею ведущие разрешили украсть до того, как они ее запикают в выпуске? 
— вернемся ли мы к обсуждению данных или хотя бы кофе?
— Грок, это правда? 
— утиные истории и причем тут новый формат данных? 
— когда будет новый оффлайн митап дата кофе? 
— как вступить в сообщество луддитов 21го века?
— Дуров + Маск = ?
— Грок, это правда?


02:27 Телеграм + Грок
08:15 Clair Obscure
10:26 Новость номер 2
12:24 Покет мёртв
15:25 Новый патч Миста
17:11 Датасет от яндекса
21:01 Сокращения в IT
21:59 Скрепочка на LLM-ке
23:02 Опенсорс copilot
28:42 Veo3
31:34 Новый сезон Рика и Морти
32:29 Утки
40:04 pipe в snowflake
41:55 plaude note
49:33 Поведение chatGPT
52:20 Железный чип с питоном
54:13 Новый дум
58:30 Новость номер 3


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
19🔥6
155 (S6E07). Обедающие философы

Новостной выпуск, в котором ИИ отчасти победил, вечный вопрос свежести данных решен не был, но ведущие смогли добраться до новостей!

— где ведущие берут новости для выпусков?
— сколько нужно LLM-ок, чтобы писать тексты ведущим?
— почему слушатели бросают подкаст на 2м сезоне?
— кто взломал матлаб?
— как сделать пользователя дашбордов довольным качеством данных? (спойлер: не все так просто)
— как быстро LLM-ки убьют классическое образование?
— чему учат современные и не только философы?
— почему с живыми людьми работать все еще приятней, чем с ИИ-агентом?
— как не выгореть, нажимая только tab на работе?
— в каких профессиях роботы еще не лучше людей? (их все меньше)
— что произошло с nintendo switch 2 и никогда бы не произошло со steam deck?
— неужели в этом новостном выпуске были новости?!


00:45 Новость про новости
05:40 Матлаб взломали
12:35 Актуальность данных
24:36 LLM AI AI LLM Искусственный интеллект
46:51 Тату от выгорания
53:08 AI нас всех заменит
57:29 TY от Астрала
62:58 Блиц-новости

Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
4
156 (S6E08). Контракт на душу закостенелого корпората

Выпуск, в котором ведущие заключили дата-контракт на обсуждение новостей и ни разу (ну разве что немножко) его за выпуск не нарушили :

— зачем Databricks покупает Postgres-ориентированный сервис?
— какой рынок у managed Postgres?
— при чем тут ИИ? 
— где в очередной раз утекли паролей пользователей и почему это раз за разом удивляет?
— как прошла WWDC и почему она уже не удивляет?
— почему Nintendo Switch 2 произвели так мало, что их невозможно купить? (искусственный спрос просто, хотя есть прекрасная Steam Deck OLED - комментарий Жени, который отсутствовал, но машет аргументами после боя)
— дата-контракты — панацея от всех дата-бед или очередной дата-меш?
— как дата-контракты могут спасти душу и сердце закоcтенелого корпората?
— сколько нужно фронтендеров, чтобы обсудить фронтенд? 
— что важнее — инструмент или процессы? 
— чем очередная версия Spark превосходит предыдущий релиз?


00:36 Data Bricks покупает Neon
20:53 Утечки всего
25:06 Нативные контейнеры в macOs
35:30 Data Contract Manager
55:02 Spark 4.0

Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
8🤩2
157 (S6E09). Фемто-уровень

Выпуск, в котором ведущие обсудили насущные новости не_месячной_давности, а также пытались среди пестрого роя новостей выбрать самые маленькие, соревнуясь в знании системы СИ.

— Почему яблоко перестало будоражить? 
— A в AI - это все же Apple или уже никогда не да? 
— Что может быть печальнее стоимости кофе? 
— Почему в Лондоне закупаются ремешками от apple? 
— Что делают водители Uber, когда смотрят в телефон? 
— Можно ли избежать политических новостей в подкасте? (нет)
— Какие самозапреты существовали у ведущих в подкасте и почему их уже нет? (censored)
— Новая идея стартапа для внимательных слушателей и при чем тут медицинский EdTech? 
— Кто навсегда в сердечках ведущих и при чем тут snowflake? 
— Какой еще камень полетит в копилку некогда воспеваемой в подкасте компании? 
— Сколько на самом деле лет ведущим? 
— Микроновсть, Наноновость, Пикановость или до какого размера новостей смогу уменьшиться наши ведущие? 
— Чем ИИ не умнее зумеров?


00:04 Презентация Apple
06:39 Таксисты размечают данные
07:24 Рынок IT
17:12 Будущее медицины
27:11 SQL в Snowflakes
34:26 Обучение моделей на пиратском контенте
37:28 AI-движок для Siri
39:28 Новости Nebius
42:21 Синхронные роботы
43:13 Копаемся в мозгах
47:02 Бенчмарк для моделей
50:59 Искусственные дети
57:11 Наноботы


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
7😱2
season 6 episode 9
Data Coffee
157 (S6E09). Фемто-уровень
2🔥1
158 (S6E10). Дата-кряхтение

(недо)Выпуск, в котором ведущие кряхтят, пыхтят и пытаются обсудить новости, которых одновременно и слишком много, и как бы нет:

— почему использование copilot вызывает кряхтение?
— почему менеджерам надо опасаться за свои места и перемещение колбасок в ганте не будет больше вызывать кряхтение (но у ведущих все еще вызывает)?
— что можно сотворить, совместив SQL, duckdb и doom, и над каким куском кода кряхтели ведущие в этот раз?
— выпустят ли агента, который будет кряхтеть вместо ведущих, или он уже есть?
— ожидает ли нас глобальное кряхтение инвесторов после взрыва пузыря LLM или пока поживем?
— кряхтят ли наши слушатели, когда слышат очередные рассуждения на тему LLM вместо данных или даже кофе?
— кто такой Василиск Рокко и будет ли он кряхтеть, когда наступит его эра?


00:18 Инфра Data Coffee
02:07 CLI для Jira
04:06 Doom на SQL
08:29 AgentDB
29:40 TursoDB
30:53 Google + Rayban = AI-очки


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
🔥52😁2
season 6 episode 10
Data Coffee
158 (S6E10). Дата-кряхтение
👍41
159 (S6E11). Пятничные релизы

Выпуск, в котором ведущие не спали и не давали спать своим слушателям

— Чем связаны витрувианский человек и новый релиз Airflow?
— Какое сообщение передал один из ведущих своим коллегам-слушателям?
— Какую СУБД выбрали бы ведущие для своего пет-проджекта, если бы разбирались в базах и разрабатывали пет-проджекты?
— Есть два пятничных релиза: апнуть Airflow или Postgres — какой сам сделаешь, какой любимому девопсу отдашь?
— Не верю своим ушам, это что, интеграция компании на букву Я? (Спойлер: нет, просто клевая новость)
— Что открылось ведущим в удивительном мире AI-браузеров?
{{ место для ссылки на сбор денег на покупку домена doom.ai ведущими }}
— Сколько моделей надо назвать за 3 минуты, чтобы перегрузить ведущего?
— Ремастер какой игры не будет запускать на дряхлых компьютерах ведущих?
— Как теперь будет называться подкаст? (Спойлер: также)


00:13 Airflow 3.1
09:22 Postgres 18.0
18:07 Дамба в Китае замедляет землю
19:36 Новый Ведьмак
21:18 AI-браузеры
28:37 Gemini добавили в Chrome
32:55 Claude Sonnet 4.5
36:25 Aimp на Linux
39:13 Ремастер Blood
39:30 Ремастер Deus Ex


Сайт: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://datacoffee.link
Mastodon: ⁠⁠⁠⁠⁠⁠⁠⁠⁠https://techhub.social/@datacoffee⁠⁠⁠⁠⁠⁠⁠⁠⁠
Чат в Telegram

#datacoffee #data #podcast #данные #подкаст #кофе #coffee

Где слушать🎧:
Бот-плеер
RSS feed
YouTube (пока без него)
Остальные площадки
👍43🔥3😱1
season 6 episode 11
Data Coffee
159 (S6E11). Пятничные релизы
5😱2
Forwarded from Alex. Seconds.
🎄С Рождеством или, как у меня тут говорят, Feliz Navidad🎄

После нескольких месяцев отдыха от креативной деятельности (а также занятости переездом в другую страну, переходом на новую работу, и т.д. и т.п.), я, кажется, набрался сил для чего-то нового…

Вы знаете, что я в целом люблю поговорить. И в этот раз, я решил не отклоняться от своего подкастерского хобби, сделать некий рождественский подарок🎁 и начать простым языком коротко рассказывать о разных технологиях, которые могут показаться на первый взгляд не такими уж и простыми. В первой записи я рассакзываю о том, что такое Git и о некоторых его полезных командах

Как всегда буду очень благодарен за обратную связь и конструктивную критику. Кстати, во время этой записи происходила калибровка нового 🎙️микрофона, поэтому не поскупитесь!

Приятного прослушивания! 😊

https://t.iss.one/losdatos_podcast/5
10👍3🔥1
Дорогие друзья, подписчики и слушатели нашего прекрасного подкаста!

Поздравляю всех нас с наступающим Новым годом! Этот год был непростым — порой он требовал от нас больше сил, чем хотелось бы, иногда заставлял сомневаться и переживать, принимать сложные решения, но он точно сделал нас сильнее, мудрее и опытнее. Мы прошли через испытания, вместе поддерживали друг друга, учились новому, читали новости, встречали гостей, преодолевали сложности и радовались маленьким победам, например, когда мы все-таки собирались и выкладывали записи вовремя.

Впереди — новый год. И да, он вряд ли будет легче: нас ждут новые вызовы, задачи и перемены. Но пусть это вас не пугает! Вместе мы справимся со всем — ведь у нас есть главный секрет: чашка ароматного кофе по утрам и любовь к данным (и всему прекрасному, что они дают нам). Пусть вдохновение первой утренней чашечки любимого кофе не покидает вас, пусть данные складываются в удачные проекты, а в голове всегда будет свежесть идей и желание узнавать новое вместе с нами (и не только).

Спасибо, что вы с нами и слушаете нас! За вашу активность, поддержку, интерес и доверие. Пусть наступающий год принесёт вам много ярких выпусков нашего подкаста, профессионального роста, да и просто личного счастья!

С Новым годом! Пейте кофе, любите данные — и всё у нас получится!
27🍾16🎄10🎉1
Forwarded from Alex. Seconds.
Дождливые выходные, бутылочка красного сухого, неугомонные руки, а также не уходящие из памяти вдохновляющие отзывы после пятничного демо… И вот вместо ожидаемого одного, я сегодня зарелизил в open source сразу два проекта. Собственно вашему вниманию представляются:

metadv — Python-пакет, который по предоставленной YML-спецификации:
• разбирает описанные сущности по заданным правилам
• предоставляет базовый класс валидации, от которого можно наследоваться и добавлять свои проверки
• генерирует dbt-модели для организации Data Vault 2.0 (hub, links, sat и ma_sat) в формате популярных макросов из пакетов Datavault-UK/automate_dv и ScalefreeCOM/datavault4dbt (по выбору пользователя, можно даже расширить своим Jinja-шаблоном)
• запускается как из командной строки так и путем импорта в ваш Python-код

dbt-ui — веб-приложение для совместной работы дата аналитиков в dbt-core проектах:
• frontend и backend
• базовая поддержка git
• редактор моделей с подсветкой синтаксиса SQL+Jinja
• табличный просмотр seed-файлов
• просмотр скомпилированного кода моделей
• запрос семпла записей моделей из БД
• lineage на уровне моделей
• компилирование/запуск и тест как отдельных моделей так и всего проекта
• ну и last but not least, поддержка визуального drag&drop моделирование entity, relations & attributes с последующей генерацией объектов Data Vault 2.0 прямо в веб-интерфейсе, используя пакет metadv

Как всегда буду рад конструктивной критике, GitHub звездочкам, новым issue, и discussions по обоим проектам

Спасибо за внимание и хорошей всем новой недели💙
1❤‍🔥10🔥8