Data Science

Attacking LLMs and AI Agents: Advertisement Embedding Attacks Against LLMs

📚 Paper

@datascienceiot

4.1K views21:18

Динамические таблицы YTsaurus: рекламные профили поведенческого таргетинга

Поведенческий трагетинг — система, требующая обработки сотен тысяч событий в секунду со строгой exactly-once-семантикой и временем отклика в доли секунды. Она основана на динамических таблицах YTsaurus и включает механизмы сжатия данных, бинарных дельт и шардирования. Решение позволяет эффективно обновлять пользовательские профили в реальном времени. Может использоваться для разных потоков данных, где есть обновляемое состояние, высокая нагрузка, требования к latency и exactly-once.

📚 Paper

4.08K views13:51

Data Science

"Transcendence" is when an LLM, trained on diverse data from many experts, can exceed the ability of the individuals in its training data.

This paper demonstrates three types: when AI picks the right expert skill to use, when AI has less bias than experts & when it generalizes.

📚 Read

@datascienceiot

4.23K views16:10

Data Science

На днях прошла первая встреча AI VK & Pro — ивент, посвященный рекомендательным системам.

Кажется, там был вся RecSys и ML-тусовка. Атмосфера максимально стильная
По фоткам можно догадаться, что нетворк был на максималках. Команда VK поделилась своим взглядом на будущее рекомендаций и рассказала про единые рекомендательные технологии для всех продуктов VK

Плюс вайб: музыка, DJ-сеты, активности и нетворк.

@datascienceiot

4.27K views17:42

Data Science

Tencent AI Lab introduces Vision-SR1

A self-rewarding Vision-Language Model to fix visual hallucinations & language shortcuts

📚Paper: https://huggingface.co/papers/2508.19652
📚Code: https://github.com/zli12321/Vision-SR1.

@datascienceiot

4.56K views19:10

Data Science

OpenAi Realtime Prompting Guide

📚 Guide

@datascienceiot

4.76K views12:04

Data Science

"GPT-5 moves from human-comparable to above human-expert performance"

GPT-5 outperforms licensed human experts by 25-30% and achieves SOTA results on the US medical licensing exam and the MedQA benchmark.

I sound like a broken record, but AI models are better than most doctors.

📚 Paper

@datascienceiot

4.96K views12:00

Data Science

On the Theoretical Limitations of Embedding-Based Retrieval"

📚Статья: https://arxiv.org/abs/2508.21038

@datascienceiot

6.22K views11:03

Data Science

Forwarded from Machinelearning

🔥 Бесплатная книга от инженера Google — Agentic Design Patterns

400 страниц про всё, что нужно знать об агентных системах. Автор — senior engineer в Google, выложил драфт для открытого ревью.

📖 В книге:
- продвинутые техники промптинга
- паттерны для мульти-агентов
- использование инструментов и MCP
- практические примеры с кодом

⚡ По сути, это полный справочник по построению умных агентов. Must-read для разработчиков AI.

📚

Читать

@ai_machinelearning_big_data

#AI #Agents #Google #OpenSource #freebook

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

4.44K views21:40

About

Blog

Apps

Platform