Динамические таблицы YTsaurus: рекламные профили поведенческого таргетинга
Поведенческий трагетинг — система, требующая обработки сотен тысяч событий в секунду со строгой exactly-once-семантикой и временем отклика в доли секунды. Она основана на динамических таблицах YTsaurus и включает механизмы сжатия данных, бинарных дельт и шардирования. Решение позволяет эффективно обновлять пользовательские профили в реальном времени. Может использоваться для разных потоков данных, где есть обновляемое состояние, высокая нагрузка, требования к latency и exactly-once.
📚 Paper
Поведенческий трагетинг — система, требующая обработки сотен тысяч событий в секунду со строгой exactly-once-семантикой и временем отклика в доли секунды. Она основана на динамических таблицах YTsaurus и включает механизмы сжатия данных, бинарных дельт и шардирования. Решение позволяет эффективно обновлять пользовательские профили в реальном времени. Может использоваться для разных потоков данных, где есть обновляемое состояние, высокая нагрузка, требования к latency и exactly-once.
📚 Paper
"Transcendence" is when an LLM, trained on diverse data from many experts, can exceed the ability of the individuals in its training data.
This paper demonstrates three types: when AI picks the right expert skill to use, when AI has less bias than experts & when it generalizes.
📚 Read
@datascienceiot
This paper demonstrates three types: when AI picks the right expert skill to use, when AI has less bias than experts & when it generalizes.
📚 Read
@datascienceiot
На днях прошла первая встреча AI VK & Pro — ивент, посвященный рекомендательным системам.
Кажется, там был вся RecSys и ML-тусовка. Атмосфера максимально стильная
По фоткам можно догадаться, что нетворк был на максималках. Команда VK поделилась своим взглядом на будущее рекомендаций и рассказала про единые рекомендательные технологии для всех продуктов VK
Плюс вайб: музыка, DJ-сеты, активности и нетворк.
@datascienceiot
Кажется, там был вся RecSys и ML-тусовка. Атмосфера максимально стильная
По фоткам можно догадаться, что нетворк был на максималках. Команда VK поделилась своим взглядом на будущее рекомендаций и рассказала про единые рекомендательные технологии для всех продуктов VK
Плюс вайб: музыка, DJ-сеты, активности и нетворк.
@datascienceiot
Tencent AI Lab introduces Vision-SR1
A self-rewarding Vision-Language Model to fix visual hallucinations & language shortcuts
📚Paper: https://huggingface.co/papers/2508.19652
📚Code: https://github.com/zli12321/Vision-SR1.
@datascienceiot
A self-rewarding Vision-Language Model to fix visual hallucinations & language shortcuts
📚Paper: https://huggingface.co/papers/2508.19652
📚Code: https://github.com/zli12321/Vision-SR1.
@datascienceiot
"GPT-5 moves from human-comparable to above human-expert performance"
GPT-5 outperforms licensed human experts by 25-30% and achieves SOTA results on the US medical licensing exam and the MedQA benchmark.
I sound like a broken record, but AI models are better than most doctors.
📚 Paper
@datascienceiot
GPT-5 outperforms licensed human experts by 25-30% and achieves SOTA results on the US medical licensing exam and the MedQA benchmark.
I sound like a broken record, but AI models are better than most doctors.
📚 Paper
@datascienceiot
On the Theoretical Limitations of Embedding-Based Retrieval"
📚Статья: https://arxiv.org/abs/2508.21038
@datascienceiot
📚Статья: https://arxiv.org/abs/2508.21038
@datascienceiot
Forwarded from Machinelearning
400 страниц про всё, что нужно знать об агентных системах. Автор — senior engineer в Google, выложил драфт для открытого ревью.
📖 В книге:
- продвинутые техники промптинга
- паттерны для мульти-агентов
- использование инструментов и MCP
- практические примеры с кодом
⚡ По сути, это полный справочник по построению умных агентов. Must-read для разработчиков AI.
@ai_machinelearning_big_data
#AI #Agents #Google #OpenSource #freebook
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM