Forwarded from Machinelearning
Хороших книг по обучению с подкреплением (Reinforcement Learning, RL) уже выпущено достаточно, однако есть пробел между продвинутыми учебниками, в которых основное внимание уделяется одному или нескольким аспектам, и более общими книгами, в которых предпочтение отдается удобочитаемости, а не сложности.
Авторы книги, люди с опытом работы в CS и инжиниринга, подают тему RL в строгом и академическом стиле. Книга основана на конспектах лекций для углубленного курса бакалавриата, который преподается авторами в Тель-Авивском университете.
К этой книге дополнительно идет брошюра с упражнениями и экзаменационными вопросами, которые помогут освоить материал книги на практике. Эти упражнения разрабатывались на протяжении нескольких лет.
Математическая модель книги - Марковский процесс принятия решений (Markov Decision Process, MDP). Основное внимание уделяется: последовательному принятию решений, выбору действий, долгосрочному эффекту от этих действий и разница между немедленным вознаграждением и долгосрочной выгодой.
Тематически книга состоит из двух частей – "Планирование" и "Обучение".
@ai_machinelearning_big_data
#AI #ML #RL #MDP #Book
Please open Telegram to view this post
VIEW IN TELEGRAM
👍9❤5
Forwarded from Machinelearning
Репозиторий на Github c набором ipynb-туториалов по Prompt Engineering для освоения методов создания оптимальных промптов для модели Qwen2.5-14B.
Руководство разделено на 9 глав с практическими упражнениями и приложением с "продвинутыми" методами. В каждой главе есть "Example Playground" для экспериментов с примерами и наблюдения за изменениями в инференсе Ollama.
Руководство использует модель Qwen 2.5-14B, но все материалы подходят и для модели Qwen 2.5-7B.
Начальный уровень
Средний уровень
Продвинутый уровень
Приложение: За пределами стандартных подсказок
@ai_machinelearning_big_data
#AI #ML #LLM #Github #Tutorial #Ollama
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤3🔥2👎1
🛡️ OpenAI начала блокировать аккаунты ChatGPT, связанные с хакерскими группами из Китая, России, Ирана и КНДР
По данным The Hacker News, OpenAI выявила серию злоупотреблений, где ChatGPT использовался для:
• 🐍 разработки вредоносного ПО
• 🗳️ политических influence-кампаний
• 💼 мошенничества с IT-вакансиями
• 🌐 обхода защитных систем и VPN
👥 Кто участвовал:
• Китай — генерация пропаганды и политического спама
• Россия — атаки на выборы в Германии
• Иран — влияние на латиноамериканские медиа
• КНДР — фейковые IT-вакансии и обход систем обнаружения
💥 В одном из случаев группа ScopeCreep использовала ChatGPT для:
– генерации Go-малвари
– PowerShell-скриптов, отключающих защиту
– обфускации через Base64
– настройки C2 через SOCKS5
– и создания временных учёток для анонимности
🔐 Что делает OpenAI:
– Блокирует злоупотребляющие аккаунты
– Следит за активностью через API и поведенческие шаблоны
– Обновляет политику и защиту от misuse
📎 Полная статья: thehackernews.com/2025/06/openai-bans-chatgpt-accounts-used-by.html
#AI #CyberSecurity #LLM #ChatGPT #OpenAI #ThreatIntel
По данным The Hacker News, OpenAI выявила серию злоупотреблений, где ChatGPT использовался для:
• 🐍 разработки вредоносного ПО
• 🗳️ политических influence-кампаний
• 💼 мошенничества с IT-вакансиями
• 🌐 обхода защитных систем и VPN
👥 Кто участвовал:
• Китай — генерация пропаганды и политического спама
• Россия — атаки на выборы в Германии
• Иран — влияние на латиноамериканские медиа
• КНДР — фейковые IT-вакансии и обход систем обнаружения
💥 В одном из случаев группа ScopeCreep использовала ChatGPT для:
– генерации Go-малвари
– PowerShell-скриптов, отключающих защиту
– обфускации через Base64
– настройки C2 через SOCKS5
– и создания временных учёток для анонимности
🔐 Что делает OpenAI:
– Блокирует злоупотребляющие аккаунты
– Следит за активностью через API и поведенческие шаблоны
– Обновляет политику и защиту от misuse
📎 Полная статья: thehackernews.com/2025/06/openai-bans-chatgpt-accounts-used-by.html
#AI #CyberSecurity #LLM #ChatGPT #OpenAI #ThreatIntel
❤9😁5👍4🤔4👏1