AI на дровах 🪵
235 subscribers
76 photos
19 videos
1 file
130 links
Привет! Меня зовут Семён, я работаю в сфере ML и аналитики данных, пишу в блог nerdit.ru статьи о своем опыте и том, что может пригодиться начинающим в начале их пути изучения больших данных.

👾HSE ML Unit Head⚡️
❤️Litres DS Team
Download Telegram
AI на дровах 🪵
Сегодня занимался изучением графовых баз данных в рамках одной из задач на работе. Графовые базы отлично справляются с моделированием сложных взаимосвязей, например, в социальных сетях или рекомендательных системах. Для себя нашёл много преимуществ, но также…
Сегодня делюсь мощным инструментом — GraphRAG! Это технология, которая объединяет графы и Retrieval-Augmented Generation (RAG) для суперэффективного поиска и генерации ответов.

📊 Как это работает?
GraphRAG строит граф данных, где факты — это узлы, а связи между ними — рёбра. Это позволяет не просто искать релевантные документы, а выявлять связи между ними. Запрос пользователя проходит через генеративную модель, которая обращается к этим графам, получая не только релевантные данные, но и связанные факты. Это создаёт более контекстуальные и точные ответы на сложные запросы.

Преимущества:

📍Быстрый поиск за счёт графовой структуры.

📍Выявление скрытых связей между данными.

📍Возможность анализа больших объёмов данных и построения выводов на основе множества источников.

📚 Пример: Поиск в базе знаний. Если у вас есть большая база данных или документов, GraphRAG помогает находить не просто отдельные статьи или файлы, а выявлять связи между разными документами. Например, при запросе можно увидеть, как один документ связан с другим через общие темы или упомянутые факты, что делает поиск гораздо эффективнее и глубже.

📖 Связь текстовой информации. Текстовые данные могут быть связаны между собой по различным признакам — по общим темам, ключевым словам, цитатам или контексту. GraphRAG позволяет выявлять эти скрытые связи, создавая полноценную картину информации, которая может быть разбросана по разным источникам.

#технологии #AI #bigdata #инновации #GraphRAG #базазнаний #будущее #графы #RAG #поиск
🔥2
Привет! 🚀

Недавно столкнулся с необходимостью автоматизировать процесс SEO-аудита для одной задачи. Ручная проверка всех критериев отнимала слишком много времени, да и не все ошибки удавалось выявить сразу. Я решил копнуть глубже и написал несколько полезных скриптов на Python для автоматической проверки SEO — от мета-тегов до мобильной адаптации и битых ссылок.

Если вам тоже надоело вручную проводить SEO-аудит или вы хотите упростить этот процесс, рекомендую ознакомиться с моей статьей, где я разобрал все основные аспекты. Вы узнаете, как с помощью Python автоматизировать рутинные задачи и сделать ваш сайт еще более оптимизированным для поисковых систем.

👉 Читайте статью здесь: Автоматическая проверка SEO

Если у вас есть свой проект, уверен, эта информация точно пригодится! 💻

#SEO #Python #Автоматизация #ПродвижениеСайта #ТехническийSEO #WebDev #SEOАнализ #IT
👍1
А вы знали, что можно открыть любой репозиторий на GitHub прямо в браузере в виде VSCode? 🚀 Это невероятно просто и быстро!

Как это сделать:

1. Откройте репозиторий, с которым хотите работать.
2. В адресной строке замените github.com на github.dev и нажмите Enter. 🎯

Пример:
https://github.com/username/repository
меняется на
https://github.dev/username/repository

После этого перед вами откроется онлайн-версия VSCode прямо в браузере! 🖥 Теперь можно просматривать, редактировать и работать с кодом без необходимости установки дополнительных программ.

Преимущества:

- Доступ к коду из любого места 🌍.
- Полная интеграция с GitHub: ветки, коммиты, pull-реквесты — всё на месте! 🔄
- Поддержка расширений и привычного функционала VSCode 🔧.

Попробуйте сами и убедитесь, насколько это удобно! 😊

#GitHub #VSCode #DevTips #Программирование #Кодинг #GitHubDev #WebDevelopment #Программист #Разработка #Frontend #Backend #Код
🔥2
🤷
💯3
📢 Новый дайджест интересных статей в блоге!

В начале недели собрал все популярные запросы, которые начинались со слов "Как в python...".
В итоге получился целый список полезных статей, делюсь:

🔹 Как в Python обрабатывать исключения
Узнайте, как правильно использовать try-except для обработки ошибок в Python.
👉 Читать статью

🔹 Как в Python писать тесты
Подробное руководство по тестированию вашего кода с использованием библиотеки unittest.
👉 Читать статью

🔹 Как в Python работать с JSON
Научитесь парсить и генерировать JSON-данные в Python.
👉 Читать статью

🔹 Как в Python использовать lambda-функции
Пример того, как эффективно использовать анонимные функции в коде.
👉 Читать статью

🔹 Как в Python работать с датой и временем
Руководство по использованию модуля datetime для работы с временными данными.
👉 Читать статью

🔹 Как в Python делать веб-скрапинг
Узнайте, как собирать данные с сайтов с помощью BeautifulSoup.
👉 Читать статью

🔹 Как в Python написать функцию
Основы и примеры написания функций в Python.
👉 Читать статью

🔹 Как создать список в Python и работать с ним
Полное руководство по созданию списков и операциям с ними.
👉 Читать статью

Подписывайтесь на обновления и следите за новыми статьями!
🔥32
✍️ Привет всем! Сегодня я хочу поделиться с вами небольшим, но очень интересным экспериментом, который я начал. Я решил создать блог про идеи для путешествий по России, но не просто блог... Этот блог полностью ведёт GPT! Да-да, искусственный интеллект придумывает заголовки, пишет статьи, подбирает теги и даже картинки в стиле пиксель арт для каждого поста. 🎨🖼

Суть эксперимента проста: я задал GPT направление — путешествия по России. Он создаёт всё сам — от креативного заголовка до последних штрихов в тексте. Статьи получаются увлекательными и даже с полезными советами для самостоятельных путешественников! 🚂🌍

Что делает GPT:

📝 Придумывает оригинальные заголовки
✍️ Пишет полноценные статьи о путешествиях и приключениях в России
📌 Подбирает релевантные теги, чтобы посты находили свою аудиторию в поиске
🎨 Генерирует уникальные картинки в стиле пиксель арт для каждого поста

#gpt_эксперимент
👀5👍2
AI на дровах 🪵
✍️ Привет всем! Сегодня я хочу поделиться с вами небольшим, но очень интересным экспериментом, который я начал. Я решил создать блог про идеи для путешествий по России, но не просто блог... Этот блог полностью ведёт GPT! Да-да, искусственный интеллект придумывает…
Как GPT не повторяется?
В начале каждого цикла GPT автоматически получает список заголовков, которые уже опубликованы в блоге, и анализирует их, чтобы избежать повторов. Таким образом, каждый заголовок, который придумывает GPT, является уникальным и не пересекается с уже существующими постами. Это помогает создавать свежий контент для блога, который не только увлекает читателей, но и расширяет тематику путешествий по России. 🔄💡

#gpt_эксперимент
Ну и самый главный вопрос: как поисковые системы будут взаимодействовать с таким контентом 🔍

Эксперимент с SEO: GPT не только придумывает контент, но и создаёт его с учётом ключевых слов и фраз, которые помогут постам лучше ранжироваться в поисковых системах. Это особенно важно для того, чтобы больше людей могли найти блог через Google или Яндекс. 📈

Посты выходят каждый день в 8 утра по Москве , но думаю стоит рандомизировать его🗺

Автоматическая публикация в Telegram: Каждая новая статья также автоматически публикуется Telegram-канале. Присоединяйтесь по ссылке: t.iss.one/travel_pla, чтобы не пропустить свежие материалы и вдохновение для ваших путешествий и следить за экспериментом! 🚀

Будет интересно увидеть, как алгоритмы ИИ взаимодействуют с алгоритмами поисковых систем. Может ли GPT улучшить видимость сайта в сети без вмешательства человека?

Этот вопрос меня очень увлекает, и я планирую делиться результатами с вами!

Сайт эксперимента: traveltripster.ru

#Путешествия #Россия #ИскусственныйИнтеллект #GPT #ПиксельАрт #ИдеиДляОтдыха #Маршруты #SEO #Оптимизация #ЕжедневныеПосты #TelegramКанал #gpt_эксперимент
🔥4
AI на дровах 🪵
Ну и самый главный вопрос: как поисковые системы будут взаимодействовать с таким контентом 🔍 Эксперимент с SEO: GPT не только придумывает контент, но и создаёт его с учётом ключевых слов и фраз, которые помогут постам лучше ранжироваться в поисковых системах.…
Планы на будущее:

⭐️ Разнообразие контента: В планах расширить форматы публикаций, добавляя в посты не только текстовую информацию, но и полезные ссылки, интерактивные карты, галереи изображений и видеоролики. Это позволит пользователям получать более полное представление о маршрутах и местах.

⭐️SEO-эксперимент с ИИ: Продолжу исследовать возможности ИИ в создании контента с учётом SEO-оптимизации. Планирую расширить использование ключевых слов, заголовков и метаданных, чтобы улучшить позиции в поисковых системах. Также хочу протестировать, как регулярное обновление старых статей с помощью GPT может повлиять на SEO.

#gpt_эксперимент
🚀 Как использовать GPT в аналитике данных! 📊🤖

Искусственный интеллект активно меняет подход к анализу данных, и GPT-модели от OpenAI становятся незаменимыми помощниками. В этой статье я делюсь подробным гидом, который поможет вам понять, как использовать GPT для автоматизации рутинных задач, создания отчетов и получения ценных инсайтов из данных.

📌 Что вы найдете в статье:

- Примеры того, как можно применять GPT на практике: от анализа отзывов клиентов до сегментации аудитории.
- Полезные промты, которые помогут максимально эффективно использовать эту технологию.
- Примеры кода на Python для автоматизации анализа и обработки данных.

Почему это важно?
GPT может работать с огромными объемами данных и переводить сложные цифры в понятные и четкие рекомендации. Это отличный инструмент для аналитиков, маркетологов и всех, кто хочет принимать обоснованные решения на основе данных.

🔥 Если вам интересно, как ИИ помогает бизнесу становиться эффективнее и успешнее — обязательно загляните в статью!

👉 Перейти к статье: https://nerdit.ru/gpt-v-analitike-dannyh-gid-s-primerami-promty/

#AI #GPT #Аналитика #BigData #Python #OpenAI #БизнесАналитика
🔥3
Контекстуальный RAG: сокращение галлюцинаций на 35% 🎉

Недавно исследователи представили улучшение для RAG: аннотирование чанков контекстом и комбинация семантических эмбеддингов с TF-IDF. Этот подход снижает количество галлюцинаций на 35% по сравнению с классическими методами RAG!

А теперь появился шанс изучить этот подход на практике! Together AI выложили опенсорсную реализацию, в которой они используют Llama 3.2 3B для аннотирования, а Llama 3.1 405B в качестве основной модели.

Кратко, как это работает ⬅️

🧩 1. Контекстуализация для каждого фрагмента:
Каждому фрагменту добавляется небольшое пояснение, помогающее модели лучше понять, как этот кусок текста связан с другими частями документа. Это достигается с помощью небольших и более доступных моделей, которые способны быстро и недорого создавать такие контекстные пояснения.

🔍 2. Гибридный поиск (Hybrid Search):
Каждый фрагмент индексируется с использованием как разреженных (ключевые слова), так и плотных (семантических) эмбеддингов, что позволяет более точно захватывать смысл текста. Такой подход делает процесс поиска более глубоким и релевантным.

📊 3. Объединение рейтингов (Rank Fusion) с помощью Reciprocal Rank Fusion (RRF):
Используя RRF, мы объединяем ранжирование по ключевым и семантическим признакам, чтобы получить наиболее точные фрагменты. Это помогает достичь баланса между поверхностным и глубоким поиском, исключая нерелевантные результаты.

🎯 4. Двойное ранжирование:
Сначала извлекается 150 топовых фрагментов, которые затем проходят повторное ранжирование (Reranker). После этого остаётся 20 лучших, которые используются для создания ответа. Это позволяет модели работать с релевантными данными и генерировать более точные и информативные ответы.

Код доступен по ссылке. Исследователям будет полезно поэкспериментировать с этим пайплайном, а тем, кто внедряет RAG в продакшене — сохранить имплементацию для изучения.

#RAG #OpenSource #ML #NLP #AIResearch #DataScience #SemanticSearch
👍1
AI на дровах 🪵
✍️ Привет всем! Сегодня я хочу поделиться с вами небольшим, но очень интересным экспериментом, который я начал. Я решил создать блог про идеи для путешествий по России, но не просто блог... Этот блог полностью ведёт GPT! Да-да, искусственный интеллект придумывает…
🚀 Эксперимент с тревел-блогом, который ведёт GPT – Первая неделя 🌍

На прошлой неделе я запустил проект, в котором весь контент создаётся исключительно искусственным интеллектом!
Хочу сразу уточнить, что этот блог — не совсем тревел-блог в привычном понимании. Он больше ориентирован на тех, кто ищет свежие идеи для следующего отпуска, интересные и малоизвестные места по всей России. 🌄

Вместо обычных путеводителей здесь можно найти вдохновение для путешествий — от красивых уголков природы и уютных городков до необычных маршрутов, которые не так широко известны. 🎒

Делюсь первыми результатами:

📅 Первая неделя:

🔹 Запуск проекта и регулярное размещение постов.
🔹 Подключение системы аналитики для отслеживания динамики.
🔹 Добавление сайта в Яндекс.Вебмастер и Google Search Console.

📊 Результаты: Все страницы уже проиндексированы в Яндексе и Google! 🎉
И это уже большое достижение для нового сайта.
В очередной раз убедился, что регулярное размещение постов на сайте "прикармливает" поисковых ботов.

🔄 Что было сделано после первой недели:

🔹 Добавил интерактивную карту с местами, которые упоминаются в статьях.
🔹 Упрощение заголовков — теперь они короче и понятнее.
🔹 Увеличение объёма статей до 1500 слов для более глубокого погружения.

📈 В планах:

🔹 Создать страницу с тегами по городам для удобной навигации.
🔹 Сгенерировать SEO-оптимизированные URL.
🔹 Анализ позиций статей, которые вошли в индекс за первую неделю, чтобы понять, какие улучшения можно внести.

Через неделю будет очередная аналитика и сравнение ситуации с постами из первой недели и второй.

Следим за результатами и надеемся, что проект продолжит набирать обороты!

#gpt_эксперимент #gpt #AI #ИИ
👍2👏1
🆕 Большое обновление функционала YouTube бота!

Всем привет!
Меня сильно расстраивала последнее время необходимость использовать VPN для доступа к YouTube.
И я подумал, а почему бы и нет и допилил функционал бота @summ_youtube_bot

Что нового:

1. Суммаризация видео по ссылке

Просто отправьте ссылку на YouTube, и бот сделает краткое описание содержания видео. Это удобно, если вы хотите быстро узнать суть, не тратя время на полный просмотр! 📋

🎶 2. Скачивание видео и аудио

Добавил возможность скачать видео или аудио (MP3)! Теперь после описания видео под каждым сообщением у вас будут две кнопки:

- Скачать видео — чтобы загрузить видео в формате MP4.
- Скачать MP3 — чтобы получить только аудио из видео.

🔍 3. Поиск по YouTube

Не знаете точную ссылку? Просто введите ключевые слова, и бот найдёт видео по вашему запросу! Под каждым найденным результатом также будут кнопки для скачивания в видео и аудио формате.

⚠️ Доступ к боту только для подписчиков этого канала.
https://t.iss.one/summ_youtube_bot
1🔥21👍1
💬 Всем привет!

Сегодня хочу поделиться мыслями по двум очень интересным темам в мире больших языковых моделей.

🔥 Агенты на основе больших языковых моделей (LLM)

Погрузился в тему создания агентов, которые работают на базе больших языковых моделей, и это действительно впечатляет!

Представьте себе систему, которая не только понимает запросы, но и может адаптироваться, анализировать и планировать задачи на основе прошлых взаимодействий.

Такие агенты находят применение в самых разных сферах: от автоматического написания кода до поддержки пользователей и анализа данных.

Это новый уровень гибкости и эффективности в ИИ, где агент может действовать как полноценный помощник, подстраиваясь под нужды пользователя и оставаясь при этом достаточно независимым.

🔧 Использование функций в GPT

Вторая тема – использование функций и API в GPT, что открывает массу новых возможностей. Одно дело – иметь модель, которая может ответить на текстовый запрос, и совсем другое – когда она может "общаться" с реальным миром, используя внешние функции.

Представьте, что GPT получает команду отправить письмо, проверить погоду или даже получить данные с биржи! Я провел исследования и примеры кода по тому, как можно интегрировать GPT с разными API для расширения его возможностей.

Это отличная возможность для создания более интерактивных и полезных решений, особенно когда нужна актуальная информация или специфические расчёты.

💡 В обеих статьях я разбираю примеры кода и подробно объясняю, как и где можно внедрить эти подходы.

Пишите, если интересно узнать больше! 😉

#ИИ #АгентыLLM #GPT #МашинноеОбучение #БольшиеЯзыковыеМодели #ИнтеграцияAPI #Технологии #Автоматизация #ФункцииGPT #ИскусственныйИнтеллект #DataScience #Python #Инновации #ML #Нейросети
👍2
💡 ИИ в Образовании: Влияние и Тренды
Совместное исследование Яндекс Образование и ВШЭ изучает влияние искусственного интеллекта на высшее образование. Доклад освещает глобальные практики внедрения ИИ и его влияние на студентов и преподавателей.

📈 Факты и цифры:

🔹 49% студентов уже используют ИИ для обучения.
🔹 54% преподавателей считают, что ИИ улучшит карьерные перспективы студентов.
🔹 Студенты применяют ИИ для объяснения сложных тем, анализа текстов, перевода и исследований.

🌐 Мировые кейсы:

🔹 UCL, Великобритания – Гайдлайны по использованию ИИ: запрещено, разрешено частично, либо используется для выполнения заданий.
🔹 Мексика, Tec de Monterrey – ИИ интегрирован в процессы обучения и исследования.
🔹 Гонконгский политехнический университет – Внедрение GenAI в учебный процесс.

🔗 Ссылка на полный доклад: https://education.yandex.ru/aihighreport

#ИИ #образование #Яндекс #ВШЭ #Вышка #студенты #технологии
Доклад прекрасно отражает реальность, в которой мы уже живём: искусственный интеллект становится неотъемлемой частью образовательного процесса. Особенно радуют данные, показывающие активное использование ИИ среди студентов и преподавателей.

👨‍🎓 ИИ — это инструмент, а не замена знаний и навыков.
Главное, чтобы студенты понимали это и могли использовать его с умом.

P.S. интересно будет посмотреть на студенческие проекты в этом году.
Media is too big
VIEW IN TELEGRAM
🌟 Будущее ИИ: Возможности и Ответственность 🌟

Посмотрел тут интересно видео про будущее ИИ.
Что интересного?

1. Новые метафоры для ИИ: ИИ можно рассматривать как "цифровой вид", что помогает лучше понять его возможности и ограничения. 🌍

2. Креативность и "галлюцинации": Способность ИИ к креативным ответам — это не недостаток, а возможность расширить горизонты. 🎨

3. Эмоциональный интеллект: EQ становится таким же важным, как IQ, поскольку способ общения ИИ влияет на восприятие информации. ❤️

4. Будущее взаимодействия: ИИ-компаньоны, понимающие контекст и запоминающие информацию, могут значительно упростить жизнь и повысить креативность. 💡

5. Ответственность разработчиков: Важно продумывать, как технологии будут влиять на человечество, и создавать ИИ, который поддерживает лучшие человеческие качества. 🌱

Так вот теперь GPT - это "цифровой вид" 😅
Что думаете по этому поводу?!

#ИИ #будущее #видео #AI
Привет всем!

Сегодня без громких новостей, но с одной крутой обновой 😉 Я продолжаю улучшать бота, который помогает работать с YouTube видео. Теперь он может генерировать телеграм пост прямо из контекста видео!

Этот бот уже стал фаворитом среди тех, у кого есть сложности с доступом к YouTube, и особенно востребован среди творческих людей, которым часто нужна аудио дорожка — например, музыка для проектов.

Если у вас есть идеи по новым функциям или улучшениям, буду рад услышать их в комментариях!
https://t.iss.one/summ_youtube_bot
Интересный факт о том, почему нейросетевые модели, такие как ChatGPT, не могут точно сказать, сколько букв "R" в слове strawberry 🍓

Токенизация определяет, как модель "видит" и разделяет слова на части. Например, модель может увидеть число 380 целиком как "380", а число 381 как два отдельных токена: "38" и "1". Это показывает, что токены ≠ слова и токены ≠ слоги. Это как раз и объясняет, почему модели часто путаются в таких, казалось бы, простых задачах, как подсчет букв.

Например, в слове strawberry модель видит слово как совокупность токенов, и не все они совпадают с буквами. Пробелы также могут быть токенами, а регистр влияет на восприятие. Это создает барьеры в решении фонетических и простых математических задач, таких как подсчет букв "R".
👾4
🤖 Мысли о влиянии генеративного ИИ на рынок труда

Прочитал статью о влиянии генеративного ИИ на рынок труда — и задумался, насколько масштабным может оказаться этот процесс. С момента появления ChatGPT и других инструментов ИИ такие профессии, как копирайтинг, разработка ПО и графический дизайн, оказались под ударом. В краткосрочной перспективе многие работодатели уже начали предпочитать ИИ-фрилансерам. Согласно исследованиям, число вакансий на фриланс-платформах для таких профессий уменьшилось на 20-30%. Это особенно касается задач, где легко внедрить автоматизацию.

Но что это значит для нас? С одной стороны, ИИ действительно повышает эффективность — он может быстро выполнять рутинные задачи, высвобождая время для более сложных задач. С другой стороны, возникает серьёзная конкуренция не только между людьми, но и между людьми и ИИ. Ощущается давление: спрос на базовые навыки снижается, а востребованность специалистов, умеющих интегрировать ИИ в рабочие процессы, растёт.

Есть интересные выводы и для компаний: организации, которые активно готовят работников к использованию ИИ, выиграют в будущем. Статья подчёркивает важность прозрачной коммуникации и необходимости обучать сотрудников новым навыкам, вместо того чтобы просто заменять их ИИ. Также важна подготовка руководителей — им придётся научиться эффективно распределять задачи между людьми и машинами, учитывая сильные стороны обоих.

Для нас, специалистов, главная мысль — необходимо адаптироваться. Переход к миру, где ИИ дополняет наши рабочие процессы, уже начался, и тот, кто осваивает эти технологии, будет впереди. Сохранить конкурентоспособность можно, если видеть в ИИ не угрозу, а возможность для роста и развития.

Вопрос к вам: как вы видите своё будущее в мире, где ИИ становится всё более интегрированным в наши профессии?