Градиентное погружение
4.6K subscribers
179 photos
11 videos
10 files
164 links
Обсуждаем новости, рассказываем про ML с кодом и колабом, выигрываем соревы 🏆

Контакты: @Cene655, @Cucu_LaPraline
Download Telegram
👀 Гитхаб обновил интерфейс на сайте.
Теперь описание для закрепленных репозиториев отображается одной строкой без переносов.

Если честно, не очень приятно, так как мои описания не влезают.
⚡️ VideoDALLe

На днях мы адаптировали модель ruDALLe, которая генерирует картинки по тексту, к генерации видео по тексту. 🔥

Скоро представим код нашей работы, а пока ловите видосики: теннис, прыжок в воду и бильярд.
👍6👏2
Мы наконец выкатили пример супер прикольного файнтюна Рудольфа на любопытную задачу предсказания калорийности еды по фото

тут
👍4
VideoDalle - как генерация гифок, только лучше 🙆

Пост назад мы говорили что выпустим код, и так, теперь его можно найти в репозитории ruDalle.

Суть работы в том, что вместо генерации одной картинки мы обучаем генерировать сразу несколько. Это позволяет делать картинки более связанными и последовательными.

Спасибо каналу Love. Death. Transformers за пост и код ревью.

Колаб ноутбук
👍7👏1
Победили в хакатоне по ИИ 🥳

👉 Тут недавно Сбер организовывал хак по распознаванию рукописного текста на тетрадных листах, ну и админы решили принять участие.

👀 В течение трех недель решали задачи сегментации(выделения слов) и их последующее распознавание(задача OCR). В качестве метрики использовалась комбинация IOU и CER.

Сегодня стал доступен приватный лидерборд и оказалось, что один из админов как был на первом месте, так и остался, а второй отлетел со второго места на четвертое(с разницей в 5/10000) 😕.

В итоге удалось унести макбук и сбер портал.

Лидерборд
👏11👍3🔥2
Как быстро спарсить фотки из гугла/яндекса? ⚡️

👉 Представим ситуацию - вам необходимо собрать набор данных для генерации картинок, но вы слишком уставши, чтобы искать готовые решения или просто писать код.

Что делать в такой ситуации? Поспать Просто следуйте следующей инструкции:

1️⃣ Откройте хром, вбейте нужный запрос в поисковую систему(я пользуюсь яндексом, так как фильтры удобные)

2️⃣ Медленно прокрутите страницу с выдачей до нужного количества изображений

3️⃣ Сохраните страницу "полностью". Создастся один файл и папка с картинками

4️⃣ Запускаем файл converter.py и указываем полный путь к папке. Скрипт создаст папку images со всеми картинками в разрешении примерно 480 * 270

Опционально: запускаем delete.py и указываем полный путь, чтобы удалить дубли по хешу

🔥 В итоге, буквально за 5 минут можно спарсить порядка 1500 изображений, что довольно дёшево и сердито.
👍10😱1
Мы на паблике - первые 🥇

Ну или почти, в любом случае, можно и нужно подвести некоторые итоги финала Олимпиады НТО по распознаванию рукописного текст в тетрадях на русском и английском.

👉 Как обычно, начнем с хорошего:

1️⃣ Заняли первое место лидерборда с самого начала соревнования. 🔥

2️⃣ Использовали кристофари, что сильно помогло вырваться вперёд за счёт объёма памяти(32гб). Разрешение картинок на входе 2160 X 3130.

3️⃣ Обучали предобученную на Digital Peter CRNN (с аугментациями и чуть более расширенной версией бейзлайна) + статистически-языковую модель(KenLM) для beam search.

4️⃣ KenLM обучали на собранном датасете заданий с текстом из ОГЭ/ЕГЭ для русского и на датасете соревнования Feedback(сочинения на англе) с кагла.

5️⃣ Использовали detectron2 с аугментациями и чуть-чуть почищенным сетом, моделька X101 - топ зоопарка на датасете COCO.
👍14🔥4
👉 Что не вышло?

1️⃣ Хотели прикрутить алгоритм CopyPaste для сегментации, но обучалось слишком медленно.

2️⃣ Отказались от идеи с другими датасетами сегментации и OCR, так как у них другая тематика.

3️⃣ Пытались использовать аугментацию Сбера Handwriting Blots, но тоже работало медленно.
👏4
Градиентное погружение pinned «Наше решение, которое заняло первое место на паблик лидерборде в НТО ИИ. https://github.com/Lednik7/nto-ai-text-recognition»
Поздравляем всех с праздником 🎉

Нам очень приятно, что на нас подписаны не только трушные датасаентисты, но и прелестные дамы 🙌

Поэтому мы захотели сделать кое-что для вас, то что в наших силах и бюджете, а именно - нейропоздравлялку в тг🔥

@red_letter_day_bot - делитесь с друзьями, нам будет приятно
11👍2😱1