Small Data Science for Russian Adventurers
11.3K subscribers
307 photos
3 videos
13 files
708 links
БЕЗ ЧУЖОЙ РЕКЛАМЫ Авторский канал Александра Дьяконова (dyakonov.org)
машинное (machine learning) и
глубокое обучение (deep learning)
анализ данных (data mining)
наука о данных (data science)
ИИ (artificial intelligence)
математика (math)
и др.
ЕСТЬ ЧАТ;)
Download Telegram
#опрос
Обещанный опрос про работу в DS и зарплаты (для тех, кто уже работает). Прохождение не должно занять много времени. Чем больше человек пройдёт, тем адекватнее будут результаты. Потом будут выложены агрегаты (деанонимизация будет невозможно, хотя и так вопросы подбирались, чтобы её максимально затруднить).
https://docs.google.com/forms/d/e/1FAIpQLSe_GOFCltIjDfNs6TqnxKzlh_lMSV0vy_HD0-mXFFuqWqkl1w/viewform
#опрос
текущий статус по опросу DS-работников - 650 ответов
https://clck.ru/VDSh7
#опрос
Приглашаю в комментах поделиться, кто в каком соревновании участвует (лучше дать ссылку) и общие впечатления (насколько интересно, есть ли косяки в организации, какие мощности используете). Я сам ни в чём не участвую, но посмотрев, что сейчас идёт, мне показалось, что всё по-прежнему с косяками и на ноуте уже почти ничего не порешаешь...
#опрос
Вопрос для практикующих NLPшников - "Любимая модель классификации".

Сваливается на Вас задача классификации небольших текстов (скажем, это реплики). Выборка не слишком большая ~ 100 000 текстов, классов ~ 3-10 (конечно, есть дисбаланс). Вы хотите быстренько прикинуть, какое качество в задаче можно получить. Какую предобученную модель Вы возьмёте для тюнинга на этом датасете?

Напишите в комментарии (чем подробнее ответ - тем полезнее читающим, хотя лично меня интересуют современные предпочтения).
👍1
#опрос
Недавно были опубликованы результаты опроса специалистов по обработке естественного языка. Интересно, что на подавляющее большинство вопросов примерно половина отвечает "да", а другая половина - "нет", т.е. в среднем специалисты ничего конкретного сказать не могут. Вот на картинке пример - статистика ответов на вопрос о понимании языка современными моделями.

Из мнений, где всё-таки есть консенсус:
- крутые статьи будут выходить из индустрии, а не академии,
- все слишком помешаны на бенчмарках ("побьём SotA-у любой ценой"),
- нужно больше взаимодействовать со смежными дисциплинами,
- NLP даёт и будет давать хороший вклад в науку.
👍23🤔10🕊1
#опрос
Мне сейчас актуальны проблемы качества образования. Поэтому я попробую использовать аудиторию канала для опроса. Какие-то общие выводы опроса я, конечно, в канале напишу...

Нас обычно привлекают
- преподаватели (которые отличаются от других харизмой, манерой подачи и т.п.),
- курсы (которые оказываются полезными и запоминаются),
- приёмы (ну какие-то фишки, которые редко встречаются, но вызывают "вау-эффект": интересные формы контрольных, неформальные обсуждения материала и т.д.)

Если у Вас что-то такое было, напишите в форму. Там всего несколько полей, можно заполнять несколько раз, за одно заполнение можно указать что-то одно (преподавателя, курс или приём). Также желательно кратко объяснить, а что Вас зацепило... Это НЕ обязательно должно быть связано с DS или MATH образованием! Любопытно всё интересное.

Заранее всем спасибо!
22👍9