Если кто не в курсе, мой iPad Pro 2018 года всё ещё быстрее чем 95% ноутбуков, как и обещали. Но на нём два приложения: Notability и Youtube .
Я бы хотел выходить из дома и жить с айпадом, но там нет НИ ЧЕ ГО. Там есть jupyter, какие-то IDE и termius, но это всё почему-то невозможно использовать комфортно. Ну и paywall там. Я бы хотел с него обрабатывать RAW фотки, но что-то скинуть на него это целая история. Там вроде как есть многозадачность, но нормально она работает только на стандартных приложениях.
Даже на моём macbook air 2012 можно хоть чем-то заняться. Но не на айпаде. Хотя девайс великолепный.
Я бы хотел выходить из дома и жить с айпадом, но там нет НИ ЧЕ ГО. Там есть jupyter, какие-то IDE и termius, но это всё почему-то невозможно использовать комфортно. Ну и paywall там. Я бы хотел с него обрабатывать RAW фотки, но что-то скинуть на него это целая история. Там вроде как есть многозадачность, но нормально она работает только на стандартных приложениях.
Даже на моём macbook air 2012 можно хоть чем-то заняться. Но не на айпаде. Хотя девайс великолепный.
👍3
Наступило лето и на нас посыпался град из новых систем для TTS от Китайцев и Корейцев.
У Корейцев там система туда-сюда. Инкрементальное улучшение над VITS. Странно что назвали её PITS, а не TITS.
А вот китайцы докинули энкодеров в систему и получили что-то очень естественно звучащее. Причём, они обучали систему восстанавливать участок речи по тексту и спектрограмме с дыркой. В демке есть сравнение с Vall-e и звучат они очень похоже. В vall-e и bark тоже таргет это восстановление пропущенного участка речи по тексту и звучат они ого-го! Считаю что на сегодняшний день это самый удачный таргет. Надеюсь, работает их MEGA-TTS быстрее чем bark, потому что Барк медленный как британское консульство.
https://mega-tts.github.io/demo-page/
https://arxiv.org/abs/2306.03509
https://arxiv.org/abs/2302.12391v3
У Корейцев там система туда-сюда. Инкрементальное улучшение над VITS. Странно что назвали её PITS, а не TITS.
А вот китайцы докинули энкодеров в систему и получили что-то очень естественно звучащее. Причём, они обучали систему восстанавливать участок речи по тексту и спектрограмме с дыркой. В демке есть сравнение с Vall-e и звучат они очень похоже. В vall-e и bark тоже таргет это восстановление пропущенного участка речи по тексту и звучат они ого-го! Считаю что на сегодняшний день это самый удачный таргет. Надеюсь, работает их MEGA-TTS быстрее чем bark, потому что Барк медленный как британское консульство.
https://mega-tts.github.io/demo-page/
https://arxiv.org/abs/2306.03509
https://arxiv.org/abs/2302.12391v3
👍4
Оказывается, grammarly тоже выпускает модельки. Вот модель по исправлению ошибок в английском языке
https://huggingface.co/grammarly/coedit-large
https://huggingface.co/grammarly/coedit-large
👍4
Сегодня мы запускаем LangSwap.app на ProductHunt! Это новая платформа для перевода видео, которая позволяет создавать видео на любом языке и автоматически переводить их на несколько языков.
Вот как работает LangSwap:
1. Сначала вам нужно найти видео, которое вы хотите посмотреть. Вы можете скопировать ссылку с YouTube или загрузить его со своего компьютера.
2. Наш сервис переведет ваше видео в течение нескольких минут. LangSwap поддерживает перевод с 10 языков: французский, немецкий, испанский, итальянский, японский, китайский, голландский, русский и португальский.
3. LangSwap автоматически переведет видео для вас. Перевод обычно очень точный и часто лучше, чем субтитры, которые можно найти на других платформах.
Я создал LangSwap, потому что локализация конетнта - это серьезное препятствием для достижения глобального охвата. Я хочу облегчить создателям видео доступ к глобальной аудитории, независимо от их родного языка.
В настоящее время платформа позволяет переводить только первую минуту видео. Но мы постоянно совершенствуем приложение и добавляем новые функции, так что следите за новостями!
Пожалуйста, заходите на ProductHunt, переходите на сайт, пользуйтесь им и жмите upvote. Помогите распространить этот пост и отправьте его друзьям, если вам понравилось 🙂
Илюша
https://www.producthunt.com/posts/langswap-app-a-video-translator-tool
Вот как работает LangSwap:
1. Сначала вам нужно найти видео, которое вы хотите посмотреть. Вы можете скопировать ссылку с YouTube или загрузить его со своего компьютера.
2. Наш сервис переведет ваше видео в течение нескольких минут. LangSwap поддерживает перевод с 10 языков: французский, немецкий, испанский, итальянский, японский, китайский, голландский, русский и португальский.
3. LangSwap автоматически переведет видео для вас. Перевод обычно очень точный и часто лучше, чем субтитры, которые можно найти на других платформах.
Я создал LangSwap, потому что локализация конетнта - это серьезное препятствием для достижения глобального охвата. Я хочу облегчить создателям видео доступ к глобальной аудитории, независимо от их родного языка.
В настоящее время платформа позволяет переводить только первую минуту видео. Но мы постоянно совершенствуем приложение и добавляем новые функции, так что следите за новостями!
Пожалуйста, заходите на ProductHunt, переходите на сайт, пользуйтесь им и жмите upvote. Помогите распространить этот пост и отправьте его друзьям, если вам понравилось 🙂
Илюша
https://www.producthunt.com/posts/langswap-app-a-video-translator-tool
Product Hunt
Langswap.app - a video translator tool: Translate your videos into English in just a few clicks | Product Hunt
A video localization tool that helps content creators reach global audiences. With our Speech recognition and Voice Cloning technologies, you can translate and voiceover your videos in minutes, without hiring a voice actor.
🔥7🦄1
Voice stuff pinned «Сегодня мы запускаем LangSwap.app на ProductHunt! Это новая платформа для перевода видео, которая позволяет создавать видео на любом языке и автоматически переводить их на несколько языков. Вот как работает LangSwap: 1. Сначала вам нужно найти видео, которое…»
Есть такой разделитель предложений, nltk.sent_tokenize() Многие наверняка использовали его, если работали с текстами.
Сегодня я узнал, что несмотря на то, что алгоритм написан в далёком 2006, он является обучаемым! То есть, там не просто правила мол
“если точка, то разделять”
“если точка после Mr. , то не разделять”
Там под капотом самая настоящая математическая модель. Фичи в неё подаются, конечно, напрямую из двух правил выше. И там параметры вроде “в списке аббревиатур”, “после Mr/Ms/Col итд”, “после цифры”, частоты знаков препинания и так далее.
Ну и регулярок на 1700 строк, чтобы собрать фичи, запихнуть их в модель и обучить её. Код можете глянуть тут (но не советую)
https://github.com/nltk/nltk/blob/develop/nltk/tokenize/punkt.py
Сравните это с кодом GPT-2 (170 строк)
https://github.com/openai/gpt-2/blob/master/src/model.py
Сегодня я узнал, что несмотря на то, что алгоритм написан в далёком 2006, он является обучаемым! То есть, там не просто правила мол
“если точка, то разделять”
“если точка после Mr. , то не разделять”
Там под капотом самая настоящая математическая модель. Фичи в неё подаются, конечно, напрямую из двух правил выше. И там параметры вроде “в списке аббревиатур”, “после Mr/Ms/Col итд”, “после цифры”, частоты знаков препинания и так далее.
Ну и регулярок на 1700 строк, чтобы собрать фичи, запихнуть их в модель и обучить её. Код можете глянуть тут (но не советую)
https://github.com/nltk/nltk/blob/develop/nltk/tokenize/punkt.py
Сравните это с кодом GPT-2 (170 строк)
https://github.com/openai/gpt-2/blob/master/src/model.py
GitHub
nltk/nltk/tokenize/punkt.py at develop · nltk/nltk
NLTK Source. Contribute to nltk/nltk development by creating an account on GitHub.
👍3
Forwarded from Сиолошная
Introducing English as the New Programming Language for Apache Spark
Новость с громким заголовком, в то же время ознаменовавшая, на мой взгляд, следующую большую эпоху в мире разработки.
Databricks, компания, основанная разработчиком Spark (Matei Zaharia, писал тут) и лидирующая на рынке предоставления облачных кластеров для обработки данных, интегрировала новую фичу: запросы на английском. Теперь не нужно вспоминать синтаксис и особенности обработки данных конкретной библиотекой, можно написать простой запрос на естественном языке, а он уже сам трансформируется в чтение тех или иных баз данных.
Это киллер фича для аналитики, потому что теперь даже 10 минут на составление запроса (и 20 — на копании в сотне страниц документации с описанием тысяч таблиц) не нужно тратить: нужно лишь добавить пару деталей к оригинальному запросу от менеджера, и всё!
Разработчики пошли ещё дальше, и прикрутили Copilot, который "угадывает" функции по описанию. Скажем, вам нужно сделать что-то необычное сверху данных. Обычно разработчик формирует UDF (user defined function), и затем её применяет. Теперь можно задать лишь сигнатуру (какие колонки принимает, какие возвращает как результат), написать строчку описания — и готово.
Подобные магические движки были и раньше, но тут совершенно другой уровень. Во-первых, у Databricks нереальное количество данных для создания наилучшей модели, тесно интегрированной со схемой данных, с их хранилищем. Во-вторых, это выход сразу на огромный рынок с реальными потребителями, которые уже платят. В-третьих, всё же технологии за последние 8 месяцев очень развились, и такой же инструмент год назад скорее всего не работал в комплексных запросах в половине случаев.
Теперь ждём совмещения вакансий Data Analyst, BI Engineer и Product Manager!
UPD: самое главное, как мне видится, это возможность модели "читать" данные и интерпретировать содержание баз данных, а также схему данных. Если каждую таблицу описывать человеческими словами, а каждую колонку подкреплять однострочным осмысленным предложением, то я не вижу, почему машина не сможет составлять грамотные запросы, которые в 99.5% случаев верны.
Новость с громким заголовком, в то же время ознаменовавшая, на мой взгляд, следующую большую эпоху в мире разработки.
Databricks, компания, основанная разработчиком Spark (Matei Zaharia, писал тут) и лидирующая на рынке предоставления облачных кластеров для обработки данных, интегрировала новую фичу: запросы на английском. Теперь не нужно вспоминать синтаксис и особенности обработки данных конкретной библиотекой, можно написать простой запрос на естественном языке, а он уже сам трансформируется в чтение тех или иных баз данных.
Это киллер фича для аналитики, потому что теперь даже 10 минут на составление запроса (и 20 — на копании в сотне страниц документации с описанием тысяч таблиц) не нужно тратить: нужно лишь добавить пару деталей к оригинальному запросу от менеджера, и всё!
Разработчики пошли ещё дальше, и прикрутили Copilot, который "угадывает" функции по описанию. Скажем, вам нужно сделать что-то необычное сверху данных. Обычно разработчик формирует UDF (user defined function), и затем её применяет. Теперь можно задать лишь сигнатуру (какие колонки принимает, какие возвращает как результат), написать строчку описания — и готово.
Подобные магические движки были и раньше, но тут совершенно другой уровень. Во-первых, у Databricks нереальное количество данных для создания наилучшей модели, тесно интегрированной со схемой данных, с их хранилищем. Во-вторых, это выход сразу на огромный рынок с реальными потребителями, которые уже платят. В-третьих, всё же технологии за последние 8 месяцев очень развились, и такой же инструмент год назад скорее всего не работал в комплексных запросах в половине случаев.
Теперь ждём совмещения вакансий Data Analyst, BI Engineer и Product Manager!
UPD: самое главное, как мне видится, это возможность модели "читать" данные и интерпретировать содержание баз данных, а также схему данных. Если каждую таблицу описывать человеческими словами, а каждую колонку подкреплять однострочным осмысленным предложением, то я не вижу, почему машина не сможет составлять грамотные запросы, которые в 99.5% случаев верны.
🔥1
В следующую субботу я выступаю на конференции ProIT фест. Моя тема доклада это Zero-shit learning. Буду рассказывать как мы научили свой синтез речи говорить вообще любым голосом. Бизнес-тайн там не будет, скорее расскажу как устроены такие системы и почему работают.
Приходите послушать! В комментах можете попросить какие-нибудь темы раскрыть.
https://proitfest.ru/8-sat/
Приходите послушать! В комментах можете попросить какие-нибудь темы раскрыть.
https://proitfest.ru/8-sat/
👍7🔥4
Forwarded from Сергей Марков: машинное обучение, искусство и шитпостинг
Есть ещё над чем поработать...
😁2😢2👍1
Собеседуюсь такой в Яндекс, решаю задачки. Решаю четвёртую задачку и уже почти до ответа довожу. За 10 минут до конца:
Интервьюер: Вот там у вас невозможно решить будет задачку с использованием dict(), нужно будет set() сделать.
Я: Да как же. Всё норм, не? Проверяю, через set решение просто добавляет времени и не решает ни одну из проблем.
Интервьюер: Да через dict вы ещё долго будете решение думать, через set() норм.
Время заканчивается и интерьюер пишет правильное решение через что? Правильно, через dict()
Интервьюер: Вот там у вас невозможно решить будет задачку с использованием dict(), нужно будет set() сделать.
Я: Да как же. Всё норм, не? Проверяю, через set решение просто добавляет времени и не решает ни одну из проблем.
Интервьюер: Да через dict вы ещё долго будете решение думать, через set() норм.
Время заканчивается и интерьюер пишет правильное решение через что? Правильно, через dict()
🥴10🔥2😁1