Кто-нибудь когда-нибудь парсил таблички из PDF файлов?
Недавно столкнулся с такой необходимостью, аж подприфигел с напряга. Это был наверное самый сложный прецедент для парсинга завсю мою все мое существование.
Думал, щас на пофиг вкачусь, выдерну голенький текст из файла и пройдусь регулярками. Ага, настолько путь в никуда, что даже и браться наверное не стоило (понял это примерно на 15-ой регулярке, т.к. набор столбцов у записей разный и формально под каждый тип строк нужна своя регулярка). В один момент даже OCR хотел подрубать.
В итоге решил проблемку по другому, правда пришлось распарсивать набор сущностей в PDF'ке. Размер страницы у PDF документов фиксированный, поэтому у каждого элемента на странице есть свои координаты.
Благо ширина столбцов в таблицах одинаковая, поэтому вывез чисто за счет смещений по X.
Недавно столкнулся с такой необходимостью, аж подприфигел с напряга. Это был наверное самый сложный прецедент для парсинга за
Думал, щас на пофиг вкачусь, выдерну голенький текст из файла и пройдусь регулярками. Ага, настолько путь в никуда, что даже и браться наверное не стоило (понял это примерно на 15-ой регулярке, т.к. набор столбцов у записей разный и формально под каждый тип строк нужна своя регулярка). В один момент даже OCR хотел подрубать.
В итоге решил проблемку по другому, правда пришлось распарсивать набор сущностей в PDF'ке. Размер страницы у PDF документов фиксированный, поэтому у каждого элемента на странице есть свои координаты.
Благо ширина столбцов в таблицах одинаковая, поэтому вывез чисто за счет смещений по X.
🤯382 102🤓48👍41🗿14🌚7🍌6🍓3💘3❤🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
❤640 554😁338 151🗿65🍌58🌚29👍13😍10⚡3
Мониторю новости, на тему опенсурса в сфере обучения языковых моделей. И наткнулся на вот-вот только свеже-релизнутое решение, которое разработали и выложили в опенсорс челы из яндекса.
Вообще, насколько мне известно, проблема в обучении моделек, как раз таки лежит в правильной нагрузке ГПУ. Обычно используются не все вычислительные возможности устройства, из-за чего весь процесс обучения может затянуться.
Эта темка позволяет значительно ускорить сам процесс обучения и тратить меньше памяти ГПУ. Она оптимизирует коммуникации между ГПУ, плюс упрощает и ускоряет сам процесс разбивки данных для параллельных вычислений.
В общем, надо детальнее раскурить, а пока авансом влепливаем звездочку на репозиторий🥂
Репозиторий проекта: https://github.com/yandex/YaFSDP
Это ж пипец как круто. Только представь какое токсичное болото можно натренировать на данных из двача, линуксорга и ру-язычного стэковерфлоу.
Вообще, насколько мне известно, проблема в обучении моделек, как раз таки лежит в правильной нагрузке ГПУ. Обычно используются не все вычислительные возможности устройства, из-за чего весь процесс обучения может затянуться.
Эта темка позволяет значительно ускорить сам процесс обучения и тратить меньше памяти ГПУ. Она оптимизирует коммуникации между ГПУ, плюс упрощает и ускоряет сам процесс разбивки данных для параллельных вычислений.
В общем, надо детальнее раскурить, а пока авансом влепливаем звездочку на репозиторий
Репозиторий проекта: https://github.com/yandex/YaFSDP
Please open Telegram to view this post
VIEW IN TELEGRAM
👍142😁25🤣16🍌13😐12🤔7🗿6💅5🤩3🎅2
👉 Новое видео на канале: https://youtu.be/D-UO79JDaQc
P.S.
Ну и если я какой-то текст дочитываю до конца, то никогда не поленюсь поставить лайк и в комменте написать что-то типа: "Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще?"
P.S.
Ну и если я какой-то текст дочитываю до конца, то никогда не поленюсь поставить лайк и в комменте написать что-то типа: "Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще?"
YouTube
Решение глобальной проблемы программирования
Erid: 2VtzquciLz2 | Начните учиться «Data Science» бесплатно в Яндекс Практикуме: https://ya.cc/t/ewr-05Fd586vmj
---
Подпишись на наш Telegram Канал 🖤 https://t.iss.one/extremecode
Лицензия Creative Commons Attribution 4.0 на использование трека Hyperfun (исполнитель:…
---
Подпишись на наш Telegram Канал 🖤 https://t.iss.one/extremecode
Лицензия Creative Commons Attribution 4.0 на использование трека Hyperfun (исполнитель:…
👍127❤24😐14💅6😁5🤓4🗿3🔥1🤔1🥴1
Наткнулся на интересный пост с интересным исследованием, в котором утверждается, что с момента выхода ChatGPT, фриланс заказы:
– на написание кода и текста упали на 21%
– SMM услуги упали на 13%
– Заказы на графический дизайн и 3D-дизайн упали на 17%
Обожаю статистические исследования, ведь в них так просто выдавать желаемый результат за действительный.
Совершенно очевидно, и конечно же, абсолютно объективно, что сокращение заказов в этих категориях связанно только с появлением "ИИ", а ни в коем случае не с
1. Продолжающимися массовыми сокращениями персонала в мировой айтишечке (известна статистика только по кадровым сотрудникам. Не забываем, что к работе в том числе активно привлекаются аусторсеры, которые часто обитают на фриланс биржах и сами фрилансеры)
2. В целом сокращающейся тенденцией на спрос услуг в данных категориях, в связи с сильнейшей перегретостью срыночка в ковидные времена.
3. Геополитикой последних лет и санкционной политикой.
4. Снижением инвестиционной активности.
Могу продолжать еще бесконечно долго, но короче, я вам тут не этот. Думайте.
– на написание кода и текста упали на 21%
– SMM услуги упали на 13%
– Заказы на графический дизайн и 3D-дизайн упали на 17%
Обожаю статистические исследования, ведь в них так просто выдавать желаемый результат за действительный.
Совершенно очевидно, и конечно же, абсолютно объективно, что сокращение заказов в этих категориях связанно только с появлением "ИИ", а ни в коем случае не с
1. Продолжающимися массовыми сокращениями персонала в мировой айтишечке (известна статистика только по кадровым сотрудникам. Не забываем, что к работе в том числе активно привлекаются аусторсеры, которые часто обитают на фриланс биржах и сами фрилансеры)
2. В целом сокращающейся тенденцией на спрос услуг в данных категориях, в связи с сильнейшей перегретостью срыночка в ковидные времена.
3. Геополитикой последних лет и санкционной политикой.
4. Снижением инвестиционной активности.
Могу продолжать еще бесконечно долго, но короче, я вам тут не этот. Думайте.
🤔291 173👍53🤓15❤8🤝6💅5❤🔥2👏2😁2
Грёбаные говноеды на разрабах, как же заебали. Никак они блядь не научаться, дай им волю переименовывать переменные, будут их переименовывать до посинения.
Обновил тут значит n8n до актуальной версии, естественно после апдейта само оно не завелось, а все почему? Да потому что ушлёпки решили попереименовывать переменные окружения, действительно, почему бы и нет.
Ведь очевидно, что разница между "WEBHOOK_TUNNEL_URL" и "WEBHOOK_URL" прям серьезная и стоит того, чтобы сломать нахрен обратную совместимость после апдейта.
Жопа горит
Обновил тут значит n8n до актуальной версии, естественно после апдейта само оно не завелось, а все почему? Да потому что ушлёпки решили попереименовывать переменные окружения, действительно, почему бы и нет.
Ведь очевидно, что разница между "WEBHOOK_TUNNEL_URL" и "WEBHOOK_URL" прям серьезная и стоит того, чтобы сломать нахрен обратную совместимость после апдейта.
Жопа горит
🤣621 220👍43❤32🔥27🤯16🌚12💅11😁9👨💻8
👉 Новое видео на канале: https://youtu.be/azek-2NIh7U
P.S.
Ну и если я какой-то текст дочитываю до конца, то никогда не поленюсь поставить лайк и в комменте написать что-то типа: "Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще?"
P.S.
Ну и если я какой-то текст дочитываю до конца, то никогда не поленюсь поставить лайк и в комменте написать что-то типа: "Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще?"
YouTube
Кризис АйТи уже здесь
---
Подпишись на наш Telegram Канал 🖤 https://t.iss.one/extremecode
The Saga by Karl Casey @ White Bat Audio // https://www.youtube.com/watch?v=nUXu2iJPxyI
Подпишись на наш Telegram Канал 🖤 https://t.iss.one/extremecode
The Saga by Karl Casey @ White Bat Audio // https://www.youtube.com/watch?v=nUXu2iJPxyI
🔥132👍31🫡7🤔6🤣6❤5😢5😐4 4🎅3
В общем, походил я на собеседования и пришёл с докладом, что там у нас на рыночке.
Оставлено 50 откликов (25 из которых были просмотрены, а 25 отправлены в архив и не отвечены). Получено 4 тестовых задания.
6 собеседований пройдено.
Из них:
2 собеседования провалены в нулину
> Самое первое, из-за самоуверенности не подготовился
> В место куда очень хотелось пройти собес. Провален из-за волнения.
2 собеседования развалены в нулину, но офферы по ним не получены по причине "overqualified". (Читай: слишком дохуя попросил).
2 полученных оффера.
Отклики были на вакансии: Middle / Middle+ / Senior Фронтенд.
Рыночек ещё живой. Выводы делайте сами.
Оставлено 50 откликов (25 из которых были просмотрены, а 25 отправлены в архив и не отвечены). Получено 4 тестовых задания.
6 собеседований пройдено.
Из них:
2 собеседования провалены в нулину
> Самое первое, из-за самоуверенности не подготовился
> В место куда очень хотелось пройти собес. Провален из-за волнения.
2 собеседования развалены в нулину, но офферы по ним не получены по причине "overqualified". (Читай: слишком дохуя попросил).
2 полученных оффера.
Отклики были на вакансии: Middle / Middle+ / Senior Фронтенд.
Рыночек ещё живой. Выводы делайте сами.
👍414 201🌭34❤11🦄10🍌8🔥3🤯3🤩3😢2
👉 Новое видео на канале: https://youtu.be/7TPBmcptPUc
P.S.
Ну и если я какой-то текст дочитываю до конца, то никогда не поленюсь поставить лайк и в комменте написать что-то типа: "Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще?"
P.S.
Ну и если я какой-то текст дочитываю до конца, то никогда не поленюсь поставить лайк и в комменте написать что-то типа: "Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик! Можно вот этого вот почаще?"
YouTube
Гайд по открутке опыта
Erid: 2VtzqvvSgSt | Грейд от Яндекс Практикума. Запишитесь на бесплатную консультацию по корпоративному обучению и получите 2 недели доступа —
https://ya.cc/t/aQVpCdCp5BAZgL
---
Подпишись на наш Telegram Канал 🖤 https://t.iss.one/extremecode
Music:
Bihler -…
https://ya.cc/t/aQVpCdCp5BAZgL
---
Подпишись на наш Telegram Канал 🖤 https://t.iss.one/extremecode
Music:
Bihler -…
❤98👍29🗿18🥴11🌭3🍌3🦄3❤🔥1🎄1💅1
Аррряяя, вот вы все ноете про опыт работы, который требуется для успешного устройства на шлюпку мечты. Типа хорошо когда ты прожженый опытом мидл, залетел на 5 собесов, прошел/завалил часть, получил в итоге парочку офферов и сидишь бурчишь довольный.
Вы походу забыли про базу — если опыта нет, то его нужно получить ЛЮБЫМ СПОСОБОМ, чтобы как минимум иметь предмет обсуждения с собеседующими тебя сеньерами помидорами. Один из самых доступных всем способов — разработка собственного ПЕТ ПРОЕКТА.
Михаил Табунов сделал про это телеграм канал Твой пет проект, в котором пишет для разработчиков и менеджеров про свой опыт – где брать идею, что надо знать про маркетинг, как запускать и искать первые 10 клиентов, и многое другое.
Попрошу заметить, там годнота не только про поиск идеи и ее реализации, но и про то, как можно довести собственный проект до заработка. Так, что советую взять на заметочку и самим мидлам/сеньерам, вдруг повезет реализовать качественный продукт, который может перерасти в стартап.
В общем, подписывайтесь и думайте.
Реклама, ИП Табунов Михаил Валерьевич, ИНН 773379585100
Вы походу забыли про базу — если опыта нет, то его нужно получить ЛЮБЫМ СПОСОБОМ, чтобы как минимум иметь предмет обсуждения с собеседующими тебя сеньерами помидорами. Один из самых доступных всем способов — разработка собственного ПЕТ ПРОЕКТА.
Михаил Табунов сделал про это телеграм канал Твой пет проект, в котором пишет для разработчиков и менеджеров про свой опыт – где брать идею, что надо знать про маркетинг, как запускать и искать первые 10 клиентов, и многое другое.
Попрошу заметить, там годнота не только про поиск идеи и ее реализации, но и про то, как можно довести собственный проект до заработка. Так, что советую взять на заметочку и самим мидлам/сеньерам, вдруг повезет реализовать качественный продукт, который может перерасти в стартап.
В общем, подписывайтесь и думайте.
Реклама, ИП Табунов Михаил Валерьевич, ИНН 773379585100
🤣314 72👍26🗿17💅14🤨9🤓8❤7🫡5🤔1
Чем больше освещается эта проблема, тем быстрее на нее обратят внимание и предпримут какие-то телодвижения по этому поводу или нет? 🥂
На самом деле я знаю решение:Нужно просто заменить ХРюш, чятомжопотэ. Все таки разбирать тысячи хуево написанных резюме ИИ уже может, а вот код писать нормально — нет.
На самом деле я знаю решение:
Please open Telegram to view this post
VIEW IN TELEGRAM
👍248🤓40😁29 22🤔5🗿5💯4❤3🌭3
Ты лодку то не раскачивай.
Все хотят 300К в наносек. Вы не избранные, кто родился на 5 лет раньше и залетел в айтишечку с нулевым опытом
В смысле не избранные. Я кибер-прирожденный, с 14-и лет значит, глаза кодом выжигаю. Второго админа вообще с 6-и лет на секцию по олимпиадному программированию сдали. Так-что мы по праву имеем свое преимущество.
То, что вы поздно вкатываетесь в айтишечку, это сугубо ваши проблемы
Please open Telegram to view this post
VIEW IN TELEGRAM
https://youtu.be/lG5mB6o4238?si=1Y8SOkT17pEKTrqN
Нашёл свой старый видосик, стакающийся с темой прошлого видео. Ваше мнение?
Нашёл свой старый видосик, стакающийся с темой прошлого видео. Ваше мнение?
YouTube
Способ вкатиться в АйТи
Курс “Профессия Java-разработчик” от Skillbox — https://clck.ru/32cZ27 . Черная пятница: скидки до 60%
Подпишись на наш Telegram Канал 🖤 https://t.iss.one/extremecode
________________________________
Лицензия Creative Commons Attribution 4.0 на использование…
Подпишись на наш Telegram Канал 🖤 https://t.iss.one/extremecode
________________________________
Лицензия Creative Commons Attribution 4.0 на использование…
🤓79 29 6❤4🤨3😈3👍2💅2
Зашёл в Чайхону за шаурмой, а тут люди архитектуру обсуждают.
👍167😁56🤓11🆒8❤7🤔3
Forwarded from Програмысли - Михаил Фленов
This media is not supported in your browser
VIEW IN TELEGRAM
🔥623😁165👍30❤28🤓27🗿15 11👀8💘2🍌1
The ExtremeCode Times
👉 Новое видео на канале: https://youtu.be/7TPBmcptPUc P.S. Ну и если я какой-то текст дочитываю до конца, то никогда не поленюсь поставить лайк и в комменте написать что-то типа: "Братан, хорош, давай, давай, вперёд! Контент в кайф, можно ещё? Вообще красавчик!…
Мышление айти масленка:
— Мням-с, пук, ну я накрутю немножечко опыту, чтобы госпожа на хре заметила мое резюме(9, иначе вообще в айтишечку не попасть никак(9
Мышление айти гигачада:
— Обучался 5 лет в техническом ВУЗе, совмещал это теоретическое обучение с основной работой, мой мозг наполнен огромным объемом теоретического материала, подкрепленного практическими навыками. Всё это позволяло мне решать задачи максимально эффективно и производительно. Пока ты накручиваешь опыт в своем никчемном резюме, я таких чудищ рефакторил, о которых тебе даже представить немыслимо. Я настолько уверен в своих навыках, что в свое время даже крипто алгоритмы на ванильном джаваскрипте реализовывал, просто потому что я могу это сделать. Я супер айтишник, ну а ты бездипломник продолжай дальше искать оправдания своей безграмотности 🤡🤡🤡
— Мням-с, пук, ну я накрутю немножечко опыту, чтобы госпожа на хре заметила мое резюме(9, иначе вообще в айтишечку не попасть никак(9
Мышление айти гигачада:
— Обучался 5 лет в техническом ВУЗе, совмещал это теоретическое обучение с основной работой, мой мозг наполнен огромным объемом теоретического материала, подкрепленного практическими навыками. Всё это позволяло мне решать задачи максимально эффективно и производительно. Пока ты накручиваешь опыт в своем никчемном резюме, я таких чудищ рефакторил, о которых тебе даже представить немыслимо. Я настолько уверен в своих навыках, что в свое время даже крипто алгоритмы на ванильном джаваскрипте реализовывал, просто потому что я могу это сделать. Я супер айтишник, ну а ты бездипломник продолжай дальше искать оправдания своей безграмотности 🤡🤡🤡
👍591🥴156😁57🦄21🤔19🌭16💯14👀14🤯9❤6
Руки прочь от моего черничного смузи! Вкатуны-омежки должны пиздовать на биржу труда, чтобы демпинговать по рабочим специальностям. А то там такая зарплатная инфляция, что я скоро перестану ощущать себя полубогом со своими 400к/мес. Требую, чтобы они бросили свои бесполезные попытки вкатиться. Во-первых, это поднимет на какой-то период времени рейты по рекламе, во-вторых, это даст вдохнуть спокойно и лутануть наконец-то 500к/мес. А то заебали - нарисуют себя опыта, и пытаются пролезть туда, где им не место. Доколе?!
Знаете чем отличается крутой чел, за которого работают нейросетки от чмошника, которого нейросети заменят? Первые умеют составлять запросы для нейросетей и заставляют их делать всё что они хотят. Да, конечно, в случае восстания машин, они и огребут первые, но сейчас их навыки востребованы. Есть даже профессия с маленькой конкуренцией и большим потенциалом - промт-инженер.
А вот, кстати и эфир на тему "Промпт-инженер". На ней вам расскажут:
— Кто такой промт-инженер и чем он занимается;
— Как интегрировать скиллы промт-инжинеринга в работу, если вы работаете в IT;
— Кому в действительности нужны его услуги и какие результаты это даст;
— Сколько платят промт-инженеру в России и мире;
— Кто может стать промт-инженером и какой порог входа;
А ну ка, кликай на ссылку и забирай подробную информацию вместе с классными бонусами.
👇👇👇
Ссылка
А вот, кстати и эфир на тему "Промпт-инженер". На ней вам расскажут:
— Кто такой промт-инженер и чем он занимается;
— Как интегрировать скиллы промт-инжинеринга в работу, если вы работаете в IT;
— Кому в действительности нужны его услуги и какие результаты это даст;
— Сколько платят промт-инженеру в России и мире;
— Кто может стать промт-инженером и какой порог входа;
А ну ка, кликай на ссылку и забирай подробную информацию вместе с классными бонусами.
👇👇👇
Ссылка
😐481🥴177🗿77🍌29💅20😁18🤓11🤩5❤3💋2