Технокейс о том, как настроить сбор данных с сайта в Google Таблицу без плагинов, используя только штатные функции.
В моём варианте таблица время от времени забирает количество подписчиков со страниц избранных каналов на TGStat (чтобы удобнее сравнивать из одного окна).
Код
— ЗНАЧЕН — преобразует любые данные, поддерживаемые Google Таблицами, в число;
— REGEXREPLACE — заменяет часть строки на другой текст с помощью регулярного выражения.;
— REGEXEXTRACT — извлекает определенную часть текста, соответствующую регулярному выражению.;
— IMPORTXML — импорт данных из источников в формате XML, HTML, CSV, TSV, а также RSS и ATOM XML. В моём случае — формат HTML, функция указывает место на странице из ячейки G20 с помощью атрибута @class='tgme_page_extra' (т.е. html-элемент с css-классом tgme_page_extra). Соответственно, для вашей страницы указываем другое место, которое находится с помощью инструментов разработчика в браузере.
"\d\d\s\d\d\d" — регулярное выражение, указывающее примерный шаблон числа подписчиков (число из 5 цифр с одним пробелом). Для каналов с другим диапазоном нужно другое регулярное выражение (это ничего страшного, каналы не так часто переходят границы диапазона).
Я потратил на конструирование скрипта много времени, пользуйтесь)
Единственное неудобство — когда таких скриптов много в одной таблице, скрэпинг начинает серьёзно тормозить.
#кейс #IT #программирование
В моём варианте таблица время от времени забирает количество подписчиков со страниц избранных каналов на TGStat (чтобы удобнее сравнивать из одного окна).
Код
=ЗНАЧЕН(REGEXREPLACE(REGEXEXTRACT(IMPORTXML(G20; "//div[@class='tgme_page_extra']"); "\d\d\s\d\d\d"); "\s"; ""))Что есть что? В коде вы можете увидеть несколько вложенных друг в друга функций:
— ЗНАЧЕН — преобразует любые данные, поддерживаемые Google Таблицами, в число;
— REGEXREPLACE — заменяет часть строки на другой текст с помощью регулярного выражения.;
— REGEXEXTRACT — извлекает определенную часть текста, соответствующую регулярному выражению.;
— IMPORTXML — импорт данных из источников в формате XML, HTML, CSV, TSV, а также RSS и ATOM XML. В моём случае — формат HTML, функция указывает место на странице из ячейки G20 с помощью атрибута @class='tgme_page_extra' (т.е. html-элемент с css-классом tgme_page_extra). Соответственно, для вашей страницы указываем другое место, которое находится с помощью инструментов разработчика в браузере.
"\d\d\s\d\d\d" — регулярное выражение, указывающее примерный шаблон числа подписчиков (число из 5 цифр с одним пробелом). Для каналов с другим диапазоном нужно другое регулярное выражение (это ничего страшного, каналы не так часто переходят границы диапазона).
Я потратил на конструирование скрипта много времени, пользуйтесь)
Единственное неудобство — когда таких скриптов много в одной таблице, скрэпинг начинает серьёзно тормозить.
#кейс #IT #программирование
Коллега говорит, что от коронавируса помогает пурген, но я ему не верю (больно моська хитрая). Зато верю данным ресурсам:
— коронавирусный портал ВОЗ (доступен на русском);
— коронавирусный портал университета Джона Хопкинса;
— официальный портал Правительства РФ СтопКоронавирус (и, в частности, его Telegram-канал);
— официальная страница «Меры Правительства по борьбе с коронавирусной инфекцией»;
— коронавирусный портал на сайте Минздрава РФ;
— коронавирусный ликбез на Госуслугах;
— коронавирусный портал Правительства Москвы;
— коронавирусная статистика от Яндекса (также отдельный подпортал открывается в результатах поиска);
— коронавирусная вкладка на Яндекс Новостях;
— коронавирусный портал Google (также отдельный подпортал открывается в результатах поиска);
— коронавирусные вкладки на Google Новостях: раз и два;
— подтверждённый Telegram-канал Corona со списком официальных каналов по разным странам;
— коронавирусный центр информации на Facebook;
— коронавирусная страничка Вконтакте.
В случае новостей, естественно, нужно смотреть на авторитетность издания.
#подборка #коронавирус #статистика #фейки #Facebook #Google #Яндекс #Вконтакте
— коронавирусный портал ВОЗ (доступен на русском);
— коронавирусный портал университета Джона Хопкинса;
— официальный портал Правительства РФ СтопКоронавирус (и, в частности, его Telegram-канал);
— официальная страница «Меры Правительства по борьбе с коронавирусной инфекцией»;
— коронавирусный портал на сайте Минздрава РФ;
— коронавирусный ликбез на Госуслугах;
— коронавирусный портал Правительства Москвы;
— коронавирусная статистика от Яндекса (также отдельный подпортал открывается в результатах поиска);
— коронавирусная вкладка на Яндекс Новостях;
— коронавирусный портал Google (также отдельный подпортал открывается в результатах поиска);
— коронавирусные вкладки на Google Новостях: раз и два;
— подтверждённый Telegram-канал Corona со списком официальных каналов по разным странам;
— коронавирусный центр информации на Facebook;
— коронавирусная страничка Вконтакте.
В случае новостей, естественно, нужно смотреть на авторитетность издания.
#подборка #коронавирус #статистика #фейки #Facebook #Google #Яндекс #Вконтакте
Ого, оказывается ВОЗ правда это советует!
(Шучу, на самом деле нет. Открываете инструменты разработчика, и можно изменить любой текст на странице. Это к слову о том, насколько легко делаются фейки.)
#IT #программирование #фейки
(Шучу, на самом деле нет. Открываете инструменты разработчика, и можно изменить любой текст на странице. Это к слову о том, насколько легко делаются фейки.)
#IT #программирование #фейки
Во вчерашней колонке на IJNet Элизабет Стойчефф предлагает 4 совета по защите себя от дезинформации. Разбираем по пунктам.
1. Сами ищите новости о политике, чтобы избежать воздействия рекомендательного алгоритма технологических платформ и социальных медиа. По мнению автора, лучше пользоваться новостными приложениями и (между строк) прямыми ссылками.
2. Проверяйте приводимую в публикациях статистику на авторитетных ресурсах.
3. Учитывайте неполитические стереотипы: такие, как информация, подтверждающая ваши верования и уверенность, что видеоконтент заслуживает большего доверия, чем текстовый.
4. Узнавайте не только о национальных новостях, но также о местных и международных, и пытайтесь связать их между собой.
#теория #журналистика #дезинформация #фейки
1. Сами ищите новости о политике, чтобы избежать воздействия рекомендательного алгоритма технологических платформ и социальных медиа. По мнению автора, лучше пользоваться новостными приложениями и (между строк) прямыми ссылками.
2. Проверяйте приводимую в публикациях статистику на авторитетных ресурсах.
3. Учитывайте неполитические стереотипы: такие, как информация, подтверждающая ваши верования и уверенность, что видеоконтент заслуживает большего доверия, чем текстовый.
4. Узнавайте не только о национальных новостях, но также о местных и международных, и пытайтесь связать их между собой.
#теория #журналистика #дезинформация #фейки
Международная журналистская сеть
Советы по защите от дезинформации | Международная журналистская сеть
Возможно, вам случалось обманываться и верить распространенной кем-то дезинформации. И это не ваша вина.
Даже если потребители новостей руководствуются самыми лучшими намерениями, им непросто разобраться в лавине политической информации, которая обрушивается…
Даже если потребители новостей руководствуются самыми лучшими намерениями, им непросто разобраться в лавине политической информации, которая обрушивается…
Редакция сервиса управления соцсетями smmplanner делает нужное дело: публикует в своём блоге книгу по основам SMM. На данный момент уже 7 глав, выходит по главе в неделю.
#теория #SMM #новости
#теория #SMM #новости
SMMplanner blog
Как искать и анализировать блогеров в соцсетях
Как не слить бюджет на блогеров? Учимся работать с лидерами мнений в соцсетях.
Любопытно, что телевизионщики всегда делают себе пафосные автомобили, обклеенные со всех сторон, чтобы ну все вот увидели, кто едет))
Это какой-то общий тренд. Я вот не припомню, чтобы так же делали их коллеги по профессии: новостные интернет-порталы или, там, рекламные агентства👆
#наблюдения #работа #медиа #журналистика
Это какой-то общий тренд. Я вот не припомню, чтобы так же делали их коллеги по профессии: новостные интернет-порталы или, там, рекламные агентства👆
#наблюдения #работа #медиа #журналистика
Подходит к завершению мой анализ #БольшиеМедиа, посвящённый деятельности Агентства США по глобальным медиа.
Предыдущие четыре части:
— часть 1;
— часть 2;
— часть 3;
— часть 4.
По USAGM выйдет ещё две части, потом, вероятно, придумаю ещё что-то интересное😎
Предыдущие четыре части:
— часть 1;
— часть 2;
— часть 3;
— часть 4.
По USAGM выйдет ещё две части, потом, вероятно, придумаю ещё что-то интересное😎
Telegraph
U.S. Agency for Global Media: справка, ч. 5
2. Радио Свободная Азия (Radio Free Asia, RFA). Основные характеристики подразделения: Годовой бюджет: $ 43,1 млн. Количество сотрудников: 253 Поддерживаемые языки: 9 Оценка аудитории: 50,7 миллиона человек. Руководитель — Парамешваран Поннудурай (Parameswaran…
Про сложности поиска инфоповодов
Сколько я себя помню в медиа, ситуация всегда одна и та же: для поиска внешних инфоповодов (и соответствующего контента для соцсетей) нужно прошерстить сотню источников, чтобы обойти информационный шум и найти несколько (обычно — пару) действительно интересных, подходящих и не устаревших новостей.
И это никак не меняется со временем, хотя источников становится только больше. Интересно, у всех же так?
(Иллюстрация отсюда.)
#наблюдения #работа #PR #журналистика #мемы
Сколько я себя помню в медиа, ситуация всегда одна и та же: для поиска внешних инфоповодов (и соответствующего контента для соцсетей) нужно прошерстить сотню источников, чтобы обойти информационный шум и найти несколько (обычно — пару) действительно интересных, подходящих и не устаревших новостей.
И это никак не меняется со временем, хотя источников становится только больше. Интересно, у всех же так?
(Иллюстрация отсюда.)
#наблюдения #работа #PR #журналистика #мемы
Сколько пиарщиков нужно, чтобы вкрутить лампочку?
Трое. Один продаст идею электрику, другой напишет пресс-релиз, а третий договорится с агентством.
#наблюдения #PR #мемы
Трое. Один продаст идею электрику, другой напишет пресс-релиз, а третий договорится с агентством.
#наблюдения #PR #мемы
Мой анонимный эксперт #СерыйКардинал анализирует дебаты Байдена и Трампа и то, кто же в них на самом деле выиграл.
#новости #США #выборы #политика #WashingtonPost
#новости #США #выборы #политика #WashingtonPost
Telegraph
Серый Кардинал: выпуск 30 сентября 2020
Американские выборы — царство грязи, глупости, подлости и абсолютного цинизма. Дебаты состоялись, и как всегда, ничего нового, за исключением одного, но важного фактора: это не два кандидата одной страны, это два представителя двух РАЗНЫХ стран. В преддверии…
Когда в стране и мире происходит какое-то длительное и значимое событие, находятся ушлые сеошники, которые создают анонимные аналоги порталов с официальной информацией, копируют или переписывают её и оптимизируют для поиска.
В результате такие субституты обходят в поиске официалов и сбивают людей с толку. Так было при переходе России на цифровое вещание с аналогами портала РТРС, теперь вот с коронавирусом. А знаете, зачем?
Реклама. Особенно видно по количеству заблокированных трекеров, есть включен блокировщик.
#наблюдения #SEO #реклама #коронавирус
В результате такие субституты обходят в поиске официалов и сбивают людей с толку. Так было при переходе России на цифровое вещание с аналогами портала РТРС, теперь вот с коронавирусом. А знаете, зачем?
Реклама. Особенно видно по количеству заблокированных трекеров, есть включен блокировщик.
#наблюдения #SEO #реклама #коронавирус
Понимаю огорчение, но всё-таки не могу без возражений присоединиться к критике подобных новостей, и вот почему. Новостные СМИ находятся в жёсткой ситуации конкуренции с другими изданиями и социальными сетями, и их главная задача — получать трафик.
Если что-то может зайти людям, то нужно это постить, даже если интеллектуальная ценность таких публикаций низка. Так во всём мире.
Интеллектуальное чтиво — в других рубриках (если позволяет позиционирование). Какой выход из ситуации — никто не знает.
Но и есть хорошая сторона — каждый найдёт новости себе по вкусу.
#наблюдения #журналистика #медиа
Если что-то может зайти людям, то нужно это постить, даже если интеллектуальная ценность таких публикаций низка. Так во всём мире.
Интеллектуальное чтиво — в других рубриках (если позволяет позиционирование). Какой выход из ситуации — никто не знает.
Но и есть хорошая сторона — каждый найдёт новости себе по вкусу.
#наблюдения #журналистика #медиа
К обсуждаемой сейчас новости, что Fox News использует слово «ненависть» чаще, чем MSNBC или CNN, могу добавить одно соображение из собственного опыта (как-то проводили похожее исследование): изучение сюжетов телеков — та ещё задачка и, фактически, двойная работа.
Дело в том, что это не текстовый контент, а видеоряд. Он не собирается автоматически в базы. Здесь мы не можем просто применить поиск по тексту, который является довольно типичной функцией в любом современном софте, а следовательно — просто открыть какую-нибудь Медиалогию и вбить, что нас интересует.
Конкретно в данном случае исследователи использовали транскрипции текстов сюжетов (откуда они взялись, не уточняется).
#новости #журналистика #медиа #теория #иносми #наблюдения
Дело в том, что это не текстовый контент, а видеоряд. Он не собирается автоматически в базы. Здесь мы не можем просто применить поиск по тексту, который является довольно типичной функцией в любом современном софте, а следовательно — просто открыть какую-нибудь Медиалогию и вбить, что нас интересует.
Конкретно в данном случае исследователи использовали транскрипции текстов сюжетов (откуда они взялись, не уточняется).
#новости #журналистика #медиа #теория #иносми #наблюдения
Nieman Lab
Fox News uses the word “hate” much, much more often than MSNBC or CNN
"Fox’s use of 'hate' really took off when Trump’s presidency began. Beginning in January 2017, the mean usage of 'they hate' on the network doubled."
Трудовые будни в редакции
— Коллега (парень): видит мерзкую новость про змей, ржёт, кидает другой коллеге (девушке).
— Из угла раздаётся «фуууу!».
— Я: что там? И мне!!1
— Шеф-редактор: работать начинайте! А не змей смотреть!
Строго, но любит нас на самом деле))
— Все: дальше готовим новости.
Вот таких моментов не хватало на удалёнке😀
#наблюдения #работа
— Коллега (парень): видит мерзкую новость про змей, ржёт, кидает другой коллеге (девушке).
— Из угла раздаётся «фуууу!».
— Я: что там? И мне!!1
— Шеф-редактор: работать начинайте! А не змей смотреть!
Строго, но любит нас на самом деле))
— Все: дальше готовим новости.
Вот таких моментов не хватало на удалёнке😀
#наблюдения #работа
Газета.Ru
Найдены змеи, выедающие изнутри живых жаб
Тайские змеи кукри потрошат жаб и поедают их органы, пока добыча еще жива, выяснили местные ученые из университета Раджабхат. Исследование было опубликовано в журнале Herpetozoa .