Как узнать на какой CMS сделан сайт?
Планируя создать новый сайт, вебмастера зачастую анализируют выбранную нишу и просматривают сайты конкурентов. Многие из них действительно заслуживают внимания и подражания, что вызывает желание узнать, на какой CMS они работают. Существует несколько способов определить движок сайта – используя специальные онлайн-сервисы, расширения для браузеров, а также вручную, просматривая html-код страницы и ответы сервера.
Популярные онлайн-сервисы для анализа CMS
Наиболее простой способ установить, какая система управления сайтом используется в конкретном случае, - воспользоваться одной из специализированных онлайн-площадок. В Сети можно найти множество подобных сервисов, однако не все дают точный результат.
Рассмотрим особенности трех наиболее популярных платформ для анализа CMS.
2IP/CMS
Один из старейших в Интернете онлайн-сборник различных скриптов и тулзов, полезных при работе с сайтами. В ассортименте утилиты для отображения информации об IP-адресах и браузерах, измеритель скорости подключения, определитель хостинга, проверка существования email, антивирус для файлов и многое другое. В контексте данной статьи нас интересует в первую очередь скрипт для определения CMS.
Он умеет выявлять признаки более сотни движков и по каждому из них ведёт свою статистику – для определения активного числа сайтов. Использование абсолютно бесплатное и максимально простое – достаточно указать адрес сайта или конкретной его страницы в специальном поле и дождаться результата.
Время отработки скрипта – не более пары секунд.
Помимо CMS через 2IP можно узнать массу сопутствующей информации о сайте: все домены одного владельца, все сайты на одном IP-адресе (сервере), посещаемость (при наличии счётчиков), DNS-параметры домена и др.
По каждому движку можно посмотреть исторические сведения, перейти на официальный сайт, изучить статистику в привязке к доменным зонам, узнать позицию в общем рейтинге и актуальную долю рынка.
Единственный неудобный нюанс – у 2IP нет массовых проверок (по спискам сайтов или страниц) и API. Точнее API есть, но технически это база GeoIP, движок тут не определить.
iTrack
Сервис iTrack не может похвастаться такой же обширной базой CMS, количество определяемых движков – около 80 штук. Однако в этот список входят наиболее популярные платформы, а точность проверки со слов разработчиков составляет около 90%.
iTrack специализируется на продаже лицензий Битрикс24 и обслуживании CRM, а также на ведении рейтинга самых популярных CMS в Рунете – с подсчётом статистики активных сайтов в зонах RU/РФ.
По каждому движку можно посмотреть долю рынка, число установок, историю изменений показателей и отзывы.
Базовая проверка выполняется только поштучно, но зато она полностью бесплатная. Пакетные проверки и мониторинг обсуждаются индивидуально, это уже платные услуги.
BuiltWith
Еще один сервис технического аудита, в число функций которого входит определение движка сайта и других характеристик ресурса.
Возможности сервиса BuiltWith:
- выявление подключенных систем аналитики;
- поиск используемых на сайте виджетов и плагинов;
- обнаружение фреймворков, библиотек и особых функций JavaScript;
- определение источников рекламных объявлений;
- выявление параметров хостинга, SSL-сертификатов, CDN и т.п.
Проверку отдельного сайта можно выполнить бесплатно. Платные пакеты услуг включают в себя ряд дополнительных услуг, в т.ч. поиск веб-проектов по заданным ключевым словам, сравнительный анализ конкурирующих ресурсов, создание списка сайтов по названиям компаний, составление целевых отчетов с мультифильтрацией и пр.
Наиболее интересными можно назвать разделы с открытой статистикой по ключевым веб-технологиям и скриптам. Сюда входят не только CMS, но и разные сервисы виджетов, рекламы, аналитики и пр. Данные собираются на основе 370+ млн. сайтов. Есть привязка к странам и к финансовым показателям.
Дополнительный функционал для браузеров
Для многих популярных браузеров можно найти специальные расширения, позволяющие узнать на какой CMS сделан сайт непосредственно в браузере, прямо на страницах целевого сайта. Рассмотрим несколько модулей к популярным браузерам Mozilla Firefox и Google Chrome:
- W3Techs Website Technology Information. Плагин от крупного консалтингового агентства W3Techs, которое занимается сбором аналитики по движкам и веб-технологиям. За один проход можно собрать о сайте всю самую интересную информацию – движок, используемый веб-сервер и хостинг, язык программирования, системы аналитики, CDN-сервис, веб-почту, сторонние виджеты и ротаторы рекламы, расположение, наличие элементов микроразметки и пр. Всё бесплатно и весьма точно. В наличии также плагин для Firefox.
- CMS Checker. Простое, но функциональное расширение для Google Chrome (для других браузеров плагина нет и не планируется). Умеет определять CMS, JS-библиотеки и фреймворки, системы аналитики, шрифты и иконки, социальные кнопки и виджеты, актуальные форматы микроразметки. Отчёт формируется человеческим языком, для него можно выбрать перевод на русский. Всё бесплатно.
- WhatRuns. Расширение для Google Chrome и Firefox. Распространяется бесплатно, но для отслеживания конкретных сайтов на постоянной основе требует регистрации. Без авторизации тоже даёт немало полезных данных: движок, веб-фреймворки, виджеты онлайн-коммерции, системы кеширования, аналитики, рекламы и пр. Всё максимально сжато и со ссылками на официальные сайты. Отдельного внимания стоят ссылки на страницы со статистикой по конкретному объекту (веб-технологии). На них можно узнать примерную востребованность и сайты, на которых применяются аналогичные решения.
Анализ исходного кода
Если по каким-либо причинам предыдущие методы определения CMS оказались неприемлемыми или с их помощью не удалось установить движок сайта, можно проанализировать html-код страницы и ответы web-сервера (особенно куки и заголовки).
Для отображения кода страницы необходимо нажать F12 или сочетание клавиш Ctrl+U либо воспользоваться функцией «Просмотр кода страницы» контекстного меню.
Каждая CMS имеет свои отличительные черты, по которым ее можно вычислить. Давайте разберём на примере наиболее популярных движков и онлайн-конструкторов.
Самый простой способ – поискать в коде тег «meta name». Он выглядит так:
- <meta name="generator" content="WordPress 6.6.2" />
Версия движка будет той, что в реальности установлена на сервере.
Более продвинутый – поискать вхождения приставки «wp-». Она часто используется в путях к CSS и JS-файлам, а также в каталогах с плагинами и темами, например:
- wp-content/themes/<тут название темы>
- wp-content/plugins/<тут название плагина>
- wp-content/mu-plugins/<тут особые плагины для мультисайтовых установок>
Префикс «wp-» можно найти во многих CSS-классах и внутри скриптов. Например:
- <h2 class="wp-block-heading…>
Проще всего этот движок определить по характерным путям до скриптов и файлов шаблонов:
- /bitrix/templates/
- /bitrix/js/
- /bitrix/components/
- /bitrix/cache/
Если на сайте используется композит (особая технология кеширования тем), то в коде можно найти такие примечания:
- <!--BITRIX_COMPOSITE-->
А также классы и идентификаторы, которые включают префикс «bx-composite…».
Метод для продвинутых, отправить запрос к сайту через утилиту curl (curl -I адрес.сайта). Тогда в ответе можно поискать заголовок «X-Powered-CMS» с содержимым «Bitrix Site Manager».
В первую очередь следует искать специальный мета-тег:
- <meta name="generator" content="Joomla! - Open Source Content Management">
Но его может не быть.
К домену сайта нужно дописать специальный запрос: /index.php?option=com_content. Должно получиться что-то вроде «https://целевой.сайт/index.php?option=com_content».
Если вместо ошибки вам показывается нормальное содержимое, то с большой вероятностью перед вами Joomla. Этот движок имеет особый синтаксис запросов к базе данных.
В файле robots.txt чаще всего можно найти каталоги движка, которые исключают из индекса. Для Joomla они выглядят так:
А ещё можно повнимательнее изучить куки сайта, там скорее всего будут атрибуты с префиксом «joomla_».
В скрипте, который отвечает за настройку кеширования, будет прямое указание на ukit.com (ищите в футере):
- …"homeClusterDomain":"ukit.com",…
В http-заголовках (с помощью утилиты CURL) ищите:
- x-cms: ukit
Ищите в HTML-коде страниц примечания:
- /* --- UCOZ-JS-DATA --- */
- /* --- UCOZ-JS-CODE --- */
А ещё можно посмотреть куки. Например, с помощью CURL-запроса. Они могут включать в себя указание на UCOZ:
- Set-Cookie: 0_ТутОпорныйДомен_uCoz=; path=/;
Легче всего определяется по домену для CDN (здесь размещается статичный контент и скрипты):
- https://static.tildacdn.com/...
Но признаки конструктора могут быть также в JS-скриптах, в стилях и примечаниях. Например:
- data-tilda-page-id="098654"
- data-tilda-page-alias="footer"
- data-tilda-formskey=….
- <!-- Tilda copyright. Don't remove this line -->
- Tilda.sendEventToStatistics($el.data('tilda-event-name')…
Если задействовать Curl, то следует искать заголовки:
- x-tilda-server
- x-tilda-imprint
Характерные особенности имеют и другие CMS, но распознать их на уровне кода смогут только профессиональные вебмастера, имеющие представление о веб-программировании и HTTP-заголовках.
Следует отметить, что, если сайт создан на одном из наиболее популярных движков, с задачей определения CMS справятся большинство онлайн-сервисов и расширений. Но если интересующий веб-ресурс использует для работы нестандартную платформу, распознать ее сможет только профи, да и то не всегда. Дело в том, что на сайте вообще может не быть движка, например, когда он создан в обычном блокноте, или движок намеренно замаскировали, чтобы снизить вероятность атаки на известные уязвимости.