Навигация по сайту

Популярные статьи

Увлекательный поход по Крыму

Мы предлагаем вам увлекательный поход по живописным местам горного Крыма, полюбоваться красотами каньонов и горных водопадов, послушать журчание горных рек и пение птиц, насладиться экзотическими пейзажами

Отдых в Карпатах

Активный отдых - это очень важная часть жизни абсолютно любого человека, который способен обогащать и закалять человека как напрямую физически, улучшая форму, так и духовно, психологически, морально,

SEO и визуализация сайта: давайте пойдем дальше с Gephi

  1. База: ссылки и внутренний PageRank
  2. Вид "по URL"
  3. Вид "Гусеничный"
  4. заключение

Визуализация сегодня важна для SEO (см., В частности, эта статья ) и это одна из причин появления специализированных инструментов Saas. Использование Gephi (бесплатное программное обеспечение для визуализации сети) особенно широко распространено для многократного использования, включая визуализация или внутренняя оптимизация сетки ,

Тем не менее, то, что сделано с точки зрения SEO-визуализации, было немного революционизировано недавно Cocon.Se и его круговая визуализация ,

Мотивированы видео-презентацией инструмента во время SearchCast Лорана Буррелли Я хотел попытаться воспроизвести некоторые из визуализаций, доступных в этом инструменте, только с использованием Gephi.

Внимание, в оставшейся части статьи приведены формулы для Libre Office (да здравствует свободное программное обеспечение!). Поэтому они должны быть адаптированы для Excel, в частности заменить «Data.A1» на «Data! A1». Аналогично, Excel не обязательно обрабатывает регулярные выражения в поиске одинаково (возможно, вам придется добавить дополнение SeoTools для Excel).

База: ссылки и внутренний PageRank

Эта часть не будет сюрпризом для завсегдатаев Gephi, которые могут перейти непосредственно к Просмотр URL или в Гусеничный вид Я представляю действительно то же самое, что и набор учебных пособий по использованию Gephi для SEO: визуализация внутренних ссылок сайта.

Сначала мы подготовим нужные данные: начнем с просмотра сайта с помощью Screaming Frog. Скопируйте все данные из сканирования в электронную таблицу, которую мы называем «Данные». Затем экспортируйте внутренние ссылки во вторую вкладку «Ссылки»:

Затем экспортируйте внутренние ссылки во вторую вкладку «Ссылки»:

  • Первый шаг: рассчитать PageRank и, возможно, модульность, из внутренних ссылок. Для этого:
    • Сохранять при экспорте внутренних ссылок только строки типа HREF и только столбцы, содержащие URL-адреса (источник и назначение), и переименовывать их в «Источник» и «Цель»;
    • Экспортируйте этот лист в csv.
    • Откройте Gephi, создайте новый проект, перейдите на вкладку «Лаборатория данных» и импортируйте вновь созданный файл (обычно он обнаруживает, что это ссылки, и все параметры верны).
    • Затем вы можете переключиться на первую вкладку («Обзор»). Затем вы наблюдаете визуализацию вашего сайта в виде графика, который вообще не организован:

Затем вы наблюдаете визуализацию вашего сайта в виде графика, который вообще не организован:

  • Перед работой над визуализацией мы будем использовать статистические функции Gephi:

Перед работой над визуализацией мы будем использовать статистические функции Gephi:

Здесь мы непосредственно начнем вычисление двух алгоритмов, которые нас интересуют: PageRank и Modularity.

Здесь мы непосредственно начнем вычисление двух алгоритмов, которые нас интересуют: PageRank и Modularity

PageRank определяет вероятность попадания на страницу независимо от того, на какой странице вашего сайта вы находитесь, мы скажем, что это значение, которое ваш сайт придает странице (внимание, здесь речь идет только о ссылках) внутренняя, внешняя популярность не учитывается).

Модульность - это чисто «сетевая» концепция, не используемая в SEO: модульность разбивает сеть на подсети. Если все пойдет хорошо, это добавит значения «кластеров» страниц на вашем сайте.

  • Теперь мы будем использовать эти расчеты для улучшения визуализации:

Теперь мы будем использовать эти расчеты для улучшения визуализации:

  • Первый значок рядом с «Узлами» и «Края» представляет цвет: нажмите «Атрибуты», выберите атрибут «Модульность» (которого нет, если расчет не был запущен) и нажмите на «Применить»: ваша визуализация должна быть гладкой.
  • Нажав на значок рядом с ним, вы можете выбрать «PageRank» в качестве атрибута для размера. Выберите подходящий размер (я использую 30 - 150, например) и нажмите «Применить»: страницы должны выделяться.
  • Затем вы можете поиграть с алгоритмами пространственной организации, чтобы лучше представить свой сайт.

Затем вы можете поиграть с алгоритмами пространственной организации, чтобы лучше представить свой сайт

Мы не получаем ничего удовлетворительного: кластер не появляется, на этом сайте слишком много внутренних ссылок, чтобы что-то анализировать из этой визуализации (но, с другой стороны, мы уже можем подумать, что нужно будет защищать рационализация внутренних ссылок).

Теперь мы попробуем более конкретную визуализацию, надеясь выявить некоторые другие проблемы сайта.

Вид "по URL"

Cocon.se имеет представление «URL», которое представляет представление, где родительский URL является родительской страницей. Из данных, которые вы скопировали из ScreamingFrog, довольно легко найти родительский URL страницы: создайте новый лист. Во втором столбце используйте формулу

= Data.A1

в ячейке A1 и скопируйте его в полный столбец. В первом столбце этого листа используйте формулу

= ЛЕВЫЙ (В1; FIND ( "/ [^ /] * $"; В1) -1)

После этого у вас будет заполнен столбец с «родительским» URL-адресом страницы. Старайтесь сохранять только ссылки на веб-страницы (исключая файлы), это будет более эффективно с точки зрения визуализации.

Будьте осторожны, согласно некоторым системам, вам придется добавлять окончания "/", потому что URL-адреса вашего сайта содержат (мы достигаем пределов автоматизации, и некоторые URL-адреса всегда будут корректироваться).

Если вы используете электронную таблицу, которую вы только что создали, в качестве источника «ссылок» в Gephi (после удаления ссылок, импортированных в предыдущем абзаце, но с сохранением узлов для сохранения соответствующих размеров и цветов), вы получите представление структура URL вашего сайта, своего рода «человеческое» представление о том, как был разработан сайт.

В этом примере мы видим совершенно отдельные кластеры: это потому, что в некоторых случаях «родительская» страница не существует. Вот сайт Drupal с модулем перезаписи URL (Pathauto) в его конфигурации по умолчанию, поэтому все URL-адреса страниц находятся в "/ content / [title-of-the-page]", и это На сайте нет страницы "/ content" (блок вверху слева). Эта проблема, конечно, обнаруживается непосредственно из данных сканирования, но визуализация позволяет эффективно проиллюстрировать ее перед клиентом.

Блок в правом нижнем углу представляет страницы «тегов», структура которых также плохо интегрируется с остальным сайтом (нет страницы «/ tag», пока все эти URL-адреса находятся в "/ tag / [tag-name]" Мы могли бы предложить переписать URL-адреса, возможно, мы могли бы выгодно предложить чистое и простое удаление всех этих страниц (кроме, возможно, одной из них, из которых важен внутренний PageRank, который, вероятно, заслуживает превращения в «настоящий» раздел сайта).

Наконец, последнее наблюдение, все цвета смешаны в этом представлении, указывая на то, что внутренние ссылки не имеют ничего общего со структурой URL-адресов, и, следовательно, никакой организации в бункеры ,

Вид "Гусеничный"

Cocon.se также предлагает представление «Crawler», выделяя первую ссылку, которая привела к открытию страницы. Чтобы смоделировать это представление с Gephi, мы возобновим наш файл со списком внутренних ссылок, но на этот раз мы пересечем данные со столбцом «level» данных Screaming Frog, указывающим количество кликов, необходимых для достижения страницы.

Рядом с каждым столбцом «Источник» и «Цель» я использую формулу

= ВПР (А2; данные $ A $ $ 2. Данные Z $ 1000; 26; 0).

кто ищет содержимое ячейки A2 моего текущего листа в первом столбце области, которую я указываю (A2 -> Z1000), поэтому столбец A, который является одним из URL-адресов, и после того, как найденное значение, перейдите ко мне вернуть значение столбца 26 столбцов справа (столбец Z здесь), столбца «уровень»: затем я получаю уровень глубины каждой из внутренних страниц, участвующих в моих ссылках.

В последней операции мы отфильтруем ссылки, чтобы сохранить только те, чей «уровень» источника напрямую ниже, чем у пункта назначения (путем создания колона, содержащего формулу

= (В2 + 1 = D2)

и сохраняя только те строки, чья ячейка "ИСТИНА").

Мы снова очистим таблицу ссылок Gephi, чтобы использовать эти новые данные в качестве «таблицы ссылок», и немного поиграв с алгоритмами пространственной обработки, мы получим совершенно другой рендеринг:

Мы снова очистим таблицу ссылок Gephi, чтобы использовать эти новые данные в качестве «таблицы ссылок», и немного поиграв с алгоритмами пространственной обработки, мы получим совершенно другой рендеринг:

Здесь быстро выдвигаются 2 вещи:

  • Большинство страниц обнаруживаются через страницу карты сайта (большой центральный зеленый кружок в среднем блоке);
  • Многие страницы не связаны между собой: это страницы, обнаруженные с помощью «канонических» тегов или страниц, URL-адрес которых содержит параметры, которые мне пришлось удалить, чтобы заставить работать различные формулы. Здесь нам, вероятно, следует адаптировать наши формулы для учета этих случаев. Однако мы выявляем потенциальный источник проблем: канонические страницы, которые не связаны напрямую, или большая нумерация страниц (удаленный параметр был нумерацией страниц), которые сканируются и индексируются.

В случае, когда параметр пагинации не удаляется, также с помощью этого представления можно идентифицировать строки пагинации (напоминающие длинные цепочки узлов) или «ловушки» для робота (поколения динамически многие страницы, которые не возвращают никакого содержимого (такая же графическая идентификация, как и строки нумерации страниц)).

Опять же, все это также можно определить, прочитав данные сканирования, но не обязательно сразу, и вы можете использовать их для иллюстрации ситуации для вашего клиента.

заключение

Наши первоначальные цели были достигнуты: мы можем определить проблемы непосредственно из визуализаций и проиллюстрировать их, чтобы наши клиенты лучше понимали.

С другой стороны, ясно, что Cocon.Se выдвигает гораздо больше, особенно для всех проблем «утечки» семантических коконов: здесь мы можем получить приближающийся результат, наблюдая цвета, участвующие в каждом кластере, потому что классы модульности обычно должны соответствовать коконам.

Тем не менее, результаты, полученные с помощью нашего метода, удовлетворяют нас сегодня, хотя я благодарю техников Cocon.Se за то, что они подтолкнули меня поставить основы визуализации Gephi под сомнение.

Если у вас есть другие идеи для анализа или визуализации, не стесняйтесь, дайте мне знать!