- СДЕЛАЙТЕ ДУБЛИРОВАННУЮ КОЛОННУ URL - ДОПОЛНИТЕЛЬНО
- LOWERCASE LOWERCASE LOWERCASE
- Шаг 1. Щелкните правой кнопкой мыши по столбцу URL-адреса и выберите « Преобразование»> строчные...
- ПРОТОКОЛЫ
- Шаг 1: Щелкните правой кнопкой мыши по вашему столбцу, затем выберите Разделить столбец> По разделителю.
- Шаг 2: Введите пользовательский разделитель: // и разделяйте при каждом вхождении разделителя (технически...
- ДОБРО ПОЖАЛОВАТЬ В ВАШИ СТРАНИЦЫ?
- Вы можете избавиться от этого одним из двух способов:
- ПАРАМЕТРЫ
- Шаг 1: Используйте функцию « Разделить по разделителю» и разделите, используя «?», Чтобы создать столбец,...
- TRIM THESE TRAILING SLASHES
- Шаг 1. На вкладке « Добавить столбец » выберите « Формат»> «Обрезать»
- СЛЕДУЮЩИЕ ШАГИ: ПОСТРОЕНИЕ МОСТА
Начало визуализации данных для поиска новых возможностей и ускорения анализа? Я тоже! Но есть несколько лучших практик, которые я изучил на этом пути при соединении наборов данных по URL.
Когда вы можете подключиться по URL?
Вот несколько выводов, которые я обнаружил, что я обычно соединяюсь на уровне URL, где мне нужно действительно очистить URL, чтобы убедиться, что я получаю общее представление о моих наборах данных:
- Гугл Аналитика
- Google Search Console
- Adwords
- Кричащая лягушка
- STAT
- SEMrush
- AHREFs
Когда вы обрабатываете БОЛЬШИЕ данные, не стоит использовать ярлык и потенциально пропустить соединения из грязных URL. Мне даже нужно продолжать идти?
☑️ Зайдите в редактор запросов Power BI и начнем!
Новое в Power BI? 📽📽 Power BI для цифровых маркетологов (смотрите урок 1 с Уилом Рейнольдсом)
СДЕЛАЙТЕ ДУБЛИРОВАННУЮ КОЛОННУ URL - ДОПОЛНИТЕЛЬНО
Я предпочитаю играть осторожно и создать дубликат столбца из моего исходного столбца URL, а затем преобразовать дубликат.
Зачем? Так что, если я ошибусь или передумаю о том, как я изменяю свои данные, я могу просто сделать еще один дубликат и начать заново, вместо того, чтобы удалить мои примененные шаги в оригинале и потенциально повлиять на другой столбец или диаграмму.
LOWERCASE LOWERCASE LOWERCASE
Вы работаете со смешанными URL-адресами? Я надеюсь, что нет, но в любом случае ваш первый шаг должен состоять в том, чтобы преобразовать столбец URL в нижний регистр на всякий случай .
Шаг 1. Щелкните правой кнопкой мыши по столбцу URL-адреса и выберите « Преобразование»> строчные буквы из раскрывающегося списка
ЧИСТЫЙ И ТРИМ
- Чистый запрос возвращает исходное текстовое значение с удаленными непечатными символами. Щелкните правой кнопкой мыши ваш столбец URL и выберите Transform> clean из выпадающего списка.
- Trim Query удаляет пустые значения из начала и конца текстового значения. Щелкните правой кнопкой мыши по столбцу URL и выберите Transform > trim из выпадающего списка.
ПРОТОКОЛЫ
Мне нравится разделять протоколы, разделяя столбец с разделителем - таким образом я «разделяю» столбец на протокол и остальную часть URL, чтобы я мог ссылаться на http против https позже с помощью среза или круговой диаграммы, если я хочу знать если есть существенное расхождение между ними.
Шаг 1: Щелкните правой кнопкой мыши по вашему столбцу, затем выберите Разделить столбец> По разделителю.
- Вы также можете нажать Разделить столбец в верхней части навигации на вкладке Главная.
Шаг 2: Введите пользовательский разделитель: // и разделяйте при каждом вхождении разделителя (технически любая опция должна работать здесь).
Ваш столбец URL теперь должен быть разделен на 2 столбца - один, содержащий протокол, и другой, содержащий URL.
ДОБРО ПОЖАЛОВАТЬ В ВАШИ СТРАНИЦЫ?
Ты не одинок.
Аааа, страшное «что это за штука в конце моих URL?». Очевидно, что вы не можете полностью определить, когда один набор данных добавляет что-то странное в конец URL-адресов или когда некоторые URL-адреса содержат строку в конце, а некоторые - нет.
- example.com
- example.com/index.php
- example.com/path
- example.com/path/index.php
Вы можете избавиться от этого одним из двух способов:
- Щелкните правой кнопкой мыши по столбцу и выберите « Заменить значения», чтобы заменить добавленное значение пустым.
- Используйте Разделить столбец по разделителю, чтобы разделить его на другой столбец, используя значение в качестве разделителя.
ПАРАМЕТРЫ
Бу. Параметры. Мы можем удалить параметры, канонизируя то, как это делают поисковые роботы, но этот метод не учитывает разницу между параметры для уникальных URL против URL отслеживания ,
Шаг 1: Используйте функцию « Разделить по разделителю» и разделите, используя «?», Чтобы создать столбец, содержащий ваши параметры и каноническую версию URL.
TRIM THESE TRAILING SLASHES
Обрезка завершающих косых черт является обязательной, но вы не можете использовать разделение по разделителю здесь - если в URL нет косой черты, вы просто отрежете последний путь.
Чтобы удалить косые черты, мы будем использовать формулу, которая обрежет любые URL-адреса с помощью косой черты и оставит любые URL-адреса без одной косой черты.
Шаг 1. На вкладке « Добавить столбец » выберите « Формат»> «Обрезать»
- Это автоматически создаст новый столбец с именем «Trim». Чтобы ввести нашу формулу, выберите шестеренку справа от вставленного обрезанного текста в ваших Приложенных шагах для редактирования формулы.
Text.TrimEnd ([COLUMN], "/")
СЛЕДУЮЩИЕ ШАГИ: ПОСТРОЕНИЕ МОСТА
- Теперь у нас должен быть исходный столбец URL, столбец протокола, столбец «Clean» URL, столбец параметров и столбец Trimmed URL .
🎬 догнать нас на ютубе для большего совершенства Power BI!
Теперь, когда вы очистили свои URL-адреса в канонические версии, у вас может быть дубликат в столбце «Обрезка», который может помешать вам создать связь через этот столбец. Чтобы узнать, как правильно чистить список и удалять дубликаты - подпишитесь ниже, чтобы прочитать наш предстоящий пост в блоге об очистке и дедупликации ваших данных!
ДОБРО ПОЖАЛОВАТЬ В ВАШИ СТРАНИЦЫ?Когда вы можете подключиться по URL?
Мне даже нужно продолжать идти?
Новое в Power BI?
Зачем?
ДОБРО ПОЖАЛОВАТЬ В ВАШИ СТРАНИЦЫ?
Аааа, страшное «что это за штука в конце моих URL?