Навигация по сайту

Популярные статьи

HAL: оптимизация ссылок и распространения контента

Видимость открытых репозиториев была темой встреча организованный консорциумом Куперин 20 ноября.

Презентации агрегаторов контента с открытым доступом, таких как БАЗА или же CORE или что из ScanR Поисковая система показывает важное место HAL как источника данных для распространения и воздействия французских научных публикаций.

Бенедикту Кунцигеру из CCSD было предложено представить справочную информацию и обзор HAL. предыдущий пост уже рассмотрены основные сайты, на которые ссылается HAL (обновлено в документация ): помимо уже упомянутых BASE, CORE и ScanR, HAL собирается Google ученый , OpenAire , Исидор для SHS, Dart-Европа для тезисов.

Значительная работа ведется над видимостью представлений о естественных науках в PubMed , Европа ПабМед и, в партнерстве с INSERM, в ПабМед Централ , Что касается представления в области экономики, они упоминаются в RePEC , На депозиты исходного кода программного обеспечения ссылаются в Программное обеспечение Наследие ,

В этом посте будут более конкретно рассмотрены технические аспекты, позволяющие машинам получать доступ к содержимому HAL.

OAI-PMH

Инициатива открытых архивов - протокол для сбора метаданных (OAI-PMH) - это протокол для сбора метаданных. Он основан на связи между клиентом и сервером. Сервер здесь - HAL. HAL можно собирать целиком или в отдельных наборах, называемых набором OAI. Наборы, предложенные HAL, можно заказать с типами документов, научными областями и коллекциями.

Наборы, предложенные HAL, можно заказать с типами документов, научными областями и коллекциями

Например, «клиент» может собирать только тезисы или конкретную лабораторную коллекцию.

API - интерфейсы

API-интерфейсы (интерфейс прикладного программирования) - это интерфейс, обеспечивающий взаимодействие между компьютерами. По запросу любой веб-сайт может отображать список депозитов. Данные AuréHAL (аффилированные лица, авторы, дисциплины, журналы, проекты, списки метаданных и т. Д.) Также доступны через API-интерфейсы , расширяя возможности для использования контента.

Data.archives-ouvertes.fr

Другой способ представить данные - это предложить их структурированные в формате RDF ( Структура описания ресурса ), который используется для семантической сети. HAL метаданные доступны в этом формате на портале data.archives-ouvertes.fr , Портал новый, и у нас мало отзывов об использовании данных HAL в формате RDF.

Поисковая оптимизация

Поисковая оптимизация (SEO) - это набор методов, предназначенных для улучшения видимости веб-страницы в результатах поиска. Большинство веб-пользователей просто используют первые результаты и редко выходят за рамки первой страницы. Зная это, оптимизация является важной проблемой. Была реализована работа с метаданными в исходном коде документов: метаданные, добавленные в исходный код страниц, позволяют лучше идентифицировать документы с помощью Google Scholar, а также с помощью других инструментов, таких как Zotero.

Пример исходного кода страницы

Кроме того, для улучшения SEO в Google и Google Scholar, а также по запросу их служб была достигнута дедупликация URL-адресов для доступа к документам. Действительно, отправка может быть доступна с нескольких URL-адресов (портал, коллекция), что повышает ее наглядность, но ... усложняет идентификацию источника документов по алгоритму Google. С этого года URL-адрес файла, предоставляемого роботам Google, совпадает с адресом портала, используемого для отправки. Это изменение также приносит пользу другим поисковым системам.

Это изменение также приносит пользу другим поисковым системам

Единообразие структуры URL

Каждое представление имеет идентификатор, присутствующий в его URL в формате https://hal.archives-ouvertes.fr/hal-XXXXXXXX. URL-адрес доступа к основному файлу всегда выполняется в формате https://hal.archives-ouvertes.fr/hal-XXXXXXXX/document. Например, файл hal-01917105 доступен по URL https://hal.archives-ouvertes.fr/hal-01917105/document

Этот способ используется Episciences «найти» автоматически URL для доступа к основному документу.

По тому же принципу программа / робот может предсказать URL форматов экспорта метаданных документа.

Например:

https://hal.archives-ouvertes.fr/hal-01917105v1/bibtex
https://hal.archives-ouvertes.fr/hal-01917105v1/tei
https://hal.archives-ouvertes.fr/hal-01917105v1/endnote

Но откуда приходят пользователи?

Согласно статистике консультаций, глобальное большинство пользователей попадает на страницу HAL через поисковую систему, Google находится на вершине. В 2018 году статистика составила более 3 миллионов посещений через Google. Мы также отмечаем в 2018 году рост числа консультаций со стороны социальных сетей, Facebook находится на вершине, но все еще очень далеко от Google.

Как можно видеть, CCSD мобилизует стандартизированные форматы, стандарты и протоколы для облегчения доступа к публикациям HAL. В частности, он следит за работой, проделанной в COAR (Конфедерация репозиториев открытого доступа), международная ассоциация, объединяющая сообщество открытых архивов.

Будучи соорганизатором следующего мероприятия совещания COAR в 2019 году, CCSD также будет рада приветствовать своих партнеров в Лионе в мае 2019 года для проведения Генеральной ассамблеи COAR и ежегодного конгресса.