Видимость открытых репозиториев была темой встреча организованный консорциумом Куперин 20 ноября.
Презентации агрегаторов контента с открытым доступом, таких как БАЗА или же CORE или что из ScanR Поисковая система показывает важное место HAL как источника данных для распространения и воздействия французских научных публикаций.
Бенедикту Кунцигеру из CCSD было предложено представить справочную информацию и обзор HAL. предыдущий пост уже рассмотрены основные сайты, на которые ссылается HAL (обновлено в документация ): помимо уже упомянутых BASE, CORE и ScanR, HAL собирается Google ученый , OpenAire , Исидор для SHS, Dart-Европа для тезисов.
Значительная работа ведется над видимостью представлений о естественных науках в PubMed , Европа ПабМед и, в партнерстве с INSERM, в ПабМед Централ , Что касается представления в области экономики, они упоминаются в RePEC , На депозиты исходного кода программного обеспечения ссылаются в Программное обеспечение Наследие ,
В этом посте будут более конкретно рассмотрены технические аспекты, позволяющие машинам получать доступ к содержимому HAL.
OAI-PMH
Инициатива открытых архивов - протокол для сбора метаданных (OAI-PMH) - это протокол для сбора метаданных. Он основан на связи между клиентом и сервером. Сервер здесь - HAL. HAL можно собирать целиком или в отдельных наборах, называемых набором OAI. Наборы, предложенные HAL, можно заказать с типами документов, научными областями и коллекциями.
Например, «клиент» может собирать только тезисы или конкретную лабораторную коллекцию.
API - интерфейсы
API-интерфейсы (интерфейс прикладного программирования) - это интерфейс, обеспечивающий взаимодействие между компьютерами. По запросу любой веб-сайт может отображать список депозитов. Данные AuréHAL (аффилированные лица, авторы, дисциплины, журналы, проекты, списки метаданных и т. Д.) Также доступны через API-интерфейсы , расширяя возможности для использования контента.
Data.archives-ouvertes.fr
Другой способ представить данные - это предложить их структурированные в формате RDF ( Структура описания ресурса ), который используется для семантической сети. HAL метаданные доступны в этом формате на портале data.archives-ouvertes.fr , Портал новый, и у нас мало отзывов об использовании данных HAL в формате RDF.
Поисковая оптимизация
Поисковая оптимизация (SEO) - это набор методов, предназначенных для улучшения видимости веб-страницы в результатах поиска. Большинство веб-пользователей просто используют первые результаты и редко выходят за рамки первой страницы. Зная это, оптимизация является важной проблемой. Была реализована работа с метаданными в исходном коде документов: метаданные, добавленные в исходный код страниц, позволяют лучше идентифицировать документы с помощью Google Scholar, а также с помощью других инструментов, таких как Zotero.

Пример исходного кода страницы
Кроме того, для улучшения SEO в Google и Google Scholar, а также по запросу их служб была достигнута дедупликация URL-адресов для доступа к документам. Действительно, отправка может быть доступна с нескольких URL-адресов (портал, коллекция), что повышает ее наглядность, но ... усложняет идентификацию источника документов по алгоритму Google. С этого года URL-адрес файла, предоставляемого роботам Google, совпадает с адресом портала, используемого для отправки. Это изменение также приносит пользу другим поисковым системам.
Единообразие структуры URL
Каждое представление имеет идентификатор, присутствующий в его URL в формате https://hal.archives-ouvertes.fr/hal-XXXXXXXX. URL-адрес доступа к основному файлу всегда выполняется в формате https://hal.archives-ouvertes.fr/hal-XXXXXXXX/document. Например, файл hal-01917105 доступен по URL https://hal.archives-ouvertes.fr/hal-01917105/document
Этот способ используется Episciences «найти» автоматически URL для доступа к основному документу.
По тому же принципу программа / робот может предсказать URL форматов экспорта метаданных документа.
Например:
https://hal.archives-ouvertes.fr/hal-01917105v1/bibtex
https://hal.archives-ouvertes.fr/hal-01917105v1/tei
https://hal.archives-ouvertes.fr/hal-01917105v1/endnote
Но откуда приходят пользователи?
Согласно статистике консультаций, глобальное большинство пользователей попадает на страницу HAL через поисковую систему, Google находится на вершине. В 2018 году статистика составила более 3 миллионов посещений через Google. Мы также отмечаем в 2018 году рост числа консультаций со стороны социальных сетей, Facebook находится на вершине, но все еще очень далеко от Google.
Как можно видеть, CCSD мобилизует стандартизированные форматы, стандарты и протоколы для облегчения доступа к публикациям HAL. В частности, он следит за работой, проделанной в COAR (Конфедерация репозиториев открытого доступа), международная ассоциация, объединяющая сообщество открытых архивов.
Будучи соорганизатором следующего мероприятия совещания COAR в 2019 году, CCSD также будет рада приветствовать своих партнеров в Лионе в мае 2019 года для проведения Генеральной ассамблеи COAR и ежегодного конгресса.