Вікісховище:Машиночитабельні дані

This page is a translated version of a page Commons:Machine-readable data and the translation is 80% complete. Changes to the translation template, respectively the source language can be submitted through Commons:Machine-readable data and have to be approved by a translation administrator.
Outdated translations are marked like this.

Shortcut: COM:MRD

На Вікісховищі чимало метаданих (включно з ліцензією та автором) не є машиночитабельними. Існує модуль API, iiprop=extmetadata який може використовуватись для отримання деяких значень (приклад), але якщо оскільки інформація вводиться на самій сторінці опису файлу як простий текст, це рішення неідеальне. Є плани перенести метадані в базу даних$ref, але це відбудеться ще не скоро.

Щоб якось тимчасово вирішити цю проблему і спростити перехід на більш структуровані дані в майбутньому, Вікісховище використовує набір стандартних шаблонів, зроблених в певний спосіб машиночитабельними за допомогою елементів HTML. Деякі скрипти вже використовують це нововведення. Те, що ці дані доступні в будь-якій вікі, яка використовує Вікісховище, і де вони можуть бути зчитані з коду HTML сторінки файлу, як і інші локальні дані, нічого не вартує.

Машиночитабельні дані

Машиночитабельні дані, що встановлюються шаблонами-картками

Ось декілька стандартних шаблонів-карток із позначенням кожного елемента в шаблоні іншим тегом для уможливлення синтаксичного аналізу інформації. Використовується декілька різних стилів тегів:

  • Мікроформатні теги відповідають індустріальним стандартам і можуть бути проаналізовані вже існуючими інструментами.
  • ID-атрибути <td> (ідентифікатори) — це нестандартні позначення, що дозволяють використання повніших тегів, які мають зчитуватись нестандартними інструментами. Багато найуніверсальніших шаблонів мають двостовпцеву структуру: стовпець #1 містить назву поля, а стовпець #2 містить значення
    • Традиційно id-атрибути <td> використовувались для позначення виклику назви у першому стовпці в рядку. Щоб отримати дані Вам треба було б отримати вміст комірки <td> в другому стовпці.
    • Шаблони {{Creator}} і {{Institution}} мають складнішу структуру, тож комірки з дійсними даними позначені властивостями на фоні кольору маджента.
Шаблон Назва параметра шаблону Опис <td> ідентифікатор Мікроформат Коментар
{{Information}} description опис файлу fileinfotpl_desc hProduct.description. Often contains multiple languages annotated with {{Lang}}.
{{Information}} date дата створення оригінальної роботи fileinfotpl_date hCalendar vevent.dtstart мікроформат, доданий шаблоном {{Date}}
{{Information}} source джерело файлу fileinfotpl_src Often contains entire tables. We have no good way to deal with this source templates yet. Source templates often have references to catalogue IDs, but these are also not machine readable.
{{Information}} author автор файлу fileinfotpl_aut This can be author, creator and/or copyright holder and is used mixed. Often contains the {{Creator}} template which is described below.
{{Information}} permission дозвіл/ліцензія файлу fileinfotpl_perm
{{Information}} other versions інші версії файлу fileinfotpl_ver
{{Artwork}} description опис витвору мистецтва fileinfotpl_desc hProduct.description
{{Artwork}} date дата створення оригінального витвору мистецтва fileinfotpl_date hCalendar vevent.dtstart microformat added by {{Date}} template
{{Artwork}} source джерело файлу fileinfotpl_src
{{Artwork}} artist творець витвору мистецтва fileinfotpl_aut "hProduct.fn value"
{{Artwork}} author автор витвору мистецтва fileinfotpl_aut "hProduct.fn value"
{{Artwork}} permission дозвіл/ліцензія файлу і витвору мистецтва fileinfotpl_perm
{{Artwork}} other versions інші версії файлу fileinfotpl_ver
{{Artwork}} title назва витвору мистецтва fileinfotpl_art_title hProduct.fn
{{Artwork}} object type тип витвору мистецтва fileinfotpl_art_object_type
{{Artwork}} medium техніка або носій витвору мистецтва fileinfotpl_art_medium
{{Artwork}} dimensions розміри витвору мистецтва fileinfotpl_art_dimensions
{{Artwork}} gallery інституція, де зберігається витвір мистецтва fileinfotpl_art_gallery
{{Artwork}} location розташування витвору мистецтва в межах інституції fileinfotpl_art_location hProduct.locality
{{Artwork}} accession number номер доступу витвору мистецтва fileinfotpl_art_id hProduct.identifier
{{Artwork}} object history історія витвору мистецтва fileinfotpl_art_object_history
{{Artwork}} exhibition history історія виставок витвору мистецтва fileinfotpl_art_exhibition_history
{{Artwork}} credit line рядок подяки правовласникам fileinfotpl_art_credit_line
{{Artwork}} inscriptions написи на витворі мистецтва fileinfotpl_art_inscriptions
{{Artwork}} notes примітки щодо витвору мистецтва fileinfotpl_art_notes
{{Artwork}} references посилання, пов'язані з витвором мистецтва fileinfotpl_art_references
{{Book}} Author автор книги fileinfotpl_author
{{Book}} Editor редактор книги fileinfotpl_book_editor
{{Book}} Translator перекладач книги fileinfotpl_book_translator
{{Book}} Illustrator ілюстратор книги fileinfotpl_book_illustrator
{{Book}} Title назва книги fileinfotpl_book_title
{{Book}} Subtitle додаткова назва книги fileinfotpl_book_subtitle
{{Book}} Series title назва серії книги fileinfotpl_book_series-title
{{Book}} Authority file бібліоінформація fileinfotpl_book_authority
{{Book}} Publisher видавець книги fileinfotpl_book_publisher
{{Book}} Printer друкар книги fileinfotpl_book_printer
{{Book}} Year of publication дата або рік видання книги fileinfotpl_date
{{Book}} Place of publication місце або місто видання книги fileinfotpl_book_place-of-publication
{{Book}} Language мова книги fileinfotpl_book_language
{{Book}} Description опис книги fileinfotpl_desc
{{Creator}} Name Ім'я творця creator vCard.fn
{{Creator}} Alternative names Альтернативні імена творця fileinfotpl_creator_alt-name_value vCard.nickname
{{Creator}} Description Національність та професія творця fileinfotpl_creator_desc_value vCard.note
{{Creator}} Date of death Дата смерті творця fileinfotpl_creator_deathdate_value
{{Creator}} Date of birth Дата народження творця fileinfotpl_creator_birthdate_value vCard.bday
{{Creator}} Location of birth/death Місце смерті творця fileinfotpl_creator_deathloc_value
{{Creator}} Location of birth Місце народження творця fileinfotpl_creator_birthloc_value
{{Creator}} Work period Період роботи творця fileinfotpl_creator_work-period_value
{{Creator}} Work location Місце роботи творця fileinfotpl_creator_work-location_valuev
{{Creator}} Image портрет або фото із зображенням творця fileinfotpl_creator_image
{{Creator}} Authority file Бібліоінформація, пов'язана з творцем fileinfotpl_creator_authority_value


{{FileContentsByBot}} (різне) залежить, будь ласка, ознайомтесь із {{FileContentsByBot}} (various) hproduct-by-bot великий набір даних і все ще розвивається, будь ласка, ознайомтесь із {{FileContentsByBot}}
{{Photograph}} title назва фотографії fileinfotpl_art_title hProduct.fn
{{Photograph}} description опис фотографії fileinfotpl_desc hProduct.description
{{Photograph}} original description оригінальний архівний опис фотографії fileinfotpl_desc hProduct.description
{{Photograph}} date дата створення оригінального витвору мистецтва fileinfotpl_date hCalendar vevent.dtstart microformat added by {{Date}} template
{{Photograph}} medium техніка або носій фотографії fileinfotpl_art_medium
{{Photograph}} dimensions розміри фотографії fileinfotpl_art_dimensions
{{Photograph}} artist творець фотографії fileinfotpl_aut "hProduct.fn value"
{{Photograph}} institution інституція, де зберігається витвір мистецтва fileinfotpl_art_gallery
{{Photograph}} location розташування фотографії в межах інституції fileinfotpl_art_location hProduct.locality
{{Photograph}} source джерело файлу fileinfotpl_src
{{Photograph}} permission дозвіл/ліцензія файлу і витвору мистецтва fileinfotpl_perm
{{Photograph}} other versions інші версії файлу fileinfotpl_ver
{{Photograph}} accession number номер доступу фотографії hProduct.identifier

Альтернативний формат для CommonsMetadata

Оскільки формат table + id виявився надто складним для додавання до шаблонів, що мають форматування, відмінне від інформаційного шаблону на Вікісховищі, CommonsMetadata дозволяє використовувати альтернативний формат, подібний до шаблонів ліцензій: весь інформаційний шаблон має бути поміщений у клас fileinfotpl, а тег, що містить конкретну інформацію, повинен мати клас fileinfotpl_* (ті ж назви, що й угорі, але класи, не ідентифікатори).

Машиночитабельні дані, що встановлюються шаблонами ліцензій

Представлено в жовтні 2010 з використанням класів <span class="licensetpl_XXX">

licensetpl
Елемент, що визначає ліцензію. Охоплює весь код ліцензії, і це має бути ЄДИНА ліцензія, не мультиліцензія.
licensetpl_short
Коротка назва ліцензії: «Public domain», «CC-BY-SA-3.0», «CC-by-2.0-FR» тощо.
licensetpl_long
Повна назва ліцензії: «Public domain», «Creative Commons Attribution-Share Alike 3.0».
licensetpl_attr_req
Чи потрібна атрибуція. «true» або «false».
licensetpl_attr
Запитувана атрибуція: Вільний текст.
licensetpl_link_req
Чи вимагає ця ліцензія посилання на неї. «true» або «false».
licensetpl_link
Посилання на ліцензійний договір. «www.creativecommons.org/licenses/by-sa/XXX/YYY»
licensetpl_nonfree
«true», якщо це невільна ліцензія (не використовується на Вікісховищі, а лише у вікі, де діє ПДВ)

Декілька блоків licensetpl можуть бути охоплені блоком, що використовує клас licensetpl_wrapper.

Шаблони, що встановлюють цю інформацію

  • Templates setting licensetpl include:

{{PD-Layout}}, {{Cc-by-sa-3.0-migrated}}, {{Cc-by-layout}}, {{Cc-by-sa-layout}}, {{Cc-zero}}, {{FAL}}, {{GFDL}}, {{GFDL-1.2}}, {{GPL}} і {{LGPL}}.

Машиночитабельні дані, що встановлюються шаблонами форматування

Шаблони форматування стилів, призначені забезпечити однакові стилі для різних сімейств неліцензійних шаблонів, містять машиночитабельні дані для визначення цих сімейств.

Шаблон Мета назва класу
{{Restriction-Layout}} використовується шаблонами про обмеження restrictiontemplate
{{FoP-Layout}} використовується шаблонами про свободу панорами foptemplate
{{Partnership-Layout}} використовується шаблонами про партнерства partnershiptemplate
{{Source-Layout}} використовується загальними шаблонами джерел sourcetemplate
{{Created with}} використовується шаблонами «Створено за допомогою ...» createdwithtemplate

Машиночитабельні дані, що встановлюються шаблонами про непов'язані з авторським правом обмеження

Шаблони, що стосуються непов'язаних з авторських правом юридичних обмежень містять ці класи для ідентифікації конкретних типів обмежень.

Шаблони Мета назва класу
{{Trademarked}} Зображення з торговими марками restriction-trademarked
{{Copydesign}} Дизайни з копірайтом restriction-design
{{Communist symbol}} Символи комунізму restriction-communist
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} Італійські культурні цінності restriction-ita-mibac
{{Australian Commonwealth reserve}} Австралійські резерви restriction-aus-reserve
{{Personality rights}} {{Romania personality rights}} Права особистості restriction-personality
{{2257}} Попередження про дію закону Child Protection and Obscenity Enforcement Act (США) restriction-2257
{{Costume}} Костюми restriction-costume
{{Fan art}} Фан-арт restriction-fan-art
{{Currency}} Валюта restriction-currency
{{IHL Symbol}} Символи, використання яких обмежено Міжнародним гуманітарним законом restriction-ihl
{{Nazi symbol}} Символи нацизму та фашизму restriction-nazi
{{Insignia}} Офіційні герби restriction-insignia

Машиночитабельні дані, що встановлюються специфічними шаблонами

Встановлюється більше машиночитабельних даних. Цей список неповний:

{{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
{{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>

Машиночитабельні дані, що встановлюються шаблонами розташування

{{Location}} і подібні шаблони додають машиночитабельні геодані в такому форматі: <span class="geo">12.34;24.68</span> (широта і довгота як числа з рухомою комою, відокремлені крапкою з комою). Координати використовують систему WGS84 (ту ж, що й GPS і більшість карт онлайн). Див. Вікісховище:Геокодування, щоб дізнатися більше.

Використання

MediaWiki API

MediaWiki API тепер служить обмеженій кількості метаданих. Розгляньте такий запит:

(Відкрийте в пісочниці API) — відкриває деякі корисні параметри, такі як Credit, Artist, LicenseUrl і Copyrighted та використовується, наприклад, Медіапереглядачем.

Скрипти, що використовують машиночитабельні дані

Зовнішні інструменти

Див. також

Визначення нових машиночитабельних даних

  • Там, де це можливо, охоплюйте дійсні дані, не лише якийсь заголовок поля. Цей останній метод історично використовується в наших шаблонах «Information», але в довготривалій перспективі його значно важче підтримувати.
  • Охоплюйте самі дані, а не те, яким чином вони форматуються.
  • Очікуйте, що форматування буде втрачено при конвертації даних. Візуальне оформлення не є частиною інформації.
  • Не охоплюйте по декілька одиниць інформації в межах одного поля. Є різниця між датою публікації і датою створення. Обидва ці значення є датами, але вони є різними «полями даних». Також CC-by-SA-4.0-3.0-2.5 не є назвою ліцензії (Licensename), це — три ліцензії з назвами CC-by-SA-##.
  • Переконайтесь, що значення даних має лише один елемент, або виводить відповідний елемент.
  • Don't wrap multiple units of information inside one field. There is a difference between a publication date and a creation date. Both are dates, but both are different 'data fields'. Also CC BY-SA-4.0-3.0-2.5 is not a license name, those would be 3 licenses with the name CC BY-SA-##.
  • Make sure that the data value has one unit, or outputs one consistent unit.

Проблеми

Є декілька речей, які зараз або НЕ розпізнаються, або розпізнаються погано. До них належать:

  • Derivative works
  • Works included in works. See also Category:FoP_templates
  • licenses derivates or works included in works are a mess.
  • Author vs. Copyright holder
  • usernames vs 'real names'
  • Catalogue IDs etc
  • VRTS permissions
  • Publication date vs creation date