Вікісховище:Машиночитабельні дані
На Вікісховищі чимало метаданих (включно з ліцензією та автором) не є машиночитабельними. Існує модуль API, iiprop=extmetadata який може використовуватись для отримання деяких значень (приклад), але якщо оскільки інформація вводиться на самій сторінці опису файлу як простий текст, це рішення неідеальне. Є плани перенести метадані в базу даних$ref, але це відбудеться ще не скоро.
Щоб якось тимчасово вирішити цю проблему і спростити перехід на більш структуровані дані в майбутньому, Вікісховище використовує набір стандартних шаблонів, зроблених в певний спосіб машиночитабельними за допомогою елементів HTML. Деякі скрипти вже використовують це нововведення. Те, що ці дані доступні в будь-якій вікі, яка використовує Вікісховище, і де вони можуть бути зчитані з коду HTML сторінки файлу, як і інші локальні дані, нічого не вартує.
Машиночитабельні дані
Машиночитабельні дані, що встановлюються шаблонами-картками
Ось декілька стандартних шаблонів-карток із позначенням кожного елемента в шаблоні іншим тегом для уможливлення синтаксичного аналізу інформації. Використовується декілька різних стилів тегів:
- Мікроформатні теги відповідають індустріальним стандартам і можуть бути проаналізовані вже існуючими інструментами.
- ID-атрибути <td> (ідентифікатори) — це нестандартні позначення, що дозволяють використання повніших тегів, які мають зчитуватись нестандартними інструментами. Багато найуніверсальніших шаблонів мають двостовпцеву структуру: стовпець #1 містить назву поля, а стовпець #2 містить значення
- Традиційно id-атрибути <td> використовувались для позначення виклику назви у першому стовпці в рядку. Щоб отримати дані Вам треба було б отримати вміст комірки
<td>
в другому стовпці. - Шаблони {{Creator}} і {{Institution}} мають складнішу структуру, тож комірки з дійсними даними позначені
властивостями на фоні кольору маджента
.
- Традиційно id-атрибути <td> використовувались для позначення виклику назви у першому стовпці в рядку. Щоб отримати дані Вам треба було б отримати вміст комірки
Шаблон | Назва параметра шаблону | Опис | <td> ідентифікатор | Мікроформат | Коментар |
---|---|---|---|---|---|
{{Information}} | description | опис файлу | fileinfotpl_desc |
hProduct.description. | Often contains multiple languages annotated with {{Lang}}. |
{{Information}} | date | дата створення оригінальної роботи | fileinfotpl_date |
hCalendar vevent.dtstart | мікроформат, доданий шаблоном {{Date}} |
{{Information}} | source | джерело файлу | fileinfotpl_src |
Often contains entire tables. We have no good way to deal with this source templates yet. Source templates often have references to catalogue IDs, but these are also not machine readable. | |
{{Information}} | author | автор файлу | fileinfotpl_aut |
This can be author, creator and/or copyright holder and is used mixed. Often contains the {{Creator}} template which is described below. | |
{{Information}} | permission | дозвіл/ліцензія файлу | fileinfotpl_perm |
||
{{Information}} | other versions | інші версії файлу | fileinfotpl_ver |
||
{{Artwork}} | description | опис витвору мистецтва | fileinfotpl_desc |
hProduct.description | |
{{Artwork}} | date | дата створення оригінального витвору мистецтва | fileinfotpl_date |
hCalendar vevent.dtstart | microformat added by {{Date}} template |
{{Artwork}} | source | джерело файлу | fileinfotpl_src |
||
{{Artwork}} | artist | творець витвору мистецтва | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | author | автор витвору мистецтва | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | permission | дозвіл/ліцензія файлу і витвору мистецтва | fileinfotpl_perm |
||
{{Artwork}} | other versions | інші версії файлу | fileinfotpl_ver |
||
{{Artwork}} | title | назва витвору мистецтва | fileinfotpl_art_title |
hProduct.fn | |
{{Artwork}} | object type | тип витвору мистецтва | fileinfotpl_art_object_type |
||
{{Artwork}} | medium | техніка або носій витвору мистецтва | fileinfotpl_art_medium |
||
{{Artwork}} | dimensions | розміри витвору мистецтва | fileinfotpl_art_dimensions |
||
{{Artwork}} | gallery | інституція, де зберігається витвір мистецтва | fileinfotpl_art_gallery |
||
{{Artwork}} | location | розташування витвору мистецтва в межах інституції | fileinfotpl_art_location |
hProduct.locality | |
{{Artwork}} | accession number | номер доступу витвору мистецтва | fileinfotpl_art_id |
hProduct.identifier | |
{{Artwork}} | object history | історія витвору мистецтва | fileinfotpl_art_object_history |
||
{{Artwork}} | exhibition history | історія виставок витвору мистецтва | fileinfotpl_art_exhibition_history |
||
{{Artwork}} | credit line | рядок подяки правовласникам | fileinfotpl_art_credit_line |
||
{{Artwork}} | inscriptions | написи на витворі мистецтва | fileinfotpl_art_inscriptions |
||
{{Artwork}} | notes | примітки щодо витвору мистецтва | fileinfotpl_art_notes |
||
{{Artwork}} | references | посилання, пов'язані з витвором мистецтва | fileinfotpl_art_references |
||
{{Book}} | Author | автор книги | fileinfotpl_author |
||
{{Book}} | Editor | редактор книги | fileinfotpl_book_editor |
||
{{Book}} | Translator | перекладач книги | fileinfotpl_book_translator |
||
{{Book}} | Illustrator | ілюстратор книги | fileinfotpl_book_illustrator |
||
{{Book}} | Title | назва книги | fileinfotpl_book_title |
||
{{Book}} | Subtitle | додаткова назва книги | fileinfotpl_book_subtitle |
||
{{Book}} | Series title | назва серії книги | fileinfotpl_book_series-title |
||
{{Book}} | Authority file | бібліоінформація | fileinfotpl_book_authority |
||
{{Book}} | Publisher | видавець книги | fileinfotpl_book_publisher |
||
{{Book}} | Printer | друкар книги | fileinfotpl_book_printer |
||
{{Book}} | Year of publication | дата або рік видання книги | fileinfotpl_date |
||
{{Book}} | Place of publication | місце або місто видання книги | fileinfotpl_book_place-of-publication |
||
{{Book}} | Language | мова книги | fileinfotpl_book_language |
||
{{Book}} | Description | опис книги | fileinfotpl_desc |
||
{{Creator}} | Name | Ім'я творця | creator |
vCard.fn | |
{{Creator}} | Alternative names | Альтернативні імена творця | fileinfotpl_creator_alt-name_value |
vCard.nickname | |
{{Creator}} | Description | Національність та професія творця | fileinfotpl_creator_desc_value |
vCard.note | |
{{Creator}} | Date of death | Дата смерті творця | fileinfotpl_creator_deathdate_value |
||
{{Creator}} | Date of birth | Дата народження творця | fileinfotpl_creator_birthdate_value |
vCard.bday | |
{{Creator}} | Location of birth/death | Місце смерті творця | fileinfotpl_creator_deathloc_value |
||
{{Creator}} | Location of birth | Місце народження творця | fileinfotpl_creator_birthloc_value |
||
{{Creator}} | Work period | Період роботи творця | fileinfotpl_creator_work-period_value |
||
{{Creator}} | Work location | Місце роботи творця | fileinfotpl_creator_work-location_valuev |
||
{{Creator}} | Image | портрет або фото із зображенням творця | fileinfotpl_creator_image |
||
{{Creator}} | Authority file | Бібліоінформація, пов'язана з творцем | fileinfotpl_creator_authority_value |
| |
{{FileContentsByBot}} | (різне) | залежить, будь ласка, ознайомтесь із {{FileContentsByBot}} | (various) |
hproduct-by-bot | великий набір даних і все ще розвивається, будь ласка, ознайомтесь із {{FileContentsByBot}} |
{{Photograph}} | title | назва фотографії | fileinfotpl_art_title |
hProduct.fn | |
{{Photograph}} | description | опис фотографії | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | original description | оригінальний архівний опис фотографії | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | date | дата створення оригінального витвору мистецтва | fileinfotpl_date |
hCalendar vevent.dtstart | microformat added by {{Date}} template |
{{Photograph}} | medium | техніка або носій фотографії | fileinfotpl_art_medium |
||
{{Photograph}} | dimensions | розміри фотографії | fileinfotpl_art_dimensions |
||
{{Photograph}} | artist | творець фотографії | fileinfotpl_aut |
"hProduct.fn value" | |
{{Photograph}} | institution | інституція, де зберігається витвір мистецтва | fileinfotpl_art_gallery |
||
{{Photograph}} | location | розташування фотографії в межах інституції | fileinfotpl_art_location |
hProduct.locality | |
{{Photograph}} | source | джерело файлу | fileinfotpl_src |
||
{{Photograph}} | permission | дозвіл/ліцензія файлу і витвору мистецтва | fileinfotpl_perm |
||
{{Photograph}} | other versions | інші версії файлу | fileinfotpl_ver |
||
{{Photograph}} | accession number | номер доступу фотографії | hProduct.identifier |
Альтернативний формат для CommonsMetadata
Оскільки формат table + id виявився надто складним для додавання до шаблонів, що мають форматування, відмінне від інформаційного шаблону на Вікісховищі, CommonsMetadata дозволяє використовувати альтернативний формат, подібний до шаблонів ліцензій: весь інформаційний шаблон має бути поміщений у клас fileinfotpl
, а тег, що містить конкретну інформацію, повинен мати клас fileinfotpl_*
(ті ж назви, що й угорі, але класи, не ідентифікатори).
Машиночитабельні дані, що встановлюються шаблонами ліцензій
Представлено в жовтні 2010 з використанням класів <span class="licensetpl_XXX">
licensetpl
- Елемент, що визначає ліцензію. Охоплює весь код ліцензії, і це має бути ЄДИНА ліцензія, не мультиліцензія.
licensetpl_short
- Коротка назва ліцензії: «Public domain», «CC-BY-SA-3.0», «CC-by-2.0-FR» тощо.
licensetpl_long
- Повна назва ліцензії: «Public domain», «Creative Commons Attribution-Share Alike 3.0».
licensetpl_attr_req
- Чи потрібна атрибуція. «true» або «false».
licensetpl_attr
- Запитувана атрибуція: Вільний текст.
licensetpl_link_req
- Чи вимагає ця ліцензія посилання на неї. «true» або «false».
licensetpl_link
- Посилання на ліцензійний договір. «www.creativecommons.org/licenses/by-sa/XXX/YYY»
licensetpl_nonfree
- «true», якщо це невільна ліцензія (не використовується на Вікісховищі, а лише у вікі, де діє ПДВ)
Декілька блоків licensetpl
можуть бути охоплені блоком, що використовує клас licensetpl_wrapper
.
Шаблони, що встановлюють цю інформацію
- Templates setting
licensetpl
include:
{{PD-Layout}}, {{Cc-by-sa-3.0-migrated}}, {{Cc-by-layout}}, {{Cc-by-sa-layout}}, {{Cc-zero}}, {{FAL}}, {{GFDL}}, {{GFDL-1.2}}, {{GPL}} і {{LGPL}}.
Машиночитабельні дані, що встановлюються шаблонами форматування
Шаблони форматування стилів, призначені забезпечити однакові стилі для різних сімейств неліцензійних шаблонів, містять машиночитабельні дані для визначення цих сімейств.
Шаблон | Мета | назва класу |
---|---|---|
{{Restriction-Layout}} | використовується шаблонами про обмеження | restrictiontemplate
|
{{FoP-Layout}} | використовується шаблонами про свободу панорами | foptemplate
|
{{Partnership-Layout}} | використовується шаблонами про партнерства | partnershiptemplate
|
{{Source-Layout}} | використовується загальними шаблонами джерел | sourcetemplate
|
{{Created with}} | використовується шаблонами «Створено за допомогою ...» | createdwithtemplate
|
Машиночитабельні дані, що встановлюються шаблонами про непов'язані з авторським правом обмеження
Шаблони, що стосуються непов'язаних з авторських правом юридичних обмежень містять ці класи для ідентифікації конкретних типів обмежень.
Шаблони | Мета | назва класу |
---|---|---|
{{Trademarked}} | Зображення з торговими марками | restriction-trademarked
|
{{Copydesign}} | Дизайни з копірайтом | restriction-design
|
{{Communist symbol}} | Символи комунізму | restriction-communist
|
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} | Італійські культурні цінності | restriction-ita-mibac
|
{{Australian Commonwealth reserve}} | Австралійські резерви | restriction-aus-reserve
|
{{Personality rights}} {{Romania personality rights}} | Права особистості | restriction-personality
|
{{2257}} | Попередження про дію закону Child Protection and Obscenity Enforcement Act (США) | restriction-2257
|
{{Costume}} | Костюми | restriction-costume
|
{{Fan art}} | Фан-арт | restriction-fan-art
|
{{Currency}} | Валюта | restriction-currency
|
{{IHL Symbol}} | Символи, використання яких обмежено Міжнародним гуманітарним законом | restriction-ihl
|
{{Nazi symbol}} | Символи нацизму та фашизму | restriction-nazi
|
{{Insignia}} | Офіційні герби | restriction-insignia
|
Машиночитабельні дані, що встановлюються специфічними шаблонами
Встановлюється більше машиночитабельних даних. Цей список неповний:
- {{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
- {{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>
Машиночитабельні дані, що встановлюються шаблонами розташування
{{Location}} і подібні шаблони додають машиночитабельні геодані в такому форматі: <span class="geo">12.34;24.68</span>
(широта і довгота як числа з рухомою комою, відокремлені крапкою з комою). Координати використовують систему WGS84 (ту ж, що й GPS і більшість карт онлайн). Див. Вікісховище:Геокодування, щоб дізнатися більше.
Використання
MediaWiki API
(Відкрийте в пісочниці API) — відкриває деякі корисні параметри, такі як Credit, Artist, LicenseUrl і Copyrighted та використовується, наприклад, Медіапереглядачем.
Скрипти, що використовують машиночитабельні дані
- MediaWiki:Gadget-Stockphoto.js
- MediaWiki:GallerySlideshow.js
- MediaWiki:Gadget-AddInformation.js
- MediaWiki:FileContentsByBot.js
Зовнішні інструменти
Див. також
- Category:Templates generating microformats
- Commons:WikiProject Microformats
- Category:Files with lack of machine-readability
- Експериментальні, припинені проекти: Commons:API, Commons:Commons API
Визначення нових машиночитабельних даних
- Там, де це можливо, охоплюйте дійсні дані, не лише якийсь заголовок поля. Цей останній метод історично використовується в наших шаблонах «Information», але в довготривалій перспективі його значно важче підтримувати.
- Охоплюйте самі дані, а не те, яким чином вони форматуються.
- Очікуйте, що форматування буде втрачено при конвертації даних. Візуальне оформлення не є частиною інформації.
- Не охоплюйте по декілька одиниць інформації в межах одного поля. Є різниця між датою публікації і датою створення. Обидва ці значення є датами, але вони є різними «полями даних». Також CC-by-SA-4.0-3.0-2.5 не є назвою ліцензії (Licensename), це — три ліцензії з назвами CC-by-SA-##.
- Переконайтесь, що значення даних має лише один елемент, або виводить відповідний елемент.
- Don't wrap multiple units of information inside one field. There is a difference between a publication date and a creation date. Both are dates, but both are different 'data fields'. Also CC BY-SA-4.0-3.0-2.5 is not a license name, those would be 3 licenses with the name CC BY-SA-##.
- Make sure that the data value has one unit, or outputs one consistent unit.
Проблеми
Є декілька речей, які зараз або НЕ розпізнаються, або розпізнаються погано. До них належать:
- Derivative works
- Works included in works. See also Category:FoP_templates
- licenses derivates or works included in works are a mess.
- Author vs. Copyright holder
- usernames vs 'real names'
- Catalogue IDs etc
- VRTS permissions
- Publication date vs creation date
- Donating institutions of materials
- Anything that is NOT using the above structures is not recognizable at all and will require manual cleanup at some point.
- Heirs: {{Heirs-license}}
- Multilicensed CC works, that use {{Cc-by-3.0,2.5,2.0,1.0}}, {{Cc-by-sa-2.5,2.0,1.0}}, {{Cc-by-sa-4.0,3.0,2.5,2.0,1.0}} or {{Cc-by-all}}.
- Non-licensed works: {{Copyrighted free use}}, {{Attribution}} (Problem, how to describe this grant of rights success ?)
- Improvised File description templates like User:Tevaprapas/Information
- Templates denoting the copyright of partials of the work: {{Copyright information}}