Commons:Machine-readable data/nl
Op Wikimedia Commons zijn veel metadata (inclusief licentie en auteur) niet machine-leesbaar. Er is een API-module, iiprop=extmetadata die kan worden gebruikt om enkele waarden op te halen (voorbeeld), maar aangezien de informatie als vrije tekst in de bestandsbeschrijvingspagina zelf wordt ingevoerd, is dit niet perfect. Het lopende project Gestructureerde data op Commons heeft tot doel de metadata te verplaatsen als volledig gestructureerde gegevens en zal uiteindelijk de machine-leesbare gegevens op deze pagina vervangen.
In de tussentijd, en om de overgang naar meer gestructureerde gegevens in de toekomst te vergemakkelijken, gebruikt Wikimedia Commons een reeks standaardsjablonen die op een bepaalde manier machinaal leesbaar zijn gemaakt door middel van HTML-elementen. Sommige scripts maken daar al gebruik van. Het is vermeldenswaard dat deze gegevens beschikbaar zijn voor elke wiki die Wikimedia Commons gebruikt, waar ze kunnen worden gelezen uit de html van de File: pagina, net als andere lokale gegevens.
Machine-leesbare gegevens
Machine-leesbare gegevens gevuld door infobox sjablonen
Dit zijn verschillende standaard infobox sjablonen die verschillende elementen van het sjabloon taggen met verschillende tags om parsing van de informatie mogelijk te maken. Er worden verschillende stijlen tags gebruikt:
- Microformaat tags voldoen aan de industriestandaarden en kunnen worden verwerkt door al bestaande hulpmiddelen.
- <td> id Attributen (identifiers) zijn aangepaste markeringen die completere tags mogelijk maken, die moeten worden gelezen door hulpmiddelen. De meeste universele infoboxen hebben een structuur met twee kolommen: kolom #1 bevat de naam van het veld en kolom #2 bevat de waarde
- Traditioneel werden <td> id-attributen gebruikt om de naam te zetten in de eerste kolom in een rij. Om de gegevens te krijgen, moet u de inhoud van de volgende
<td>
cel in de tweede kolom krijgen. - {{Creator}} en {{Institution}} sjablonen hebben een meer gecompliceerde structuur, dus de cellen met de werkelijke gegevens worden getagd met
een magenta achtergrond
.
- Traditioneel werden <td> id-attributen gebruikt om de naam te zetten in de eerste kolom in een rij. Om de gegevens te krijgen, moet u de inhoud van de volgende
Sjabloon | Sjabloonparameter naam | Beschrijving | <td> id attribuut | Microformaat | Opmerkingen |
---|---|---|---|---|---|
{{Information}} | description | bestandsbeschrijving | fileinfotpl_desc |
hProduct.description. | Bevat vaak meerdere talen geannoteerd met {{Lang}}. |
{{Information}} | date | datum waarop het oorspronkelijke werk is gemaakt | fileinfotpl_date |
hCalendar vevent.dtstart | Soms aanvullend, of alleen, bevat de publicatiedatum. Deze twee datums hebben verschillende betekenissen voor het auteursrecht. Bij gebruik kan {{Date context}} kan het verschil aangeven. Microformaat toegevoegd door {{Date}} sjabloon |
{{Information}} | source | bron van het bestand | fileinfotpl_src |
Vaak bevat hele tabellen. We hebben nog geen goede manier om te gaan met deze bron sjablonen. De bronsjablonen bevatten vaak verwijzingen naar catalogus-ID's, maar deze zijn ook niet machineleesbaar. | |
{{Information}} | author | auteur van het bestand | fileinfotpl_aut |
Dit kan een auteur, maker en/of auteursrechthebbende zijn en het wordt gemengd gebruikt. Bevat vaak het {{Creator}} sjabloon dat hieronder wordt beschreven. | |
{{Information}} | permission | toestemming/licentie voor het bestand | fileinfotpl_perm |
||
{{Information}} | other versions | andere versies van het bestand | fileinfotpl_ver |
||
{{Artwork}} | description | beschrijving van het kunstwerk | fileinfotpl_desc |
hProduct.description | |
{{Artwork}} | date | datum van aanmaak van het oorspronkelijke kunstwerk | fileinfotpl_date |
hCalendar vevent.dtstart | microformaat toegevoegd door het sjabloon {{Date}} |
{{Artwork}} | source | bron van het bestand | fileinfotpl_src |
||
{{Artwork}} | artist | maker van het kunstwerk | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | author | auteur van het kunstwerk | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | permission | toestemming/licentie voor het bestand en het kunstwerk | fileinfotpl_perm |
||
{{Artwork}} | other versions | andere versies van het bestand | fileinfotpl_ver |
||
{{Artwork}} | title | titel van het kunstwerk | fileinfotpl_art_title |
hProduct.fn | |
{{Artwork}} | object type | kunstwerk objecttype | fileinfotpl_art_object_type |
||
{{Artwork}} | medium | techniek of medium van het kunstwerk | fileinfotpl_art_medium |
||
{{Artwork}} | dimensions | afmetingen van het kunstwerk | fileinfotpl_art_dimensions |
||
{{Artwork}} | gallery | instelling die het kunstwerk bezit | fileinfotpl_art_gallery |
||
{{Artwork}} | location | plaatsing van het kunstwerk binnen de instelling | fileinfotpl_art_location |
hProduct.locality | |
{{Artwork}} | accession number | toetredingsnummer van het kunstwerk | fileinfotpl_art_id |
hProduct.identifier | |
{{Artwork}} | object history | objectgeschiedenis van het kunstwerk | fileinfotpl_art_object_history |
||
{{Artwork}} | exhibition history | tentoonstellingsgeschiedenis van het kunstwerk | fileinfotpl_art_exhibition_history |
||
{{Artwork}} | credit line | bedankregel van het kunstwerk | fileinfotpl_art_credit_line |
||
{{Artwork}} | inscriptions | inscripties op het kunstwerk | fileinfotpl_art_inscriptions |
||
{{Artwork}} | notes | aantekeningen over het kunstwerk | fileinfotpl_art_notes |
||
{{Artwork}} | references | referenties naar het kunstwerk | fileinfotpl_art_references |
||
{{Book}} | Author | auteur van het boek | fileinfotpl_author |
||
{{Book}} | Editor | redacteur van het boek | fileinfotpl_book_editor |
||
{{Book}} | Translator | vertaler van het boek | fileinfotpl_book_translator |
||
{{Book}} | Illustrator | illustrator van het boek | fileinfotpl_book_illustrator |
||
{{Book}} | Title | titel van het boek | fileinfotpl_book_title |
||
{{Book}} | Subtitle | ondertitel van het boek | fileinfotpl_book_subtitle |
||
{{Book}} | Series title | serie-titel van het boek | fileinfotpl_book_series-title |
||
{{Book}} | Authority file | autoriteitscontrole gegevens | fileinfotpl_book_authority |
||
{{Book}} | Publisher | uitgever van het boek | fileinfotpl_book_publisher |
||
{{Book}} | Printer | drukker van het boek | fileinfotpl_book_printer |
||
{{Book}} | Year of publication | datum of jaar van publicatie van het boek | fileinfotpl_date |
||
{{Book}} | Place of publication | plaats of stad van de publicatie van het boek | fileinfotpl_book_place-of-publication |
||
{{Book}} | Language | taal van het boek | fileinfotpl_book_language |
||
{{Book}} | Description | beschrijving van het boek | fileinfotpl_desc |
||
{{Creator}} | Name | Naam van de maker | creator |
vCard.fn | |
{{Creator}} | Alternative names | Alternatieve namen van de maker | fileinfotpl_creator_alt-name_value |
vCard.nickname | |
{{Creator}} | Description | Nationaliteit en beroep(en) van de maker | fileinfotpl_creator_desc_value |
vCard.note | |
{{Creator}} | Date of death | Datum van overlijden van de maker | fileinfotpl_creator_deathdate_value |
||
{{Creator}} | Date of birth | Geboortedatum van de maker | fileinfotpl_creator_birthdate_value |
vCard.bday | |
{{Creator}} | Location of birth/death | Plaats overlijden van de maker | fileinfotpl_creator_deathloc_value |
||
{{Creator}} | Location of birth | Plaats geboorte van de maker | fileinfotpl_creator_birthloc_value |
||
{{Creator}} | Work period | Werkperiode van de maker | fileinfotpl_creator_work-period_value |
||
{{Creator}} | Work location | Werklokatie van de maker | fileinfotpl_creator_work-location_valuev |
||
{{Creator}} | Image | portret of foto van de maker | fileinfotpl_creator_image |
||
{{Creator}} | Authority file | Autoriteitscontrole met betrekking tot de maker | fileinfotpl_creator_authority_value |
| |
{{FileContentsByBot}} | (verscheidene) | hangt af van, bekijk {{FileContentsByBot}}. | (various) |
hproduct-by-bot | Grote gegevensset en nog steeds groeiend, bekijk {{FileContentsByBot}} |
{{Photograph}} | title | titel van de foto | fileinfotpl_art_title |
hProduct.fn | |
{{Photograph}} | description | beschrijving van de foto | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | original description | originele archiefbeschrijving van de foto | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | date | datum van aanmaak van het oorspronkelijke kunstwerk | fileinfotpl_date |
hCalendar vevent.dtstart | microformaat toegevoegd door het sjabloon {{Date}} |
{{Photograph}} | medium | techniek of medium van de foto | fileinfotpl_art_medium |
||
{{Photograph}} | dimensions | afmetingen van de foto | fileinfotpl_art_dimensions |
||
{{Photograph}} | artist | maker van de foto | fileinfotpl_aut |
"hProduct.fn value" | |
{{Photograph}} | institution | instelling die het kunstwerk bezit | fileinfotpl_art_gallery |
||
{{Photograph}} | location | plaats van de foto binnen de instelling | fileinfotpl_art_location |
hProduct.locality | |
{{Photograph}} | source | bron van het bestand | fileinfotpl_src |
||
{{Photograph}} | permission | toestemming/licentie voor het bestand en het kunstwerk | fileinfotpl_perm |
||
{{Photograph}} | other versions | andere versies van het bestand | fileinfotpl_ver |
||
{{Photograph}} | accession number | toetredingsnummer van de foto | hProduct.identifier |
Alternatief formaat voor CommonsMetadata
Omdat het op tabel + id gebaseerde formaat erg moeilijk bleek toe te voegen aan sjablonen die niet op dezelfde manier waren opgemaakt als het Commons-informatiesjabloon, CommonsMetadata is er een alternatief formaat toegestaan, vergelijkbaar met licentiesjablonen: het hele informatiesjabloon moet worden ingesloten in een class fileinfotpl
en de tag met de specifieke informatie moet een class fileinfotpl_*
hebben (dezelfde namen als hierboven, maar class, geen id).
Machine-leesbare gegevens gevuld door licentie sjablonen
Ingevoerd in oktober 2010, gebruikt classes <span class="licensetpl_XXX">
licensetpl
- Een element dat een licentie identificeert. Verpakt de volledige licentiecode en moet een ENKELE licentie zijn, geen multilicentie.
licensetpl_short
- Korte naam van del licentie: “Public domain”, “CC BY-SA 3.0”, “CC by 2.0 fr”, etc.
licensetpl_long
- Lange naam van de licentie: “Public domain”, “Creative Commons Attribution-Share Alike 3.0”,
licensetpl_attr_req
- Of toeschrijving vereist is. “true” of “false”.
licensetpl_attr
- De gevraagde naamsvermelding: Vrije tekst.
licensetpl_link_req
- Of er voor deze licentie een link naar de licentie nodig is. “true” of “false”.
licensetpl_link
- De link naar de licentieakte. “www.creativecommons.org/licenses/by-sa/XXX/YYY”
licensetpl_nonfree
- “true“ als dit een niet-vrije licentie is (niet gebruikt op Commons, alleen op wiki's met een EDP)
Meerdere licensetpl
-blokken voor hetzelfde werk kunnen in een blok worden geplaatst met behulp van de class licensetpl_wrapper
.
Sjablonen die deze informatie instellen
- Sjablonen die
licensetpl
instellen zijn: {{PD-Layout}}, {{Cc-by-sa-3.0-migrated}}, {{Cc-by-layout}}, {{Cc-by-sa-layout}}, {{Cc-zero}}, {{FAL}}, {{GFDL}}, {{GFDL-1.2}}, {{GPL}} en {{LGPL}}.
Machine-leesbare gegevens gevuld door sjablonen voor stijlopmaak
Stijlopmaaksjablonen, bedoeld om uniforme stijlen te bieden aan verschillende families van niet-licentiesjablonen, bevatten machineleesbare gegevens die deze families identificeren.
Sjabloon | Doel | classname |
---|---|---|
{{Restriction-Layout}} | gebruikt door tags voor beperkingen | restrictiontemplate
|
{{FoP-Layout}} | gebruikt door tags voor vrijheid van panorama | foptemplate
|
{{Partnership-Layout}} | gebruikt door Partnerschap sjablonen | partnershiptemplate
|
{{Source-Layout}} | gebruikt door generieke Bron sjablonen | sourcetemplate
|
{{Created with}} | gebruikt door sjablonen die de aanmaak met hulpmiddel of sjabloon beschrijven | createdwithtemplate
|
Machine-leesbare gegevens gevuld door niet-licentie beperkende sjablonen
Sjablonen met betrekking tot wettelijke beperkingen die geen auteursrecht hebben, bevatten deze classes om specifieke soorten beperkingen te identificeren.
Sjablonen | Doel | classname |
---|---|---|
{{Trademarked}} | Afbeeldingen met handelsmerk | restriction-trademarked
|
{{Copydesign}} | Auteursrechtelijk beschermde ontwerpen | restriction-design
|
{{Communist symbol}} | Communistische symbolen | restriction-communist
|
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} | Italiaanse cultuurgoederen | restriction-ita-mibac
|
{{Australian Commonwealth reserve}} | Australische reserves | restriction-aus-reserve
|
{{Personality rights}} {{Romania personality rights}} | Persoonlijkheidsrechten | restriction-personality
|
{{2257}} | Waarschuwing i.v.m. 'Wet op de kinderbescherming en obsceniteit' (VS) | restriction-2257
|
{{Costume}} | Kleding | restriction-costume
|
{{Fan art}} | Fan art | restriction-fan-art
|
{{Currency}} | Valuta | restriction-currency
|
{{IHL Symbol}} | Symbolen die door internationaal humanitair recht zijn beperkt | restriction-ihl
|
{{Nazi symbol}} | Nazi- en fascistische symbolen | restriction-nazi
|
{{Insignia}} | Officiële insignes | restriction-insignia
|
Machineleesbare gegevens door specifieke sjablonen gevuld
Er worden meer machinaal leesbare gegevens gevuld. Hier is een niet-uitputtende lijst:
- {{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
- {{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>
Machine-leesbare gegevens gevuld door locatie sjablonen
{{Location}} en soortgelijke sjablonen voeg machinaal leesbare geocodes toe in de volgende indeling: <span class="geo">12.34;24.68</span>
(lengte- en breedtegraad als drijvendekommagetallen, gescheiden door een puntkomma). De coördinaten maken gebruik van het en:WGS84 systeem (hetzelfde als de GPS en de meeste online kaarten). Zie de details.
Gebruik
MediaWiki API
De MediaWiki API bedient nu een beperkt aantal metadata. Beschouw de volgende query:
(Openen in API-zandbak) die enkele nuttige parameters retourneert, zoals Credit, Artist, LicenseUrl en Copyrighted en wordt gebruikt door bijvoorbeeld MediaViewer.
Scripts die machineleesbare gegevens gebruiken
- MediaWiki:Gadget-Stockphoto.js
- MediaWiki:GallerySlideshow.js
- MediaWiki:Gadget-AddInformation.js
- MediaWiki:FileContentsByBot.js
Externe hulpmiddelen
Zie ook
- Category:Templates generating microformats
- Commons:WikiProject Microformats
- Category:Files with lack of machine-readability
- Experimentele, beëindigde projecten: Commons:API, Commons:Commons API
Nieuwe machine-leesbare gegevens definiëren
- Gebruik GEEN HTML id's, gebruik classes. Een ID kan slechts één keer per pagina worden gebruikt en de meeste van deze velden kunnen meerdere keren per pagina voorkomen. Denk bijvoorbeeld aan beschrijvingen van afgeleide werken, die informatie kunnen bevatten over het origineel en het afgeleide.
- Wikkel indien mogelijk de werkelijke gegevens in, niet met een veldkop. Deze laatste methode wordt van oudsher gebruikt voor al onze informatiesjablonen, maar is op de lange termijn veel moeilijker te ondersteunen.
- Wikkel gegevens in, niet de manier waarop de gegevens zijn opgemaakt.
- Verwacht dat de opmaak verloren gaat bij het converteren naar gegevens. Visuele opmaak maakt geen deel uit van de informatie.
- Plaats niet meerdere informatie-eenheden in één veld. Er is een verschil tussen een publicatiedatum en een aanmaakdatum. Beide zijn datums, maar beide zijn verschillende 'datavelden'. Ook CC BY-SA-4.0-3.0-2.5 is geen licentienaam, dat zouden 3 licenties zijn met de naam CC BY-SA-##.
- Zorg ervoor dat de gegevenswaarde één eenheid heeft of één consistente eenheid teruggeeft.
Problemen
Er zijn een paar dingen die op dit moment NIET of slecht herkenbaar. Deze omvatten:
- Afgeleide werken
- Werken die onderdeel zijn van een werk. Zie ook deze categorie
- licenties van afgeleide werken of werken die in werken zijn opgenomen, zijn een puinhoop.
- Verschil tussen auteur en licentiehouder
- gebruikersnamen en 'echte namen'
- Catalogue-IDs enz.
- VRTS rechten
- Verschil tussen publicatiedatum en aanmaakdatum
- Schenkingen van materialen aan instellingen
- Alles wat GEEN gebruik maakt van de bovenstaande structuren is helemaal niet herkenbaar en zal op een gegeven moment handmatig moeten worden opgeschoond.
- Erfgenamen: {{Heirs-license}}
- CC-werken met meerdere licenties, die {{Cc-by-3.0,2.5,2.0,1.0}}, {{Cc-by-sa-2.5,2.0,1.0}}, {{Cc-by-sa-4.0,3.0,2.5,2.0,1.0}} of {{Cc-by-all}} gebruiken.
- Niet-gelicentieerde werken: {{Copyrighted free use}}, {{Attribution}} (Probleem, hoe beschrijft men het succes van deze toekenning van rechten?)
- Geïmproviseerde bestandsbeschrijvingssjablonen zoals User:Tevaprapas/Information
- Sjablonen die het auteursrecht van delen van het werk aanduiden: {{Copyright information}}