كومنز:بيانات قابلة للقراءة الآلية
في ويكيميديا كومنز، الكثير من البيانات الوصفية (بما في ذلك الترخيص والمؤلف) ليست قابلة للقراءة الآلية، هناك وحدة API iiprop=extmetadata يمكن استخدامها لاسترداد بعض القيم (مثال)، ولكن بما أن المعلومات يتم إدخالها كنص حر في صفحة وصف الملف نفسها، فهذا ليس مثاليًا. يهدف مشروع البيانات الهيكلية إلى نقل البيانات الوصفية إلى قاعدة هيكلية بالكامل والتي ستحل في نهاية المطاف محل البيانات المقروءة آليًا والمقدمة في هذه الصفحة.
للتعويض عن هذا وتسهيل الانتقال نحو بيانات أكثر تنظيما في وقت لاحق; يستخدم ويكيميديا كومنز مجموعة من القوالب القياسية التي إنشاؤها قابلةً للقراءة الآلية ببعض الطرق، من خلال عناصر HTML، بعض السكريبتات تستفيد بالفعل من ذلك، تجدر الإشارة إلى أن هذه البيانات متاحة لأي ويكي باستخدام ويكيميديا كومنز; حيث يمكن قراءتها من html الملف: صفحة مثل البيانات المحلية الأخرى.
البيانات القابلة للقراءة الآلية
مجموعة البيانات القابلة للقراءة الآلية بواسطة قوالب المعلومات
هناك العديد من قوالب المعلومات المعيارية التي توسم عناصر مختلفة من القالب بوسوم مختلفة للسماحبتحليل المعلومات، يتم استخدام عدة أنماط مختلفة من الوسوم:
- وسوم Microformat تتبع معايير الصناعة ويمكن تحليلها بواسطة الأدوات الموجودة بالفعل.
- <td> سمات الهوية (المعرفات) هي علامات مخصصة تسمح بوسوم كاملة أكثر، والتي تجب قراءتها بواسطة أدوات مخصصة، تحتوي العديد من صناديق المعلومات الأكثر عمومية التي تحتوي على بنية عمودين: العمود #1 يحمل اسم الحقل ويحمل العمود #2 القيمة
- تم استخدام سمات <td> بشكل تقليدي لوسم استدعاء الاسم في العمود الأول في صف، للحصول على البيانات; ستحتاج إلى الحصول على محتويات الخلية
<td>
التالية في العمود الثاني. - يحتوي القالبان {{Creator}} و{{Institution}} على بنية أكثر تعقيدا; لذا يتم تمييز الخلايا التي تحتوي على البيانات الفعلية بـ
attributes باستخدام خلفية أرجوانية
.
- تم استخدام سمات <td> بشكل تقليدي لوسم استدعاء الاسم في العمود الأول في صف، للحصول على البيانات; ستحتاج إلى الحصول على محتويات الخلية
قالب | اسم وسيط القالب | الوصف | سمة معرف <td> | Microformat | تعليق |
---|---|---|---|---|---|
{{Information}} | description | وصف الملف | fileinfotpl_desc |
hProduct.description. | Often contains multiple languages annotated with {{Lang}}. |
{{Information}} | date | تاريخ إنشاء العمل الأصلي | fileinfotpl_date |
hCalendar vevent.dtstart | في بعض الأحيان، أو، فقط، يحتوي على تاريخ النشر، هذان التاريخان لهما معانٍ مختلفة لحقوق النشر، عند الاستخدام، يمكن أن يشير {{Date context}} إلى الفرق، تمت إضافة microformat بواسطة القالب {{Date}} |
{{Information}} | source | مصدر الملف | fileinfotpl_src |
Often contains entire tables. We have no good way to deal with this source templates yet. Source templates often have references to catalogue IDs, but these are also not machine readable. | |
{{Information}} | author | مؤلف الملف | fileinfotpl_aut |
This can be author, creator and/or copyright holder and is used mixed. Often contains the {{Creator}} template which is described below. | |
{{Information}} | permission | إذن/ترخيص للملف | fileinfotpl_perm |
||
{{Information}} | other versions | إصدارات أخرى للملف | fileinfotpl_ver |
||
{{Artwork}} | description | وصف العمل الفني | fileinfotpl_desc |
hProduct.description | |
{{Artwork}} | date | تاريخ إنشاء العمل الفني الأصلي | fileinfotpl_date |
hCalendar vevent.dtstart | microformat added by {{Date}} template |
{{Artwork}} | source | مصدر الملف | fileinfotpl_src |
||
{{Artwork}} | artist | منشئ العمل الفني | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | author | مؤلف العمل الفني | fileinfotpl_aut |
"hProduct.fn value" | |
{{Artwork}} | permission | إذن/ترخيص للملف والعمل الفني | fileinfotpl_perm |
||
{{Artwork}} | other versions | إصدارات أخرى للملف | fileinfotpl_ver |
||
{{Artwork}} | title | عنوان العمل الفني | fileinfotpl_art_title |
hProduct.fn | |
{{Artwork}} | object type | نوع كائن العمل الفني | fileinfotpl_art_object_type |
||
{{Artwork}} | medium | تقنية أو وسط العمل الفني | fileinfotpl_art_medium |
||
{{Artwork}} | dimensions | أبعاد العمل الفني | fileinfotpl_art_dimensions |
||
{{Artwork}} | gallery | مؤسسة تمتلك العمل الفني | fileinfotpl_art_gallery |
||
{{Artwork}} | location | موقع العمل الفني داخل المؤسسة | fileinfotpl_art_location |
hProduct.locality | |
{{Artwork}} | accession number | عدد انضمام العمل الفني | fileinfotpl_art_id |
hProduct.identifier | |
{{Artwork}} | object history | تاريخ كائن العمل الفني | fileinfotpl_art_object_history |
||
{{Artwork}} | exhibition history | تاريخ معرض العمل الفني | fileinfotpl_art_exhibition_history |
||
{{Artwork}} | credit line | خط إحالة العمل الفني | fileinfotpl_art_credit_line |
||
{{Artwork}} | inscriptions | النقوش على العمل الفني | fileinfotpl_art_inscriptions |
||
{{Artwork}} | notes | ملاحظات على العمل الفني | fileinfotpl_art_notes |
||
{{Artwork}} | references | المراجع المتعلقة بالعمل الفني | fileinfotpl_art_references |
||
{{Book}} | Author | مؤلف الكتاب | fileinfotpl_author |
||
{{Book}} | Editor | محرر الكتاب | fileinfotpl_book_editor |
||
{{Book}} | Translator | مترجم الكتاب | fileinfotpl_book_translator |
||
{{Book}} | Illustrator | رسام الكتاب | fileinfotpl_book_illustrator |
||
{{Book}} | Title | عنوان الكتاب | fileinfotpl_book_title |
||
{{Book}} | Subtitle | ترجمة الكتاب | fileinfotpl_book_subtitle |
||
{{Book}} | Series title | سلسلة عنوان الكتاب | fileinfotpl_book_series-title |
||
{{Book}} | Authority file | بيانات الضبط الاستنادي | fileinfotpl_book_authority |
||
{{Book}} | Publisher | ناشر الكتاب | fileinfotpl_book_publisher |
||
{{Book}} | Printer | طابع الكتاب | fileinfotpl_book_printer |
||
{{Book}} | Year of publication | تاريخ أو سنة نشر الكتاب | fileinfotpl_date |
||
{{Book}} | Place of publication | مكان أو مدينة نشر الكتاب | fileinfotpl_book_place-of-publication |
||
{{Book}} | Language | لغة الكتاب | fileinfotpl_book_language |
||
{{Book}} | Description | وصف الكتاب | fileinfotpl_desc |
||
{{Creator}} | Name | اسم المنشئ | creator |
vCard.fn | |
{{Creator}} | Alternative names | أسماء بديلة للمنشئ | fileinfotpl_creator_alt-name_value |
vCard.nickname | |
{{Creator}} | Description | جنسية ومهنة(مهن) المنشئ | fileinfotpl_creator_desc_value |
vCard.note | |
{{Creator}} | Date of death | تاريخ وفاة المنشئ | fileinfotpl_creator_deathdate_value |
||
{{Creator}} | Date of birth | تاريخ ميلاد المنشئ | fileinfotpl_creator_birthdate_value |
vCard.bday | |
{{Creator}} | Location of birth/death | موقع وفاة المنشئ | fileinfotpl_creator_deathloc_value |
||
{{Creator}} | Location of birth | مكان ولادة المنشئ | fileinfotpl_creator_birthloc_value |
||
{{Creator}} | Work period | فترة عمل المنشئ | fileinfotpl_creator_work-period_value |
||
{{Creator}} | Work location | موقع عمل المنشئ | fileinfotpl_creator_work-location_valuev |
||
{{Creator}} | Image | صورة أو بورتريه تظهر المنشئ | fileinfotpl_creator_image |
||
{{Creator}} | Authority file | الضبط الاستنادي المتعلق بالمنشئ | fileinfotpl_creator_authority_value |
| |
{{FileContentsByBot}} | (مختلف) | يعتمد; تُرجَى قراءة {{FileContentsByBot}} | (various) |
hproduct-by-bot | مجموعة كبيرة من البيانات وما زالت تنمو; تُرجَى قراءة {{FileContentsByBot}} |
{{Photograph}} | title | عنوان الصورة | fileinfotpl_art_title |
hProduct.fn | |
{{Photograph}} | description | وصف الصورة | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | original description | وصف الأرشيف الأصلي للصورة | fileinfotpl_desc |
hProduct.description | |
{{Photograph}} | date | تاريخ إنشاء العمل الفني الأصلي | fileinfotpl_date |
hCalendar vevent.dtstart | microformat added by {{Date}} template |
{{Photograph}} | medium | تقنية أو وسط من الصورة | fileinfotpl_art_medium |
||
{{Photograph}} | dimensions | أبعاد الصورة | fileinfotpl_art_dimensions |
||
{{Photograph}} | artist | منشئ الصورة | fileinfotpl_aut |
"hProduct.fn value" | |
{{Photograph}} | institution | مؤسسة تمتلك العمل الفني | fileinfotpl_art_gallery |
||
{{Photograph}} | location | موقع الصورة داخل المؤسسة | fileinfotpl_art_location |
hProduct.locality | |
{{Photograph}} | source | مصدر الملف | fileinfotpl_src |
||
{{Photograph}} | permission | إذن/ترخيص للملف والعمل الفني | fileinfotpl_perm |
||
{{Photograph}} | other versions | إصدارات أخرى للملف | fileinfotpl_ver |
||
{{Photograph}} | accession number | عدد انضمام الصورة | hProduct.identifier |
صيغة بديلة لـCommonsMetadata
لأن التنسيق المستند إلى المعرف + الجدول أثبت أنه من الصعب جدا إضافته إلى القوالب التي لم يتم تنسيقها بشكل مشابه لقالب معلومات كومنز، تسمح بيانات كومنز الوصفية بتنسيق بديل، مماثل لقوالب الترخيص: يجب أن يكون قالب المعلومات بالكامل مضمنا في فئة fileinfotpl
الذي يحتوي على معلومات محددة على فئة fileinfotpl_*
(نفس الأسماء المذكورة أعلاه، ولكن الفئة، وليس المعرف).
مجموعة البيانات القابلة للقراءة الآلية بواسطة قوالب الترخيص
تم تقديمها في أكتوبر 2010، باستخدام فئات <span class="licensetpl_XXX">
licensetpl
- عنصر يحدد الترخيص، يلتزم برمز الترخيص بالكامل ويجب أن يكون ترخيصا واحدا، وليس ترخيصا متعددا.
licensetpl_short
- الاسم المختصر للرخصة: "Public domain" ، "CC-BY-SA-3.0" ، "CC-by-2.0-FR"، إلخ.
licensetpl_long
- الاسم الطويل للرخصة: "Public domain" ، "Creative Commons Attribution-Share Alike 3.0".
licensetpl_attr_req
- ما إذا كان الإسناد مطلوبا، "صحيح" أو "خاطئ".
licensetpl_attr
- الإسناد المطلوب: نص حر.
licensetpl_link_req
- ما إذا كان هناك رابط إلى الترخيص مطلوب لهذا الترخيص، "صحيح" أو "خاطئ".
licensetpl_link
- الرابط إلى سند الترخيص، “www.creativecommons.org/licenses/by-sa/XXX/YYY”
licensetpl_nonfree
- صحيح" إذا كان هذا الترخيص غير حر (غير مستخدم في كومنز، فقط على مواقع الويكي بـEDP)
قد يتم التفاف كتل licensetpl
متعددة لنفس العمل في كتلة باستخدام الفئة licensetpl_wrapper
.
قوالب تعد هذه المعلومات
- Templates setting
licensetpl
include:
{{PD-Layout}}, {{Cc-by-sa-3.0-migrated}}, {{Cc-by-layout}}, {{Cc-by-sa-layout}}, {{Cc-zero}}, {{FAL}}, {{GFDL}}, {{GFDL-1.2}}, {{GPL}} و {{LGPL}}.
مجموعة البيانات القابلة للقراءة الآلية بواسطة قوالب تنسيق الأنماط
قوالب تنسيق النمط، يُقصَد بها توفير أنماط موحدة لعائلات القوالب غير التراخيص المختلفة، وحمل بيانات قابلة للقراءة الآلية التي تحدد هذه العائلات.
القالب | الغرض | اسم الصنف |
---|---|---|
{{Restriction-Layout}} | يُستخدَم من قبل وسوم التقييد | restrictiontemplate
|
{{FoP-Layout}} | يُستخدَم من قبل وسوم حرية البانوراما | foptemplate
|
{{Partnership-Layout}} | يُستخدَم من قبل قوالب الشراكة | partnershiptemplate
|
{{Source-Layout}} | يُستخدَم من قبل قوالب المصدر العامة | sourcetemplate
|
{{Created with}} | يُستخدَم من قبل قوالب تم الإنشاء بواسطة ... | createdwithtemplate
|
مجموعة البيانات القابلة للقراءة الآلية بواسطة قوالب تقييد حقوق النشر
قوالب بخصوص القيود القانونية غير المتعلقة بحقوق الطبع والنشر هذه الفئات لتحديد أنواع معينة من القيود.
القالب(القوالب): | الغرض | اسم الصنف |
---|---|---|
{{Trademarked}} | صور العلامات التجارية | restriction-trademarked
|
{{Copydesign}} | التصاميم المحمية بحقوق النشر | restriction-design
|
{{Communist symbol}} | الرموز الشيوعية | restriction-communist
|
{{Italy-MiBAC-disclaimer}} {{Soprintendenza}} | السلع الثقافية الايطالية | restriction-ita-mibac
|
{{Australian Commonwealth reserve}} | الاحتياطيات الأسترالية | restriction-aus-reserve
|
{{Personality rights}} {{Romania personality rights}} | حقوق الشخصية | restriction-personality
|
{{2257}} | Child Protection and Obscenity Enforcement Act warning (United States) | restriction-2257
|
{{Costume}} | الإلباس | restriction-costume
|
{{Fan art}} | فن المعجبين | restriction-fan-art
|
{{Currency}} | عملة | restriction-currency
|
{{IHL Symbol}} | الرموز المقيدة بموجب القانون الإنساني الدولي | restriction-ihl
|
{{Nazi symbol}} | الرموز النازية والفاشية | restriction-nazi
|
{{Insignia}} | الشارات الرسمية | restriction-insignia
|
مجموعة البيانات القابلة للقراءة الآلية بواسطة قوالب محددة
يتم تعيين المزيد من البيانات القابلة للقراءة الآلية، وفيما يلي قائمة غير شاملة:
- {{Personality rights}}
<span class="commons-template-name" style="display:none" id="commons-template-personality-rights">Personality rights</span>
- {{Credit line}}
<td id="fileinfotpl_credit" class="fileinfo-paramfield fileinfotpl_credit" style=""></td>
مجموعة البيانات القابلة للقراءة الآلية بواسطة قوالب الموقع
{{Location}} والقوالب المماثلة تضيف الرموز الجغرافية القابلة للقراءة الآلية بالتنسيق التالي: <span class="geo">12.34;24.68</span>
(دائرة العرض وخط الطول كأرقام فاصلة عائمة مفصولة بفاصلة منقوطة)، تستخدم الإحداثيات نظام ar:نظام المساحة العالمي 1984 (مثل نظام GPS ومعظم الخرائط على الإنترنت)، انظر الترميز الجغرافي لمزيد من التفاصيل.
الاستخدام
ميدياويكي API
يخدم ميدياويكي API الآن عددا محدودا من البيانات الوصفية، خذ بعين الاعتبار الاستعلام التالي:
(افتح في ملعب API) الذي يقوم بإرجاع بعض الوسائط المفيدة مثل الإسناد والفنان ومسار الترخيص وحقوق النسخ ويُستخدَم بواسطة عارض الوسائط، على سبيل المثال.
سكريبتات تستخدم بيانات قابلة للقراءة الآلية
- MediaWiki:Gadget-Stockphoto.js
- MediaWiki:GallerySlideshow.js
- MediaWiki:Gadget-AddInformation.js
- MediaWiki:FileContentsByBot.js
أدوات خارجية
انظر أيضا
- Category:Templates generating microformats
- Commons:WikiProject Microformats
- Category:Files with lack of machine-readability
- المشروعات التجريبية والمتوقفة: Commons:API, Commons:Commons API
تعريف البيانات القابلة للقراءة الآلية الجديدة
- عند الإمكان، قم بلف البيانات الفعلية، وليس بعض رؤوس الحقول، يتم استخدام هذه الطريقة الأخيرة في جميع قوالب المعلومات الخاصة بنا، ولكن من الأصعب بكثير دعمها على المدى الطويل.
- التفاف البيانات، وليس طريقة تنسيق البيانات.
- توقع فقدان التنسيق عند التحويل إلى البيانات، اللباس المرئي ليست جزءا من المعلومات.
- لا تقم بلف وحدات متعددة من المعلومات داخل حقل واحد، يوجد اختلاف بين تاريخ النشر وتاريخ الإنشاء، كلاهما تواريخ، لكن كليهما "حقول بيانات" مختلفة، كما أن CC-by-SA-4.0-3.0-2.5 ليس اسم ترخيص، فستكون هذه 3 تراخيص بالاسم CC-by-SA-##.
- تأكد من أن قيمة البيانات تحتوي على وحدة واحدة، أو إخراج وحدة واحدة متسقة.
- Don't wrap multiple units of information inside one field. There is a difference between a publication date and a creation date. Both are dates, but both are different 'data fields'. Also CC BY-SA-4.0-3.0-2.5 is not a license name, those would be 3 licenses with the name CC BY-SA-##.
- Make sure that the data value has one unit, or outputs one consistent unit.
مشاكل
هناك بعض الأشياء التي لا يمكن التعرف عليها حاليا أو يمكن التعرف عليها بشكل سيئ، وتشمل:
- Derivative works
- Works included in works. See also Category:FoP_templates
- licenses derivates or works included in works are a mess.
- Author vs. Copyright holder
- usernames vs 'real names'
- Catalogue IDs etc
- VRTS permissions
- Publication date vs creation date
- Donating institutions of materials
- Anything that is NOT using the above structures is not recognizable at all and will require manual cleanup at some point.
- Heirs: {{Heirs-license}}
- Multilicensed CC works, that use {{Cc-by-3.0,2.5,2.0,1.0}}, {{Cc-by-sa-2.5,2.0,1.0}}, {{Cc-by-sa-4.0,3.0,2.5,2.0,1.0}} or {{Cc-by-all}}.
- Non-licensed works: {{Copyrighted free use}}, {{Attribution}} (Problem, how to describe this grant of rights success ?)
- Improvised File description templates like User:Tevaprapas/Information
- Templates denoting the copyright of partials of the work: {{Copyright information}}