البيانات الوصفية، غالبًا ما يشار إليها على أنها بيانات تصف بيانات أخرى، فالميتا داتا هي بيانات مرجعية منظمة تساعد في فرز وتحديد سمات المعلومات التي تصفها.
في Zen and the Art of Metadata Maintenance، يصف John W. Warren البيانات الوصفية بأنها “كل من الكون والحمض النووي.”
تدور إدارة الميتا داتا في جوهرها حول تمكين الأشخاص من تحديد سمات جزء معين من البيانات باستخدام واجهة مستخدم قائمة على الويب. تعرف على أمثلة على البيانات الوصفية. وكافة meta data شرح كامل.
ما هي البيانات الوصفية
البيانات الوصفية، هي بادئة تعني في معظم استخدامات تكنولوجيا المعلومات “تعريفًا أو وصفًا أساسيًا.” تلخص الميتا داتا معلومات أساسية حول البيانات، مما يسهل العثور على مثيلات معينة من البيانات واستخدامها وإعادة استخدامها. على سبيل المثال، يعد المؤلف وتاريخ الإنشاء وتاريخ التعديل وحجم الملف أمثلة على البيانات الأولية لملف المستند الأساسي. إن امتلاك القدرة على البحث عن عنصر معين (أو عناصر) من تلك الميتا الوصفية يجعل من السهل على أي شخص تحديد موقع مستند معين.
بالإضافة إلى ملفات المستندات، تُستخدم البيانات الوصفية من أجل:
- ملفات الكمبيوتر
- الصور
- قواعد البيانات العلائقية
- جداول البيانات
- أشرطة فيديو
- ملفات صوتية
- صفحات الانترنت
أهمية الميتا داتا
يمكن أن يكون استخدام الميتا داتا على صفحات الويب مهمًا جدًا.
- تحتوي الميتا داتا على أوصاف لمحتويات الصفحة،
فبالإضافة إلى الكلمات الرئيسية المرتبطة بالمحتوى. غالبًا ما يتم عرض هذه البيانات الوصفية في نتائج البحث بواسطة محركات البحث،
مما يعني أن دقتها وتفاصيلها يمكن أن تؤثر على ما إذا كان المستخدم يقرر زيارة أحد المواقع أم لا. عادة ما يتم التعبير عن هذه المعلومات في شكل علامات وصفية . - تقوم محركات البحث بتقييم العلامات الوصفية للمساعدة في تحديد مدى ملاءمة صفحة الويب.
- كما تم استخدام العلامات الوصفية كعامل رئيسي في تحديد الموقع في البحث حتى أواخر التسعينيات،
فأدت الزيادة في تحسين محركات البحث ( SEO ) في نهاية التسعينيات إلى قيام العديد من مواقع الويب بحشو البيانات الوصفية بالكلمات الرئيسية لخداع محركات البحث،
مما يجعل مواقع الويب الخاصة بهم تبدو أكثر صلة من غيرها.
منذ ذلك الحين، قللت محركات البحث من اعتمادها على العلامات الوصفية، على الرغم من أنها لا تزال تؤخذ في الاعتبار عند فهرسة الصفحات.
تحاول العديد من محركات البحث أيضًا إحباط قدرة صفحات الويب على خداع نظامها من خلال تغيير معايير التصنيف الخاصة بها بانتظام، حيث تشتهر Google بتغيير خوارزميات التصنيف الخاصة بها بشكل متكرر.
حالات استخدام البيانات الوصفية
- يتم إنشاء البيانات الأولية في أي وقت يتم فيه تعديل مستند أو ملف أو أصل معلومات آخر، بما في ذلك حذفه.
- كما يمكن أن تكون البيانات الوصفية الدقيقة مفيدة في إطالة عمر البيانات الحالية من خلال مساعدة المستخدمين على إيجاد طرق جديدة لتطبيقها.
- تنظم الميتا الوصفية كائن بيانات باستخدام المصطلحات المرتبطة بهذا الكائن المحدد.
كما أنه يتيح التعرف على الكائنات غير المتشابهة وإقرانها بكائنات متشابهة للمساعدة في تحسين استخدام أصول البيانات. - كما لوحظ، تحدد محركات البحث والمتصفحات محتوى الويب الذي سيتم عرضه من خلال تفسير علامات البيانات الوصفية المرتبطة بمستند HTML .
حيث تمت كتابة لغة الميتا الوصفية لتكون مفهومة لكل من أنظمة الكمبيوتر والبشر، وهو مستوى من التقييس يساهم في تحسين قابلية التشغيل البيني والتكامل بين التطبيقات المختلفة وأنظمة المعلومات. - تستخدم الشركات العاملة في مجالات النشر الرقمي والهندسة والخدمات المالية والرعاية الصحية والتصنيع البيانات الوصفية لجمع رؤى حول طرق تحسين المنتجات أو ترقية العمليات.
على سبيل المثال، يقوم موفرو محتوى البث بأتمتة إدارة البيانات الوصفية للملكية الفكرية بحيث يمكن تخزينها عبر مجموعة من التطبيقات، - وبالتالي حماية أصحاب حقوق الطبع والنشر وفي نفس الوقت جعل الموسيقى ومقاطع الفيديو في متناول المستخدمين المصادق عليهم.
تاريخ وأصول البيانات الوصفية
جاك إي مايرز، مؤسس Metadata Information Partners (الآن The Metadata Co.)، يدعي أنه صاغ المصطلح في عام 1969.
قدم مايرز علامة تجارية للكلمة غير المفصولة “metadata” في عام 1986. وعلى الرغم من ذلك، تظهر الإشارات إلى المصطلح في الأوراق الأكاديمية التي سبقت مطالبة مايرز.
في بحث أكاديمي نُشر عام 1967 ، وصف أساتذة معهد ماساتشوستس للتكنولوجيا ديفيد جريفيل وستيوارت ماكنتوش البميتا الوصفية بأنها “سجل… لسجلات البيانات” التي تنتج عندما يتم جمع البيانات الببليوغرافية حول موضوع ما من مصادر منفصلة.
لكن خلص الباحثون إلى أن “النهج اللغوي الفوقي” أو “اللغة الوصفية” ضروري لتمكين نظام الكمبيوتر من تفسير هذه البيانات بشكل صحيح وسياقها إلى أجزاء أخرى من البيانات ذات الصلة.
على عكس مايرز، تعامل Griffel و McIntosh مع “meta” كبادئة لـ “data”.
أنواع البيانات الوصفية والأمثلة
يتم تصنيف الميتا الوصفية بشكل مختلف بناءً على الوظيفة التي تخدمها في إدارة المعلومات.
- أولا: البيانات الوصفية القانونية وتوفر معلومات حول الترخيص الإبداعي، مثل حقوق النشر والترخيص والإتاوات.
- ثانيا: الميتا داتا للحفظ وترشد وضع عنصر البيانات داخل إطار عمل أو تسلسل هرمي.
- ثالثا: البيانات الوصفية للعملية وتحدد الإجراءات المستخدمة لجمع البيانات الإحصائية ومعالجتها. الميتا داتا الإحصائية هي مصطلح آخر للبيانات الوصفية للعملية.
- رابعا: الميتا داتا للمصدر، والمعروفة أيضًا باسم سلالة البيانات، تتعقب تاريخ جزء من البيانات أثناء انتقالها عبر المؤسسة،
ويتم إقران المستندات الأصلية بالبيانات الوصفية لضمان صحة البيانات أو لتصحيح الأخطاء في جودة البيانات. . - خامسا: الميتا داتا المرجعية وتتعلق بالمعلومات التي تصف جودة المحتوى الإحصائي.
- سادسا: البيانات الإحصائية البيانات التي تمكن المستخدمين من تفسير واستخدام الإحصائيات الموجودة في التقارير والاستطلاعات والخلاصة الوافية بشكل صحيح.
- سابعا: الميتا الوصفية الهيكلية تكشف عن كيفية تجميع العناصر المختلفة لكائن بيانات مركب.
غالبًا ما تُستخدم الميتا داتا الهيكلية في محتوى الوسائط الرقمية.
كيفية استخدام البيانات الوصفية بشكل فعال
تقوم الشركات بتطبيق إدارة البيانات الوصفية لاستخلاص البيانات القديمة وتطوير تصنيف لتصنيف البيانات وفقًا لقيمتها التجارية.
أحد مكونات هذا هو فهرس أو قاعدة بيانات مركزية تعمل كمستودع بيانات تعريف، يُعرف أيضًا باسم قاموس البيانات.
بالإضافة إلى تصنيف البيانات، تُستخدم استراتيجيات إدارة البيانات الوصفية لتحسين تحليلات البيانات، وتطوير سياسة حوكمة البيانات، وإنشاء مسار تدقيق للامتثال التنظيمي.
قد تكون السمة اسم الملف ومؤلفه ورقم معرف العميل وما إلى ذلك. وبالتالي يكون الشخص الذي يطلب المستند قادرًا على رؤية وفهم السمات المختلفة للبيانات ونظام المؤسسة الذي يقيم فيه وأسباب إنشاء هذه السمات.
اعتبارًا من نوفمبر 2020 ، تم تصنيف Alation و ASG و Alex Solutions و Collibra و Erwin و IBM و Informatica و Oracle و SAP و SmartLogic،
بين بائعي منصات إدارة الميتا داتا الرائدين من قبل شركة Gartner لتحليل تكنولوجيا المعلومات في Magic Quadrant لحلول إدارة البيانات الوصفية .
توحيد الميتا داتا
تم تطوير عدد من معايير الصناعة لجعل الميتا داتا أكثر فائدة. تضمن هذه المعايير الاتساق في اللغة المشتركة والتنسيق والهجاء والسمات الأخرى المستخدمة لوصف البيانات.
حيث يعتمد كل معيار على مخطط محدد يوفر بنية شاملة لجميع البيانات الوصفية الخاصة به.
لكن تسمح الميتا داتا الإدارية للمسؤولين بفرض قواعد وقيود تحكم الوصول إلى البيانات وأذونات المستخدم.
كما يقدم معلومات عن الصيانة المطلوبة وإدارة موارد البيانات. غالبًا ما تستخدم البيانات الوصفية الإدارية في سياق البحث الجاري، وتتضمن تفاصيل مثل تاريخ الإنشاء وحجم الملف ونوعه ومتطلبات الأرشفة.
تحدد الميتا داتا الوصفية الخصائص المحددة لجزء من البيانات، مثل البيانات الببليوغرافية، والكلمات الرئيسية، وعناوين الأغاني، وأرقام الصوت، وما إلى ذلك.
Dublin Core
هو معيار عام مستخدم على نطاق واسع تم تطويره في الأصل للمساعدة في فهرسة كتالوجات بطاقات المكتبة المادية.
تم تكييف المعيار منذ ذلك الحين للبيانات الميتا الرقمية المستندة إلى الويب.
يصف دبلن كور سمات 15 عنصرًا أساسيًا من عناصر البيانات: العنوان، والمنشئ، والموضوع، والوصف، والناشر، والمساهمون، والتاريخ، والنوع، والشكل، والمعرف، والمصدر، واللغة، والعلاقة، والتغطية وإدارة الحقوق.
XML
معيار البيانات الوصفية الببليوغرافي المماثل هو مخطط وصف كائنات الميتا داتا، وهو مخطط قائم على XML للمكتبات،
تم إنشاؤه بواسطة مكتب تطوير الشبكة والمعايير التابع لمكتبة الكونجرس الأمريكية كخلف لمعايير الكتالوج المقروء آليًا التي تم تطويرها في الستينيات.
schema.org
المعيار الأحدث schema.org، يعتمد على تعاون برمجي مفتوح المصدر يوفر مجموعة من مخططات البيانات الوصفية الموجهة لبيانات الإنترنت المنظمة والبريد الإلكتروني وأشكال أخرى من البيانات الرقمية.
الخلاصة
- يخفف نضج تقنيات الذكاء الاصطناعي إلى حد ما العبء التقليدي لإدارة البيانات الوصفية عن طريق أتمتة العمليات اليدوية السابقة لفهرسة أصول المعلومات ووسمها.
- أدى المعدل المتسارع لنمو البيانات إلى تغذية اهتمام جديد بقيمة الأعمال المحتملة التي يمكن اشتقاقها من الميتا داتا.
- توجد مجموعة متنوعة من هياكل البيانات التي تقدم كل من الفرص والتحديات.
- في عام 1964، بدأ رائد في علوم الكمبيوتر يدعى Philip R. Bagley العمل في أطروحته، حيث جادل بأن الجهود المبذولة “لإنشاء عناصر بيانات مركبة” تعتمد في النهاية على القدرة على “الارتباط صراحة”
بعنصر بيانات ثانٍ وذات صلة، والتي “يمكن أن نطلق عليها” عنصر البيانات الوصفية “. على الرغم من رفض أطروحته، - حيث تم نشر عمل باجلي، بما في ذلك إشارته إلى البيانات الوصفية، في وقت لاحق كتقرير بموجب عقد مع مكتب القوات الجوية الأمريكية للبحوث العلمية في يناير 1969.
- توفر إدارة بيانات وصفية إطارًا تنظيميًا لمواءمة مجموعات البيانات المنفصلة المخزنة عبر نظام مختلف. كما أنه يوفر إجماعًا تنظيميًا لوصف المعلومات، وغالبًا ما يتم تقسيمها إلى بيانات تجارية وتشغيلية وتقنية.
- يمكن إنشاء البيانات الوصفية يدويًا أو عن طريق المعالجة الآلية للمعلومات. يميل الإنشاء اليدوي إلى أن يكون أكثر دقة،
مما يسمح للمستخدم بإدخال أي معلومات يشعر أنها ذات صلة أو تساعد في وصف الملف. يمكن أن يكون إنشاء البيانات الوصفية الآلي أمرًا أساسيًا بدرجة أكبر،
وعادةً ما يتم عرض معلومات فقط مثل حجم الملف وامتداد الملف ووقت إنشاء الملف والشخص الذي أنشأ الملف.
اقرأ المزيد:
تمثل البيانات الوصفية بيانات حول البيانات. تعمل الميتا داتا على إثراء البيانات بالمعلومات التي تسهل العثور عليها واستخدامها وإدارتها. على سبيل المثال، تحدد علامات HTML التخطيط للقراء البشريين. كما تساعد الميتا الوصفية الدلالية أجهزة الكمبيوتر على تفسير البيانات عن طريق إضافة مراجع إلى المفاهيم في الرسم البياني للمعرفة.