معالجة اللغات الطبيعية: التحليل الموضوعي لمصادر المعلومات


الزيادة الهــائلة في حجم المعلومات والمعرفة الموجودة على شبكة الانترنت صعبت من عملية السيطرة عليها، وأصبحت مؤسسات المعلومات غير قادرة على القيام بعملية الوصف الموضوعي التي تعتمد على القوائم أو اللغات المقيدة، وكلاهما متبع في أدوات التحليل الموضوعي التقليدية لمصادر المعلومات. وبما أن هذه الطرق ليست كافية في التعامل مع كل ما ينشر على (الإنترنت) في الوقت الحالي، فقد أصبح من الضروري وجود نظام يسمح بمشاركة كل المستفيدين في عملية وصف المعلومات المتوفرة، وذلك سعيا لتنظيمها وتسهيل عمليات الوصول إليها واتاحتها، وسنتناول في التالي التعريف بالتحليل الموضوعي وأهميته والتوجهات الحديثة فيه وأهم أدواته وتقنياته في البيئة الرقمية.

Topic modeling using LDA algorithm | NLP Part-3 | by Rahul Sood | Batteries  Included | Medium

ماهو التحليل الموضوعي في معالجة اللغات الطبيعية؟

يعرف التحليل الموضوعي بأنه مجموعة من العمليات التي تحاول التعريف بالمحتوى الموضوعي لمصادر المعلومات وأدوات البحث ويكون الوصول اليها عن طريق المدخل الموضوعي.  ويشمل ذلك مجمل طرق الوصول إلى المعلومات من خلال الموضوع سواء كانت أنظمة تصنيف أو تكشيف أو رؤوس موضوعات.

ويمكن النظر إليه بأنه عملية من عمليات تنظيم المعلومات تهتم بالمحتوى الفكري أو الموضوعي لمصادر المعلومات، ويحوي قسمين رئيسيين:

  • التحليل الموضوعي اللفظي: ويتم فيه استخدام الكلمات أو الألفاظ التي تتعلق بموضوع ومحتوى مصدر المعلومات.
  • التحليل الموضوعي الرمزي:ويتم فيه استخدام رمز (أرقام أو حروف) للدلالة على الموضوع.

اضافة لما سبق يمكن تعريف التحليل الموضوعي بأنه جزء من عمــلية إنشاء ما وراء البيانات، وهذا الجــزء معني بالتعــرف على المجال المـوضوعي لمصــدر المعلــومات المــوصوف، ويشمــل الخطــوات التــالية:      

  • إجراء تحليل مفاهيمي لتحديد محتوى مصدر المعلومات.
  • وصف ما يتكلم عنه مصدر المعلومات (المحتوى) في عبارة مكتوبة.
  • استخدام عبارة المحتوى في تخصيص المصطلحات المقيدة أو رموز التصنيف المناسبة.

كما يمكن تعريف التحليل الموضوعي بأنه “عملية فحص الوثيقة عن طريق المفاهيم التي تحتويها والتعرف الدقيق عليها بما يضمن استقبالها بصورة واضحة ويكفل اختيار الواصفات التي تناسبها.

كذلك يعرف بأنه العملية الفكرية أو الآلية التي يتم العمل عليها في تحليل موضوعات الوثيقة ومن ثم التعبير عنها في شكل بيانات.

من هنا فان التحليل الموضوعي في معناه او تعريفه الشامل  يعنى بعملية فحص الوعاء الببليوغرافي بمختلف أشكاله، كتابا أو دورية أو رسالة، وذلك عن طريق أخصائي المعلومات، والأخير يقوم بتحديد رؤوس الموضوعات والواصفات الأكثر تخصيصاً وتوصيفاً للوعاء، ومن ثم يصفها وصفا كاملا وبطريقة تسمح باستخدامها كنقاط وصول في التسجيل الببليوغرافي، وذلك بغرض التزويد بخدمة استخلاص أو وضع قاعدة البيانات الببليوجرافية او فهرسة المكتبة، و بما يمكن معه الوصول لكافة مصادر المعلومات واتاحتها للمستفيدين، ويوضح الارتباط بين المجالات الموضوعية مع مراعاة اختلاف البيئات الثقافية والجغرافية والعلمية والتعليمية والمهنية علاوة على مراعاة السمات الخاصة بالتخصصات الموضوعية.

باختصار، التحليل الموضوعي وسيلة للتعبير عن المحتوى الموضوعي لأي مصدر أو وعاء معلومات، ويكون ذلك باختيار الكلمات المفتاحية المعبرة عن الموضوع واستخدامها في الوصول والاسترجاع.

أهمية التحليل الموضوعي في معالجة اللغات الطبيعية

الغرض وربما الهدف الأساسي من التحليل الموضـوعي هو الوصـــول الى جميع المواد ذات العلاقة بالموضوعات، واتاحة مستوى من مستويات التحليل يظهر الترابط بينهـــا ويصف المحتوى الموضوعي للمفردات الشائعة، ويمثل ما سبق جوهر العمل في مؤسسات ومراكز المعلومات، اضافة الى كونه يقوم بوظيفة أساسية في بناء قاعدة البيانات وتقديمها بالفاعلية المطلوبة، وبما يحقق الاهتمام بالموضوع الذي يعبر عنه محتوى الوثيقة وليس شكل الوعاء.

ومن أهداف التحليل الموضوعي :

  1. تقديم مفردات ومواضيع ذات معنى يفيد في الوصول إلى المعلومات.
  2. اتاحة كل مصادر المعلومات ذات الطبيعة المتشابهة ضمن مجموعة واحدة.
  3. توحيد رفوف مصادر المعلومات المتشابهة وتنظيمها بصورة منطقية.
  4. اختصار وقت البحث للمستخدمين.

 خطوات التحليل الموضوعي في معالجة اللغات الطبيعية

التحليل الموضوعي يكون على خطوات أو مراحل كما يلي (شاهين، 2004):

  • تحليل المفاهيم أو تحليل محتوى مصدر المعلومات: ويقصد به فحص مصدر المعلومات وتحديد المفاهيم والأفكار التي يتناولها.
  • التعبير عن نتيجة التحليل: ويقصد به التعبير عن نتيجة تحليل المفاهيم باستخدام مجموعة من نقاط الوصول الموضوعية أو مؤشرات المحتوى (مصطلحات – رموز – عبارات أو جمل) وبما يوفر امكانية الحصول عليهـــا (اقتطافاً أو اشتقاقاً) إما من لغــــة مصدر المعلومات نفسه أو من لغة استفسارات واستفهامات المستفيدين، كما يمكن اختيارها أو تعيينها من لغة ثانية خارج نطاق مصدر المعلومات.
  • الربط بين نقاط الوصول الموضوعية وبين مصدر المعلومات: ويتم فيها إضافة أو تحديد الروابط أو موقع المعلومات. وهذه إما أن تحدد للمستفيد موقع نقاط الوصول الموضوعية داخل مصادر المعلومات تحديداً دقيقاً أو تقدم إشارات ببليوجرافية لمصادر المعلومات التي احتوت على نقاط الوصول الموضوعية في متنها.

كما أن التحليل الموضوعي يتضمن مجموعة من النشاطات من بينها (عبدالهادي، 2009):

  • إجراء تحليل مفاهيمي لتقرير ما يحتويه المصدر.
  • وصف مصدر المعلومات في بيان مكتوب.
  • استخدام قوائم الفهرسة لتعيين المصطلحات أو لتحديدها أو تحديد رموز التصنيف.

أدوات التحليل الموضوعي في معالجة اللغات الطبيعية

مع تنوع اشكــــال مصادر المعلومات وتعدد لغاتها أصبح من الصعب استرجاع المعلومات المطلوبة من قبل المستفيدين باستخــــدام الأدوات التقليدية كالتكشيف والإستخلاص، المكانز، قوائم رؤوس الموضوعات وخطط التصنيف في مؤسســــات ومراكز المعلومات، ولمـــواكبة التطــــورات الحديثة في البيئة الرقمية وتقنياتها المتعددة، فقد دعت الحاجة الى استخدام الادوات الحديثة والتي أصبحت جزء اساسي من عملية التحليل الموضوعي.

فيما يلي الأدوات التقليدية المستخدمة في التحليل الموضوعي في معالجة اللغات الطبيعية

  • التكشيف والاستخلاص

 الكشاف هو أحد أدوات استرجاع المعلومات المرتبة بطريقة محددة تضمن استرجاعها بكفاءة ودقة، وبما يمكّن المستفيد من الوصول إلى المعلومات المطلوبة عبر مصادرها المختلفة في أسرع وقت وبأيسر الطرق الممكنة. وتوجد أنواع مختلفة من الكشافات، من أمثلتها: كشاف العناوين، كشاف المؤلفين، كشاف الاستشهادات المرجعية وهكذا. أما الاستخلاص فهو عملية تحليلية تهتم بتقديم المحتوى أو ما تشتمل عليه المصادر من معلومات بأقل عدد من الكلمات، ويمكن استخدامه في كثير من الأحيان كبديل عن المصادر الأصلية وبطبيعة الحال فالمستخلص لن يكون مساوياً في الحجم لمصدر المعلومات الأصلي.

  • المكانز في معالجة اللغات الطبيعية

المكنز عبارة عن لغة مقننة تستخدم في التعبير عن ناتج التعريف بالمحتوى الموضوعي للوثائق، وتشتمل على المفردات أو المصطلحات المتخصصة في المجال موضوع الاهتمام، ويقوم المكنز بتقسيم هذه المصطلحات الى فئتين تأخذ نفس التسلسل، الفئة الأولى تهتم بالمصطلحات المرشحة للاستخدام كواصفات DESCRIPTORS والفئة الثانية تتضمن المصطلحات غير المرشحة للاستخدام أو اللاواصفات، ويرد المصطلح في المكنز مصحوبا بأسرته الدلالية كاملة.

ويمكن إجمال وظائف المكنز في التالي:

  • يسمح لأخصائي المعلومات بوصف المادة الموضوعية أو المعلومات التي تحتويها المصادر بطريقة ثابتة وموحدة من وجهات نظر فنية متعددة.
  • يعمل على إيجاد توافق بين المصطلحات التي يستخدمها المستفيدين والمصطلحات التي يستخدمها أخصائي المعلومات.
  • يعمل على إمداد المستفيدين بالوسائل التي تمكنهم من تعديل استراتيجية البحث لتحقيق درجة استرجاع عالية ومحكمة في الظروف المتنوعة.
  • يساعد على فهم بناء المجال حيث أن المكنز يعمل على تقديم خريطة لمجال معين من مجالات المعرفة تبين العلاقة وكيفية اتصال المفاهيم بعضها ببعض.
  • يعمل على تسهيل عملية البحث العريض حيث يقوم بتجميع المصطلحات المتصلة مع بعضها البعض.
  • توفير وقت وجهد المستفيدين في التفكير أثناء عملية البحث عن المصطلحات المتصلة.
  • قائمة رؤوس الموضوعات:

عباره عن قوائم مطبوعة لرؤوس الموضوعات وتستخدم كأدوات لاختيار رأس او رؤوس الموضوعات التي تعبرعن محتوى أوعية ومصادر المعلومات، ومن أشهر قوائم رؤوس الموضوعات الأجنبية والعربية:

  • قائمة رؤوس موضوعات مكتبة الكونجرس.
  • قائمة رؤوس موضوعات سيرز.
  • قائمة رؤوس الموضوعات العربية الكبرى.
  • قائمة رؤوس الموضوعات العربية.
  • خطط التصنيف:

يقصد بها الخطط التي يتم وضعها لضبط أوعية المعرفة بطريقة تسهل استخدامها والرجوع إليها ومن أشهرها:

  • تصنيف ديوي العشري، وهو من أقدم خطط التصنيف وقد قسم فيه ملفيل ديوي المعرفة البشرية إلى عشرة أقسام رئيسية.
  • التصنيف العشري العالمي، وجاء هذا التصنيف كنتيجة مباشرة لمؤتمر عقد في بروكسل عام 1895 أعلن فيه عن تأسيس معهد دولي للببليوغرافيا، والمعهد تم تغيير مسماه فيما بعد إلى الاتحاد الدولي للتوثيق والمعلومات.
  • تصنيف مكتبة الكونجرس، والمكتبة أسست في سنة 1800 ميلادية، وقد كانت مجموعتها ترتب حسب حجم الورق ولما زادت المجموعة فرضت الحاجة التفكير في تصنيف جديد وتم إنشاء هذا التصنيف الذي قسم المعرفة إلى 18 قسم.

الاتجاهات الحديثة في التحليل الموضوعي بما فيها التحليل الموضوعي في البيئة الرقمية:

كما سبق وان تنــاولنا في الكلام عن أدوات التحليــل الموضوعي، فان استخدامه على مستوى البيانات الببليوغرافية، أو الأدوات التقليدية للتحليل الموضوعي، لم يعد كافيا لتحقيق رغبات  المستفيدين و تجاوز اشكالية العلاقة العكسية بين مستويات الدقة والدقة والاسترجاع، وقد كانا من أبرز نقاط الضعف في نظم استرجاع المعلومات التي تعتمد على رؤوس الموضوعات المنتقاة من البيانات الببليوغرافية للمصادر، وبالتالي ساهمت زيادة عمليات النشر والاتاحة الرقمية لمصادر المعلومات على شبكة الانترنت، والاعتماد الكبير على محركات البحث باعتبارها نظم استرجاع آلية تضمن الوصول السريع والدقيق الى كم هائل من المعلومات الموجودة على الشبكة العنكبوتية، في حسم المعركة لصالح الأخيرة، وحتمت  استخدام الاد وات الحديثة في عملية التحليل الموضوعي كونها اكثر واوسع في عملية الاسترجاع، وسنعمل على استعراضها فيما يلي:

  • التاكسونومي Taxonomy :

يمكن تعريف التاكسونومي بأنه شكل من اشكال التنظيم الهرمي المقيد بتقسيم الظواهر والاشياء الى اقسام رئيسية وفرعية وتفريعات من الاقسام الفرعية.

كما يعرف بأنه تصنيف هرمي للأشياء بحسب العلاقات والصفات المشتركة فيما بينها. وهناك مجموعة من الميزات لاستخدام التاكسونومي، من بينها:

  • تحسين عملية البحث وعملية ادارة المصادر.
  • الاتساق في المصطلحات .
  • التوافق بين المصطلحات في الوصف والاسترجاع .
  • تحسين عملية الإتاحة والوصول الى المعلومات .

ومن أبرز العيوب والانتقادات الموجهة للتاكسونومي أنه بطيء في تحديث المصطلحات واضافة مصطلحات جديدة وتنقصه الصيانة والسرعة لمواكبة التسارع في اللغة ويحتاج بالتالي الى جهد مضاعف وتعاون وتنظيم واسع.

  • الانطولوجي Ontology:

الانطولوجيا تمثل تصنيفا هرميا معقد جداً للمفاهيم والفئات، وتستخدم كحل تقني للمشكلات ذات الطابع الدلالي في تقاسم المعلومات (Semantic-based problems) بجانب أنها تعمل على التعريف بطبيعة المصادر من خلال تعريف أو تحديد المفاهيم، الكيانات، والمصطلحات والفئات في مجال معين، ومن ثم العمل على نمذجة العلاقات بينها، وقد أنشأت الانطولوجيا بغرض فك الغموض المفاهيمي في بيئة المعلومات والبيئة الإلكترونية وبما يجعله في حدوده الدنيا قدر الامكان.

   لذا فقد تم استخدام الانطولوجيا في مجتمع علم المعلومات للدلالة على كتل البناء  (blocks building) التي يستعان بها لمساعدة الحاسبات والبشر في مشاركة المعرفة.

أما بالنسبة لتعريف الأنطولوجيا فيمكن اعتبارها نمذجة نستطيع عن طريقها التمثيل المفاهيمي للمجالات والقطاعات المعرفية، وما تمثله من معرفة فرعية وما تنطوي عليه من كيانات وعلاقات تربط بين هذه الكيانات، وتشمل وظائف الانطولوجيا في مجال التنقيب على الويب ما يلي:

  • تصنيف صفحات الويب Web Page Classification: ويكون بتصنيفها تحت مجموعة من الفئات المحددة سلفا، والتي سبق تعريفها وقد يأخذ التصنيف صورة التدرج الهرمي لمجال محدد.
  • عنقدة صفحات الويب Web Clustering: ويقصد بها تجميع صفحات الويب المتشابهة مع بعضها البعض، وبحيث تشتمل كل مجموعة على صفحات ويب متماثلة.
  • استخراج محتوى الويب Web Extraction: وتعمل على استخراج مؤشرات الصفحـــات من محددات النص الفائق HTML Elements ومن البيـانات التي يتم من خلالها توصيف الكيانات كاسم الشخص، أو المكان، أو رقم التسجيلة.
  • الفوكسونومي Folksonomy:

يعرف التصنيف الحر أو الفوكسونومي بأنه: “ناتج العملية التي يضع فيها المستفيد على الويب الكلمات أو المصطلحات التي تُعّبر عن المعلومات والأشياء، وتتم عملية تحديد الكلمات الدالّة في بيئة إجتماعية ومن خلال المستفيدين أنفسهم وبلغاتهم الطبيعية”.

وبالإمكان تعريف الفوكسونومي بأنه نظام مفتوح للفهرسة يسمح فيه للمستخدمين باختيار الكلمات الدلالية وتطبيقها بدون قيود. 

والفوكسونومي هو التوسيم الحر للمعلومات أو المحتويات على الويب (كل شيء له رابط) بغرض استرجاعها من قبل المستفيدين، وبطريقة تجعلها متاحة لمن يحتاجها.

فكرة التصنيف الحر تعتمد على وضع الرموز أو الكلمات المفتاحية والدلالية الخاصة بالمحتوى الذي يتم رفعه على الإنترنت عن طريق الشخص الذي وضع هذا المحتوى . وبالتالي يمكن لمستخدمي الشبكة الوصول إلى المحتوى عن طريق هذه الكلمات الدلالية، كما في محرك البحث (Google)، ويعمل الفوكسونومي على تجميع الواسمات المختلفة والبحث في أضيق الحدود عن طريق الوصول إلى العلاقات المترادفة والمتجانسة بين الكلمات.

ويكون إنشاء الفوكسونومي بإضافة Tag أو بطاقات داخل صفحات الويب من قبل المستخدمين. وهذه التيجان تكون بمثابة كلمات مفتاحية تصف العنصر داخل موقع الويب، وتتم عملية اختيار الكلمات الدالة أو الوصفية أو البطاقات من قبل المستخدمين.

الاعتماد على التصنيف الحر (Folksonomy) يحقق مجموعة من المزايا الهامة، من بينها:

  • الشمولية: التصنيف الحر يمتاز بالشمولية في عكس المفردات المستخدمة من قبل المستفيدين، و لهذا فهو بأنه أكثر ديموقراطية مقارنةً بالنظم الأخرى التي تعتمد على اللغات المقيدة، ويقدم هذا الأسلوب الفرصة لكل مستفيد للتعبير عن موضوع المحتوى بطريقته الخاصة، ويسمح له بمشاركة الكلمات الدلالية الموضوعة للتعبير عن المحتوى مع غيره من المستفيدين.
  • الملائمة والاتساع: التصنيف الحر بمكنه أن يستوعب المظاهر الجديدة في مجال معين وبالتالي يسمح بإضافة اسمائها ككلمات دالّة جديدة لنفس المحتوى.

أما عيوب الفوكسونومي فيمكن ايجازها في التالي:

  • صعوبة استرجاع المحتوى الذي تم رفعه في بعض الأحيان، حيث أن الشخص الذي يبحث عن موضوع معين يجب عليه أن يكون على معرفة ودراية بثقافة الآخرين حتى يتمكن من البحث باستخدام المصطلح الذي تم استخدامه من قبل الأشخاص الذين وضعوا الواصفات أو (الكلمات الدلالية).
  • استخدام مجموعة كبير من الكلمات المستخدمة لتمثل أو وصف عن محتوىً م، قد يتسبب ـ وهذه نتيجة طبيعةـ في مشكلات متعددة، لأن هذا التنوع في الكلمات ما بين مصطلحاتٍ غاية في العمومية ومصطلحات غاية في التخصيص (very general to very specific) على اعتبار أن الكلمات الدلالية الخاصة بالمحتوى قد يضعها شخص متخصص أو شخص عادي غير متخصص.
  • التوسيم Tagging :

ينظر الى التوسيم بوصفه أداة من الأدوات الحديثة للتحليل الموضوعي الحديثة، وهذه الأداة تصف وتصنف مصادر المعلومات على الويب باستخدام الكلمات المفتاحية التي تسهل الوصول اليها. ويمكن تعريف التوسيم بأنه وصف للكيانات الرقمية باستخدام الكلمات المفتاحية الحرة التي لا تخضع لأي نظام مقنن.

ويعمل المستفيدين من خلال هذه العملية على الكلمات المفتاحية لأنواع متعددة من مصادر المعلومات المعتمدة على الويب، وبما يحقق التنظيم والاسترجاع التشاركي للمعلومات. وهذا النشاط يدخل ضمن نظام فهرسة على موقع ويب ويدعم التكنولوجيات التفاعلية للويب 2.0، والتوسيم يسمح للمستفيدين بتجميع المصادر المتشابهة معاً وذلك باستخدام مصطلحاتهم الخاصة مع عدد أقل من القيود أو بدونها.

وتعتمد الواسمات في بناءها على مجموعة من الجوانب من بينها: الموضوع، الغرض، الشكل، الوقت، الأفعال وردود الأفعال، وفيما يلي الأسباب التي أدت الى إنشاء الواسمات:

  • تنظيم المعلومات.
  • دعم عملية البحث.
  • ايجاد نفس الواسمات فيما بعد.
  • طريقة للتعبير عن الآراء.
  • اكتشاف مواقع جديدة والمشاركة بين المواقع.
  • الاستفادة من الوظيفة أو الإمكانية المتاحة.

ومن أبرز ما يميز التوسيم:

  • مساعدة المستفيدين في تصنيف وتجميع المصادر المتشابهة باستخدام مصطلحاتهم الخاصة.
  • ايجاد علاقات جديدة بين مصادر المعلومات ومشاركة الاهتمامات بين المستفيدين .
  • تسهيل الوصول لمصادر المعلومات .
  • تنسيق مصادر المعلومات ضمن تمثيل منطقي للمعرفة يوضح العلاقات بين الموضوعات.

أما عيوب التوسيم فتكون في الآتي

  • أنه وصف حر غير منضبط بمصطلحات معينة، ما يعني أن المستخدم قد يستخدم كلمات ليس لها علاقة بالمحتوى وهذا قد يؤدي الى تضليل الباحث عن المصدر. 
  • أنه لا يخضع للتدقيق اللغوي ويفتح المجال واسعا للأخطاء اللغوية مع ما قد يصاحبها من خطأ في الوصف.
  • الميتاداتا Metadata :

الميتاداتا تمثل وسيلة رئيسية ومهمة لرفع كفاءة البحث عن مصادر المعلومات الإلكترونية، وتحديد المصدر أو المصادر ذات العلاقة بما تم البحث عنه، وذلك من خلال ما تقدمه من بيانات مهيكلة عن المصادر لأدوات البحث على الإنترنت، بالإضافة لدورها في بناء التسجيلات الببليوجرافية الواصفة للمصادر الالكترونية على شبكة الإنترنت.

لذا فان مؤسسات ومراكز المعلومات تحرص باستمرار على تنظيـــم مقتنياتها وإتاحة الوصول السريع إليها، وتحاول دائما استخدام الطرق الفاعلة التي تساعدها على القيام بهذا العمل، ومن أهم الأنشطة التي تدعمها واصفات البيانات أو الميتاداتا في هذا المجال.

  • تحسين عمليات الوصول والكشف عن المصادر على الإنترنت عن طريق محركات البحث.
  • تحسين إدارة الموقع الخاص بالمكتبة على شبكة الإنترنت.
  • تبسيط عملية دمج المصادر المتاحة على الشبكة مع قواعد البيانات المحلية، وذلك لمساعدة المستفيدين في الوصول السهل والسريع لكل هذه المصادر.
  • إنشاء بوابات موضوعية (Internet Subject Gateways) لكل لمصادر المتاحة على الشبكة.

الويب الدلاليSemantic Web

يعرف الويب الدلالي بأنه “شبكة بيانات بالمعنى، أي أنها يمكن البرامج الحاسوبية الخاصة من معرفة معاني البيانات”, وقد ظهرت فكـرة الويب الـدلالي كامتداد للويب الحالي، ولكنها تختلف في قدرتها على فهــم مدلـولات الألفــاظ والمعاني البــشرية، ويتـألف الويب الدلالي من عـدة نمـاذج للبــيانات (Data Model) ويستخدم مجموعة من التقنيات لتمثيلها، من بينها:

  • لغة تنسيق تبادل البيانات: ومن أمثلتها، لغة إطار وصف ال مصدر  Resource Description Framework) RDF) بالإضافة إلى حزمة من تنسيقات البيانات كـ: RDF/XML وN3 وTurtle وN-Triples.
  • مخططات العلاقات (RDF Schema) ولغة الويب الوجودية (Web Ontology Language) أو OWL وهذه اللغة تساعد في تسهيل عملية وصف المفاهيم والمصطلحات والعلاقات ضمن مجال معين.
  • محرك الاستدلال: والذي يحتوي على مجموعة من القواعد الاستدلالية التي تستخدم اللغتان السابق ذكرهما ولغات اضافية مبنية عليهما لإعطاء نتائج منطقية تماماً كما يفكر البشر.

بالبحث في موضوع التحليل الموضوعي وأدواته يتضح دوره الكبير في تنظيم المعرفة ومصادر المعلومات، وأيا كانت الأدوات المستخدمة ( تقليدية أو حديثة معتمدة على التقنيات الرقمية) وهو يمثل قناة مهمة وضرورية تصل المعرفة بالمستفيدين في جميع المجالات،  ويرى الباحث أنه ورغم التطور الهائل في النظم الرقمية وتقنياتها الحديثة، و مع أن التحليل الموضوعي أصبح يعتمد عليها في تنظيم المعلومات واسترجاعها،  إلا أنه لا يمكن بأي حال الاستغناء عن العمل والمجهود البشري الذي يمثل حجر الأساس في التحليل الموضوعي على اختلاف أدواته، خصوصا فيما يتعلق بتحديد محتوى ومضمون مصادر المعلومات، ووضع الكلمات المفتاحية المناسبة باختلاف المفاهيم والأوجه التي تمثلها، واختيار المصطلح الأمثل للتعبير عن المحتوى، وبالتالي إمكانية التصنيف بدقة كبيرة قدر الامكان، ويبقى أن الأدوات الحديثة في التحليل الموضوعي باعتبارها نظم لاسترجاع المعلومات، لا زالت تعاني من  مشاكل كثيرة ولا تؤدي دورها بالكفاءة والدقة المطلوبة.

خاتمة:

التحليل الموضوعي يعتبر واحدا من الموضوعات الرئيسيــة التي يمكن الاعتمـــاد عليها في تنظيم المعرفة وإدارتها، وقد تعرفنا فيما سبق على مفهـوم التحليل الموضوعي وأهميتـــه وأهدافه والخطـوات الرئيسية التي ينفذ عن طريقها، وادواته التقليدية والحديثة وتطبيقاته في البيئة الرقمية، ولاحظنا التغييرات الكبيرة التي أحدثتها التقنيات الحديثة في نظم حفظ المعلومات واسترجاعها، وفي انتقال الادوار من أخصائي المعلومات إلى المستفيدين وفتح باب المشاركة الفاعلة لهم في عملية التحليل الموضوعي.