استخلاص المحتوى على الويب (Web Content Scraping)

ما هي عملية استخلاص المحتوى على الويب (Web Content Scraping)؟

هي تقنية تمكننا من جمع معلومات من صفحات الانترنت، معالجتها ومن ثم تخزينها في قاعدة بيانات أو إرسالها إلى إجرائية أخرى.

فبدلا من القيام بالنسخ و اللصق بشكل يدوي، نقوم بكتابة كود برمجي يقوم بطلب الصفحة ومعالجتها واستخراج المعلومات منها ومن ثم تخزينها .

أكمل قراءة المقالة

هل باتت اللغة قاصرة في زمن وسائل التواصل الاجتماعي؟

في آخر إحصائية لعدد مستخدمي الانترنت بالعالم تم تسجيلها في شهر حزيران لعام 2019 وصل العدد إلى ما يقارب (4,536,248,808) مستخدم من أصل (7,716,223,209) نسمة هو عدد سكان العالم تقريباً وفقاً لنفس الإحصائية.[1]

أكمل قراءة المقالة

سلسلة الترجمة الآلية – أولا: الترجمة الآلية الإحصائية Statistical Machine Translation

ماهي الترجمة الآلية؟

الترجمة الآلية هي بناء برنامج حاسوبي قادر بشكل آلي على ترجمة كلمة او نص من اللغة المصدر source language إلى اللغة الهدف target language. وهي من أشهر المهام التي يتم العمل عليه في معالجة اللغات الطبيعية الحاسوبية Computational Natural Language Processing. 

الترجمة الآلية الإحصائية Statistical Machine Translation
أكمل قراءة المقالة

اﻹكمال التلقائي للنصوص

الإكمال التلقائي للنصوص هي الميزة التي تسمح للتطبيق بالتنبأ بالنص الكامل، وذلك بمجرد كتابة بادئة من النص، من المأكد أنك قمت باستخدامه كثيراً في حياتك اليومية مثل:

  • محركات البحث: محرك البحث جوجل يقترح لك اكمالاً تلقائياً للنص بمجرد كتابة جزء منه في مستطيل البحث، عادة تكون هذه الاقتراحات مرتبة حسب أكثر اﻷمور التي يتم البحث عنها حالياً. 
  • في البريد الالكتروني، بمجرد أن تكتب جزأ من العنوان سوف تظهر لك قائمة من الاقتراحات. 
  • وسائل التواصل الاجتماعي، مثل فيسبوك، لينكيد إين، انستغرام… 
  • في محررات كتابة الأكواد، أنا أستخدم حاليا تطبيق Atom ولقد قمت باستخدام ميزة الإكمال التلقائي على اﻷقل 10 مرات في هذا الجزأ البسيط من المقالة. 
أكمل قراءة المقالة

تحويل صور النص العربي إلى نص باستخدام الذكاء الصنعي

    إن التعرّف على النصوص المكتوبة باللغة العربية يواجه مشاكل أكثر من نصوص اللغات الأخرى، سواء كانت النصوص مطبوعة أم مكتوبة يدوياً. يقدم هذا الفصل دراسة موجزة لبعض التحديات التي تواجه الباحثين في مجال التعرف على الأحرف العربية، واقتراح نظام جديد لإتمام عملية تحويل صورة النص العربي إلى ملف نصي وعرض المراحل المكونة له.

أكمل قراءة المقالة