Jump to content

دليل إنشاء نموذج على منصة ترانزكريبس وتدريبه

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Transkribus Model Creation and Training Guide and the translation is 24% complete.
Outdated translations are marked like this.

تهدف هذه الصفحة لتعليمك التعامل مع واجهة منصة الذكاء الاصطناعي ترانزكريبس (بالإنجليزية: Transkribus). يمكن استخدام المنصة لتفريغ المستندات وإنشاء نماذج جديدة وتدريبها أو حتى اختبار النماذج المنشأة على المنصة.

نظرة عامة على مسار العمل

تتصف عملية إنشاء نموذج جديد وتدريبه بأنها عملية واسعة النطاق للغاية. يوضح هذا المخطط الانسيابي الموضح أدناه الخطوات المختلفة التي يتضمنها سير العمل بأكمله بدءًا من الحصول على بيانات المطلوبة لتدريب النموذج وحتى إتاحة النموذج على نسختكم من ويكي مصدر.

Workflow flowchart
مخطط انسيابي يصور سير العمل المتضمن في إنشاء النموذج وتدريبه

ملاحظة: لم تُذكر بعض العمليات المتقدمة مثل تخصيص أشكال المضلعات أو تحرير البيانات الأساسية في المخطط الانسيابي بغرض التبسيط، وستُفصل في الأقسام الخاصة بكلٍّ منها.

The entire process of creating and training a new model is quite extensive. This flowchart given below broadly details the various steps involved in the whole workflow right from getting the required model training data to making the model available on your Wikisource.

Workflow flowchart
Flowchart depicting the workflow involved in creating and training a model

NOTE: Certain advanced processes like customizing shapes of polygons or editing baseline data are not mentioned in the flowchart for sake of simplicity. They will be detailed in their respective sections.

متطلبات مسبقة

فيما يلي المتطلبات الأساسية لإنشاء نموذج جديد وتدريبه

The following are the prerequisites to creating and training a new model

  • أن يكون لديك حساب فعال على منصة ترانزكريبس وبصلاحيات كافية لإجراء عمليات التعرف البصري على الحروف
  • احتفظ بما لا يقل عن 5000 و15000 كلمة (حوالي 25-75 صفحة) من المواد المكتوبة باللغة التي تريدها جاهزةً للتحميل
    • إذا كنت تعمل على نص مطبوع وليس نصًا مكتوبًا بخط اليد، فستحتاج إلى بياناتٍ أقل لتدريب النموذج (حوالي 50 صفحة)
    • يرجى ملاحظة أن عدد الصفحات الذي تريدون إنشاء نموذجٍ له أمر بالغ الأهمية لأداء النموذج
  • عند إنشاء نموذج لنمط معين من النص المكتوب بخط اليد، تأكد من أن جميع المخطوطات المتوفرة تنتمي إلى هذا النمط المحدد فقط
  • وتحلوا بالكثير من الصبر، فهذا سيستغرق بعض الوقت!

Transkribus Tools

Transkribus

Formerly known as Transkribus Lite, the latest version of the web app, released on 30th August 2023, claims to be a feature rich editor cum model creation and testing workspace. It allows the user to transcribe documents, use existing models on their documents, perform model creation and training, and eventually publish a model of their own. All processes and workflows in this guide are related to the web interface, unless mentioned otherwise.

Transkribus Expert

The desktop client provided by Transkribus has everything that Transkribus can offer, including some features that the web interface is yet to accommodate. The modification of polygon data and advanced options to export/import data to collections and models are only available on the desktop client.

مساحة العمل على منصة ترانزكريبس

تتمتع منصة ترانزكريبس بواجهة ويب غنية بالميزات توفر مجموعة من الوظائف بما في ذلك التدقيق اللغوي والتعرف على النص والوصول إلى نماذج تتعامل مع لغات متعددة وتجريب المخطوطات. ستقون معظم وقتكم في هذا هو المكان في إعداد وثائق الحقائق الراسخة، وبناء نموذج جديد، وتدريبه على المستندات ذات الصلة، والتحقق من دقتها. بمجرد تسجيل الدخول باستخدام حساب ترانزكريبس، سيجري توجيهكم إلى لوحة التحكم التي تشبه تلك الموضحة أدناه. لا تقلق إذا لم يكن لديك أي مجموعات، حتى الآن!

Transkribus dashboard

Transkribus has a feature rich web interface that provides a host of functionality including proofreading, text recognition, accessing models that deal with multiple languages, and experimenting with manuscripts. This is where you will spend the majority of your time as you prepare ground truth documents, build a new model, train it on the relevant documents, and validate its accuracy. Once you have logged in with a Transkribus account, you will be directed to a dashboard that looks similar to the one shown below. Don’t worry if you do not have any collections, yet!

Transkribus dashboard

مصطلحات مهمة

أثناء العمل مع منصة ترانزكريبس، من المهم أن تكون على دراية ببعض المصطلحات. لستم بحاجة لمعرفة كل المصطلحات الآن ولكن نتركها بين أيديكم كمرجع.

While working with Transkribus it is important to be familiar with a few terms. All of them are not immediately relevant, but you can always come back for reference!

الوثيقة

أي صورة أو صفحة من المخطوطة التي تُحمّل على منصة ترانزكريبس تعتبر وثيقة.

Any image or page of a manuscript that is uploaded to Transkribus is considered a document

المجموعة

هي مجموعة من الوثائق المتصلة ببعضها، كأن تكون متصلة عبر اللغة أو نمطٍ معين، والتي تساعدك على تنظيم مكتب العمل الخاص بك بشكلٍ أفضل.

A collection is a group of related documents (e.g. of a particular language or style) that helps you to organize your work desk better

النموذج الأساسي

نموذج ترانزكريبس الذي يتعامل فقط مع الخط المشترك بين جميع المواد النصية في الوثيقة.

A Transkribus model that deals with only the baseline common to all the textual material in the document

ملاحظة إنّ وجود نموذج أساسي مخصص مفيد في بعض الحالات

نموذج التعرف على النص اليدوي

يقوم نموذج التعرف على النص المكتوب بخط اليد (HTR) بإجراء التعرف البصري على الحروف (OCR) عن طريق اكتشاف النص المكتوب بخط اليد وإنشاء النص المطلوب إخراجه.

A Handwritten Text Recognition (HTR) model is what performs the actual OCR by detecting the handwritten text and generating the required output text

ملاحظة وغالبًا ما يُستخدم بجانب النموذج الأساسي

الحقائق الراسخة

يمكن تصنيف جميع الوثائق المُدققة بالفعل والتي تحتوي على نسخ صحيح للنص على أنّها حقائق راسخة، لتشكيل الأساس لبناء نموذج جديد.

All documents that have already been proofread and have correct transcription of text can be labeled as ground truth data, to form the basis of building a new model

المهمة

أي عملية يجري تشغيلها على منصة ترانزكريبس، مثل يُصنّف إجراء التعرف على النص في وثيقة، كمهمة وتُوضع في قائمة الانتظار على خادم منصة ترانزكريبس.

Any process run on Transkribus, like performing text recognition on a document, is classified as a job and is queued on the Transkribus server

أدوات التدريب

تتكون أدوات التدريب عادةً من 90% من جميع مجموعات البيانات، وتحتوي على الوثائق التي تستخدمها الخوارزميات لتدريب نموذج جديد على خط يد معين.

Usually consisting of 90% of the entire data set, the training data contains documents that the algorithm uses to train a new model on a particular handwriting

أدوات التحقق

تتكون أدوات التحقق عادةً من 10% من جميع مجموعات البيانات، وتحتوي على الوثائق التي يتحقق النموذج من أدائها في التعرف على الكتابة اليدوية بشكلٍ فعال

Usually consisting of 10% of the entire data set, the validation set contains documents on which the model validates its performance in recognizing the handwriting effectively

التوقيت

الفترة الزمنية التي يتدرب فيها النموذج على بيانات التدريب.

The time period for which the model is trained on the training data is called epochs

ملاحظة يمكن أن يؤدي وجود عدد كبير جدًا من المواقيت إلى الإفراط في تدريب النموذج على أدوات التدريب، مما يؤدي إلى ضعف أدائه على البيانات الجديدة.

تحميل الوثائق إلى المجموعة

أسهل طريقة لإضافة الوثائق إلى ترانزكريبس هي إنشاء مجموعة جديدة. بمجرد إنشاء مجموعة جديدة في علامة التبويب المجموعات، سيجري إعادة توجيهكم إلى الشاشة كما هو موضح أدناه.

Upload documents screen

تتضمن الواجهة الخيارات التالية (مرقمة وفقًا لذلك):

The easiest way to add documents to Transkribus is by creating a new collection. Once you create a new collection on the Collections tab, you will be redirected to a screen as shown below.

Upload documents screen

The interface includes the following options (numbered accordingly):

  1. اسم المجموعة التي تعملون بها حاليًا
  2. انقر فوق تحميل وثيقة لتحميل وثائق جديدة إلى المجموعة
  3. اختيار نوع الملف الذي تحملونه صورة أو ملف PDF
  4. عينوا عنوان الوثيقة التي تحملونها
  5. كما هو موضح، هذا يسمح لكم بتحميل الملف (الملفات) إلى المجموعة

بعد تحميل الوثيقة بنجاح، يجب أن تعرض شاشة التجميع قائمة الوثائق الموجودة في تلك المجموعة. سيؤدي النقر على أي من الوثائق إلى نقلكم إلى قائمة الصفحات الفردية للوثيقة، كما هو موضح في الشكل أدناه.

Document pages

لدى المستخدم خيار إضافة صفحة أو حذفها من الوثيقة، وإجراء التعرف على الكتابة اليدوية (باستخدام نموذج HTR) على الصفحة، ومن ثم عينوا حالة الصفحة على إحدى حالات الصفحات الأربع المسموح بها، بالإضافة إلى تصدير مجموعة فرعية من الصفحات. تتوفر خيارات إضافية لتصفية الصفحات المعروضة عبر خيار تصفية الموجود على الجانب الأيمن من شريط الأدوات بالصفحة.

Document pages

The user has the option to add or delete a page from the document, perform handwriting recognition (using an HTR model) on a page, set the status of the page to one of the four allowed page statuses, as well export a subset of the pages. Further options to filter the pages being displayed are available via the Filter option on the right side of the toolbar on the page.

مساحة العمل على ترانزكريبس

بمجرد النقر على أي من الوثائق الموجودة ضمن قسم مكتب العمل على واجهة ترانزكريبس الخاصة بكم، سيجري إعادة توجيهكم إلى الشاشة كما هو موضح أدناه.

Transkribus workspace

Once you click on any of the documents under the Work Desk section on your Transkribus interface, you will be redirected to a screen as shown below.

Transkribus workspace

إنه المكان الذي ستجري فيه جميع الأعمال المتعلقة بمخطوطتكم. تتضمن الواجهة الخيارات التالية (مرقمة وفقًا لذلك):

  1. أداة المؤشر لتحريك المخطوطة
  2. أداة القلم للإشارة إلى الخطوط الأساسية في مخطوطتكم
  3. أداة تحديد المنطقة لتحديد المناطق المختلفة في مخطوطتكم
  4. أداة لإضافة الجداول إلى مناطق المخطوطة
  5. زر لتوفير المزيد من المعلومات واختصارات لوحة المفاتيح
  6. محرر تخطيط يسمح لكم برؤية خطوطكم ومناطقكم في مكان واحد
  7. وحدات التحكم بالحجم
  8. توسيط وثيقتكم فيما يتعلق بمنطقة العرض
  9. تنسيق الوثيقة في منطقة العرض
  10. استدارة الوثيقة
  11. تغيير العرض إلى ملء الشاشة
  12. ابدأ التفريغ باستخدام نموذج موجود
  13. خيار تنزيل الوثيقة الموجودة
  14. قائمة منسدلة لتغيير حالة الصفحة إلى أحد الحالات التالية
    1. في تَقَدم
    2. حقيقة راسخة
    3. انتهى
    4. نسخة نهائية
  15. حفظ التقدم في الوثيقة الحالية

وبصرف النظر عن ذلك، هناك أيضًا أزرار للتراجع عن التغييرات إعادتها، ولوحة مفاتيح افتراضية، وخيارات لمشاركة عملكم.

إضافة حقيقة راسخة

قبل تدريب النموذج، ستحتاجون إلى إعداد بيانات التدريب، وهذا يعني إعداد ما يكفي من الصور والنسخ الصحيحة لتدريب النموذج. تضمن هذه العملية، المعروفة باسم إضافة الحقيقة الراسخة، إمكانية تدريب النموذج على البيانات الحالية المتحقق من صحتها.

Before training a model, you will need to prepare your training data, this means preparing enough images and their corresponding correct transcriptions to train the model. This process known as the addition of ground truth, ensures that the model can be trained on existing validated data.

This involves transcribing manuscripts using the Transkribus editor, and saving each page as ground truth. This indicates that the pages can be used to train your model. The process of transcribing on Transkribus using Wikisource as a reference is outlined below:

  • Open a manuscript of your choice on Wikisource, and have a local copy ready to be uploaded to your Transkribus collection
  • Once the document is uploaded to the collection, you can proceed to open the first page (or any page of your choice) to begin transcription. The page will open in an editor as shown below
  • Open the corresponding page on Wikisource in another window. You will need to work with both tabs open simultaneously
  • Once you have completed drawing regions and marking baselines satisfactorily, you can proceed with adding the corresponding text
  • For each line drawn on the Transkribus editor there should exist a line on the Wikisource page. The text from the relevant line of the Wikisource page is copied and pasted in the relevant line of the Transkribus editor. Continue this process until lines in every region marked in the Transkribus editor have corresponding transcribed text

The above video depicts how to transcribe text using Tranksribus and Wikisource simultaneously.

تدريب نموذج مخصص

نموذج التعرف على النسق (اختياري)

هذا نشاط اختياري. إذا لم تكنوا متأكدين مما إذا كانت لغتكم تتطلب نموذجًا للتعرف على النسق، فيرجى رفع تذكرة على فبريكاتور. إنّ تصميم نموذج التعرف على النسق واكتشاف الخط مُعدٌ في المقام الأول إذا كان من الصعب التدريب على الكتابة اليدوية أو البرنامج النصي بشكلٍ مباشر ويحتوي على مواضع مختلفة للأحرف أو الأحرف. افتراضيًا، يستخدم ترانزكريبس داخليًا نموذج اتجاه الخط المختلط كنموذج لاكتشاف التخطيط. يعمل هذا بشكلٍ جيد مع معظم النصوص الغربية.

This is an optional activity. If you are not sure whether your language requires a layout recognition model, please raise a ticket on Phabricator. The layout recognition/line detection model is primarily intended to be constructed if the handwriting or script is difficult to be trained upon directly and has varying placements of letters or characters. By default, Transkribus internally uses the Mixed Line Orientation model as the layout detection model. This works well for most Western scripts.

تبدأ عملية تدريب نموذج النسق بقسم كما هو موضح أدناه.

لقطة شاشة توضح بداية سير عمل إنشاء النموذج
لقطة شاشة توضح بداية سير عمل إنشاء النموذج
Screenshot showing the beginning of the model creation workflow
Screenshot showing the beginning of the model creation workflow
  • انتقل إلى قسم التدريب (بالإنجليزية: Training) واختر المجموعة كما هو مطلوب. حدد خيار نموذج خطوط الأساس (بالإنجليزية: Baselines model)، كما هو موضح في الشكل 2.
  • في مربع الحوار الذي يظهر، تابع ملء التفاصيل المطلوبة مثل اسم الطراز (بالإنجليزية: model name) (رقم 3 في الشكل أعلاه) والوصف (بالإنجليزية: description) (رقم 4 في الشكل أعلاه). يحدد الحقل المسمى المواقيت (بالإنجليزية: epochs) (المرقمة 5 في الشكل أعلاه) المدة التي سيتكرر فيها النموذج عبر مجموعة البيانات التي قدمتها.
  • تتضمن الخطوة التالية اختيار بيانات التدريب التي تحتوي على خطوط الأساس المصححة المُعدة في الخطوة السابقة. حدد جميع الوثائق أو المجموعات ذات الصلة التي تريد أن يتعلم النموذج منها. وبالمثل، حدد مجموعة البيانات المستخدمة للتحقق من الصحة أيضًا.
    • ملاحظة: من الناحية المثالية، يجب استخدام 90% من إجمالي البيانات المتاحة للتدريب بينما يجب استخدام 10% للتحقق من الصحة.
  • إطلاق عملية التدريب النموذجي

تستغرق عملية التدريب بضع دقائق حتى تكتمل. يمكنكم التحقق من تقدم عملية التدريب في علامة التبويب المهمات (بالإنجليزية: Jobs). بمجرد الانتهاء، تقوم هذه المهمة بتجهيز نموذج التعرف على التخطيط الذي يمكن استخدامه أيضًا لإنشاء النموذج الرئيسي!

تصحيح النسق (اختياري)

بعد مرحلة التدريب، تأخذ منصة ترانزكريبس مناطق النص المنشأة ويمثلها كمضلعات، مما يوفر القدرة على تعديل هذه الأشكال. ومع ذلك، لا يمكن الوصول إلى هذه الوظيفة إلا من خلال خبير ترانزكريبس، الذي يوفر ميزات متقدمة لمعالجة الوثائق الأكثر تعقيدًا.
highlighted polygonal ground truths
highlighted polygonal ground truths

After the training phase, Transkribus takes the generated text regions and represents them as polygons, offering the capability to modify these shapes. This functionality, however, is exclusively accessible within the Transkribus Expert Client, which provides advanced features for more intricate document processing.

highlighted polygonal ground truths
highlighted polygonal ground truths

تعرض المنطقة الموضحة بالرقم 1 في الشكل أعلاه اختيار شكلاً متعدد الأضلاع. ومن المهم أن نلاحظ أن هذه الأشكال تتكون أساسًا من نقاط فردية مرتبطة بخطوط مستقيمة. يتكون الشكل من نقاط مترابطة تشكل الخطوط العريضة للمضلع، حيث يربط كل خط مستقيم بين نقطتين متجاورتين.

  • توفر الأداة المشار إليها في الرقم 2 القدرة على تضمين نقاط تكميلية لشكل محدد بالفعل، مما يعزز تعدد استخدامات الأداة. يمكن وضع هذه النقاط المضافة إما على منطقة النص نفسها أو على خط الأساس الخاص بها، مما يسمح بدرجة أعلى من الدقة في التخصيص.
  • في حالة الحاجة إلى أي تعديلات، تقوم الأداة المشار إليها بالرقم 3 في الشكل أعلاه بإزالة نقطة معينة من الشكل المختار. تعتبر هذه الأداة الخاصة مفيدة بشكل خاص لتحسين خطوط الأساس أو تقصيرها، مما يضمن أنها تتوافق بدقة مع تخطيط الوثيقة.

تتضمن عملية تصميم الشكل وفقًا لمتطلبات محددة معالجة هذه النقاط المحددة. من خلال نقل النقاط التي تشكل المضلع، يتمتع المستخدمون بالمرونة اللازمة لتعديل الشكل ليتوافق بشكل أفضل مع محيط كتلة النص المقابلة.

في جوهر الأمر، فإن القدرة على ضبط الحقائق الراسخة متعددة الأضلاع في منصة ترانزكريبس، والتي يتم تسهيلها من خلال خبير، تقدم مجموعة أدوات متعددة الأوجه. إن الجمع بين النقاط المترابطة التي تشكل المضلعات، وإضافة نقاط جديدة، وحرية نقل النقاط، وخيار إزالة النقاط يوفر نطاقًا واسعًا من عناصر التحكم.

في حالة اللغات مثل البالية والجاوية، تكون هذه الميزة مفيدة بشكل خاص لأن النص وخطوط الأساس المقابلة له تكون غير منتظمة أكثر من اللغات الغربية الأخرى. ويساعد ذلك على تحسين دقة النموذج الذي يتم تدريبه، وبالتالي النص المكتوب.