Community Wishlist Survey 2023/Wikisource/Remember OCR column/region profiles/Proposal/fr
- Problem: Actuellement, l'utilisation de l'OCR pour extraire du texte de livres est mauvaise pour détecter les caractéristiques irrégulières telles que les notes et les colonnes (voir la sortie OCR pour wikisource:Page:Login_USENIX_Newsletter_feb1983.djvu/2, et la même page dans l'outil OCR où des régions rectangulaires peuvent être sélectionnées).
- Proposed solution: Fournir un mécanisme (gadget ou via Wikimedia OCR) qui permettra aux utilisateurs de délimiter des colonnes et des zones spécifiques qui doivent être faites ensemble et de stocker ces zones sur la page d'index afin qu'elles n'aient pas à être répétées sur chaque page.
- Who would benefit: Wikisource editors
- More comments:
- Phabricator tickets:
- Proposer: Sohom Datta (talk) 12:37, 30 January 2023 (UTC)