Jump to content

User:Lepticed7/Lingua Libre

From Meta, a Wikimedia project coordination wiki

Actuellement, Lingua Libre présente plusieurs problèmes. La communauté de LiLi a produit une wishlist.

RecordWizard[edit]

Le RecordWizard est l’outil permettant de s’enregistrer et de verser les enregistrements dans Commons. Le RecordWizard présente des problèmes partiellement identifiés par la communauté, dits bugs des clics. Ces bugs rendent certains enregistrements inutilisables. Bien que la communauté ait quelques hypothèses sur l’origine de ce bug, une analyse étendue de son origine n’a pas été produite. Par conséquent, une résolution n’est pour l’instant pas envisageable, bien que souhaitable. Dans la wishlist, cette analyse et résolution ont été chiffrées à 7250€. Je reste dubitatif sur la durée donnée pour l’identification qui est d’une semaine. Ça me semble court.

BlazeGraph[edit]

Le BlazeGraph est le gestionnaire de base de données. Il permet de sauvegarder les méta-données associées aux enregistrements (ceux-ci étant enregsitrés sur Commons). Il propose également un requêteur SPARQL pour accéder à ces données. Nous rencontrons souvent des problèmes avec le BlazeGraph : il est tombé en panne plusieurs fois, et les enregistrements allant bon train, il est de plus en plus rempli et demande donc de plus en plus de ressources. La communauté n’a pas évalué le coût du BlazeGraph. Par ailleurs, la fondation connait des problèmes avec les BlazeGraphs utilisés pour Wikidata et Commons et cherche à s’en débarasser.

En ce qui concerne le BlazeGraph, il me semble qu’il y a une décision importante à faire rapidement. Souhaite-t-on le conserver ?

Le conserver[edit]

S’en débarasser[edit]

Dans le cas où nous nous débarassons du BlazeGraph, il nous faut repenser la manière dont nous stockons les métadonnées. Celles-ci peuvent être stockées directement sur Commons, dans les données structurées associées à chaque fichier. Toutefois, une telle décision implique plusieurs étapes à garder à l’esprit :

  • l’alignement ontologique : nous stockons nos données selon un certain modèle de données. Il faut investiguer pour savoir comment ce modèle de données peut-être adapté à Commons. Il s’agit d’apparairer chacune des concepts et propriétés que nous avons à un concept correspondant sur Commons. Ici, on rencontre plusieurs risques. Malgrè ces risques, je suis assez confiant sur le fait que c’est tout à fait réalisable en peu de temps. L’étape qui me semble la plus longue est celle des discussions communautaires nécessaires à l’acception de nouvelles propriétés.
    • Commons ne veut pas de nos données structurées. Il va falloir soit les convaincre de les accepter, soit abandonner l’idée de se débarasser du BlazeGraph (ou du moins de stocker les données sur nos serveurs)
    • Commons ne veut pas de certaines parties de notre modèle de données. Certaines propriétés ne leur conviennent pas et ne sont pas acceptées. Que fait-on de ces données là ?
  • la préparation au transfert :

MediaWiki[edit]