User:Simon Villeneuve/acfas

From Meta, a Wikimedia project coordination wiki

Matériel d'une intervention lors d'une table ronde à l'ACFAS le 9 mai 2018 à l'UQAC.

Avant-propos[edit]

pas vraiment dit lors de la table ronde, mais qui donne une idée de la philosophie derrière l'intervention


Les différentes approches du savoir peuvent, à l'extrême, être divisées en deux camps : le savoir confidentiel et le savoir libre. En effet, selon l'utilisation que veulent en faire celles et ceux qui le possèdent, et malgré le spectre grandissant de positions intermédiaires entre les deux extrêmes, un savoir donné sera ultimement fermé ou ouvert.
La première approche implique de restreindre, voire de garder secret, le savoir développé. La restriction du savoir permet, notamment, d'éviter les dangers que certains savoirs peuvent engendrer lorsque diffusés massivement. On peut ainsi, par exemple, aisément comprendre que les savoirs militaires et politiques d'un État soient d'un accès restreint. Cette restriction permet également d'établir ou de consolider le pouvoir (physique, politique, économique, social, etc.) de la ou des personnes qui ont intégrées ces savoirs « physiquement » (dans leur être) ou juridiquement (qui l'ont financé ou acheté). Enfin, cette approche permet également de transformer plus facilement le savoir en marchandise.
La seconde approche implique au contraire de diffuser avec le moins de restrictions possible le savoir. Cela permettrait, notamment, d'établir une base commune avec le plus d'intervenant-e-s possible, de faciliter l'acquisition de certains savoirs difficiles par l'accès à des ressources éducatives libres, d'augmenter la présence de certains savoirs dans l'ensemble des médias, d'archiver et de faire vivre des cultures ou branches de la connaissance qui n'ont pas suscité suffisamment d'intérêt financier à long terme, etc..

Ces approches se retrouvent dans tous les domaines et causent parfois des conflits. Ainsi, par exemple, plusieurs revues académiques d'importance se sont « déplacées » vers la première approche au cours des années. Puisque leur contenu est produit en presque totalité par des chercheurs universitaires, cela a mené, notamment, à une situation où les institutions universitaires se retrouvent à payer deux fois pour ces revues : elles paient le salaire des chercheurs qui écrivent ces articles sur leur temps de travail et elles paient leur abonnements institutionnels annuels aux revues ainsi produites.

Un autre exemple concerne le domaine éducationnel canadien. Une certaine pression y est faite depuis plusieurs années pour marchandiser le savoir qui y est développé. Ainsi, depuis le début des années 2000, plusieurs campus canadiens ont augmenté sensiblement leur superficie de bâtiment avec des pavillons de recherche privées, qui sont en presque totalité à but lucratif et dont les résultats de recherche sont en grande partie confidentiels.

Cette approche est plus ou moins bien intégrée ou acceptée par les corps des différentes disciplines académiques. Plusieurs disciplines académiques, traditionnellement plus proches des intérêts publics que privés, peinent à se développer dans ce contexte. Il en résulte que plusieurs intervenants en éducation, plus sensibles à la deuxième approche, trouvent des alternatives pour continuer à faire vivre leurs savoirs. La publication sous une licence plus ouverte est l'une de ces alternatives.

Table ronde[edit]

Introduction[edit]

Circulation d'un travail sur le web selon la licence : rouge arrête, jaune attend, vert passe.

Circulation sur le web : vert, jaune et rouge

La circulation d'une ressource sur le web dépend directement de la licence de ce dernier. De toute la panoplie de licences qui existent, les deux extrêmes sont le copyright () et le domaine public (DP, PD, ). Dans le premier cas, il faut l'autorisation explicite des ayants droit pour accéder, utiliser, réutiliser ou modifier le contenu (all rights reserved). Dans le second cas, le contenu peut être accédé, utilisé, réutilisé et modifié sans aucune contrainte.

En conséquence, le matériel sous copyright aura tendance à circuler beaucoup moins sur le web que le contenu du domaine public. Une comparaison peut-être faite avec les feux de circulation routière : le copyright est associé à la lumière rouge, alors que le domaine public est associé à la lumière verte. Entre les deux existent toute une série de licences allant du libre accès aux licences Creative Commons.

Exemples de circulation de projets sur le web[edit]

vert \o/
Ceci n'est qu'une des (milliers, dizaines de milliers, plus ?) images de la NASA que tout le monde peut utiliser sans aucune restriction.
En conséquence, les images de la NASA sont considérablement plus utilisées sur les wikis de la WMF que celles de toute autre agence spatiale.
Étendue de différents domaines et langues en ligne qui pointent vers Wikipedia. Des 36 millions de liens recensés, la moitié proviennent du domaine .com et pointent vers Wikipédia en anglais.
80 % des liens pointent vers Wikipédia en anglais, alors que le 20 % qui reste pointe vers Wikipédia en espagnol, indonésien, allemand, français, italien et portugais[3].
jaune \o
  • (logo non-libre)Les Classiques des sciences sociales : libre accès
    • Diffusion d'environ 10^7 millions de téléchargements par an à l'international.
  • Internet Archive : inconnue. Probablement minimum libre accès
    • Diffusion : ~5 millions d'IP uniques par jour, environ 10^9 par an[6].
  • arXiv : libre accès
    • Diffusion : ~18 millions de téléchargements par mois, environ 10^8 par an[7].
rouge -_-
  • (logo non-libre)ESA : copyright (©)
    • Diffusion : inconnue
  • BAnQ : © (sauf exceptions)
    • Diffusion : physique : 10^6 par an. En ligne : inconnue
  • (logo non-libre)Encyclopaedia Universalis : © (une partie en ligne en libre accès)
    • Diffusion : physique : dans toutes les bibliothèques dignes de ce nom. En ligne : inconnue
  • (logo non-libre)Encyclopaedia Britannica : © (une partie en ligne en libre accès)
    • Diffusion : physique : dans toutes les bibliothèques dignes de ce nom. En ligne : inconnue

Exemples de réutilisation de savoir libre[edit]

Amener du rouge vers le vert — cas de Britannica et Universalis

Plusieurs contributeurs ont associé massivement des entrées de Britannica et d'Universalis à des éléments de la base de données libre Wikidata. Ces encyclopédies sont souvent présentées comme les canons de base du savoir général et si leur association avec des éléments de la base de données libre n'en rend pas leur contenu plus libre, elle permet, entre autres, d'effectuer plus facilement des statistiques sur le contenu présenté par ces canons[8].


Statistiques Britannica Universalis Total Wikipédia
en français
Wikidata
Nombre total d'entrées 206,761
% articles : 49 %[note 1]
35,714 242,475 1,980,656 (+ 1,8 %) 47,392,548 (+ 11,8 %)
Échantillon 109,888 (53 %)
% articles : 47 %[note 2]
33,545 (93 %) 143,433 (59 %) 1,980,656 (100 %) 47,392,548 (100 %)
Entrées géolocalisées 12,012 3,196 15,208 269,774 5,845,247
Entrées biographiques 39,138 17,683 56,821 536,679 (+ 1,8 %) 4,264,736 (+ 4,5 %)
Personnes vivantes 5,333 1,955 7,288 284,044 2,720,924
Biographies d'hommes 34,261 16,121 50,382 445,715 (+ 1,9 %) 3,029,636 (+ 4,7 %)
Biographies de femmes 4,834 1,542 6,376 90,273 (+ 1,9 %) 665,137 (+ 8,6 %)
Biographies d'Américain-ne-s 12,271 2,743 15,014 70,174 (+ 1,8 %) 362,562 (+ 1,6 %)
Biographies d'Allemand-e-s 2,241 1,191 3,432 25,175 (+ 2,3 %) 216,914 (+ 1 %)
Biographies de Français-e-s 3,120 5,183 8,303 131,286 (+ 0,6 %) 159,268 (+ 2,8 %)
Biographies de Britanniques 4,265 1,144 5,409 27,048 (+ 2,3 %) 139,842 (+ 2,6 %)
Biographies de Japonai-se-s 687 241 928 13,295 (+ 1,3 %) 115,606 (+ 8,8 %)
Biographies de Russes 967 599 1,566 10,118 (+ 59 %) 79,265 (+ 19,6 %)
Biographies de Soviétiques 626 396 1,022 6,109 (+ 5 %) 69,796 (+ 5,3 %)
Biographies de Canadien-ne-s 756 166 922 20,710 (+ 1,1 %) 55,235 (+ 1,6 %)
Biographies de Belges 258 295 553 14,338 (+ 0,9 %) 37,135 (+ 19,5 %)
Biographies de Suisse-sse-s 385 292 677 9,093 (+ 1,4 %) 28,152 (+ 3,3 %)
Biographies de Chinoi-se-s 226 69 295 2,921 (+ 4,4 %) 26,240 (+ 61,8 %)
#Carte des éléments géolocalisés de Britannica et d'Universalis
#defaultView:Map
SELECT ?item ?itemL ?coords ?layer WHERE {
  {?item wdt:P1417 ?id .} UNION { ?item wdt:P3219 ?id .}
  ?item ?layer ?id .
  ?item wdt:P625 ?coords ; rdfs:label ?itemL .
  filter (lang(?itemL) = "fr") .
}

Cliquez pour essayer !

Proportions (en %) des articles biographiques :

Type de biographies Britannica Universalis
vivant-e-s 13,6 11,1
hommes 87,5 91,2
femmes 12,4 8,7
Américain-ne-s 31,4 15,5
Allemand-e-s 5,7 6,7
Français-e-s 8,0 29,3
Britanniques 10,9 6,5
Japonai-se-s 1,8 1,4
Soviétiques 1,6 2,2
Canadien-ne-s 1,9 0,9
Russes 2,5 3,4
Belges 0,7 1,7
Suisse-sse-s 1,0 1,7
Chinoi-se-s 0,6 0,4

Conclusions[edit]

Plusieurs pans du savoir disparaissent avec le temps par, notamment, la perte du support de ces derniers. Assurer une certaine redondance au savoir augmente les chances que celui-ci perdure dans l'espace et le temps. Plus libre est votre licence, plus de chance vous avez d'augmenter la redondance de votre travail.
  • La possibilité d'approcher du vert les données non-nominatives du gouvernement du Québec[note 3] et du gouvernement du Canada assurerait une redondance (solidifier l'archive) et une diffusion importantes du savoir québéco-canadien. Les Américains ont vu juste sur ça en plaçant le matériel non-nominatif de leur institutions fédérales dans le domaine public. Le domaine public, c'est la plus forte chance de perdurer dans l'espace et le temps.
  • Les projets éducationnels sur wikis semblent pouvoir engendrer une dynamique gagnant-gagnant. Ces derniers demandent cependant un investissement important des tutrices et tuteurs.

Discussion en grand groupe[edit]

  • Tenter de plugger un atelier de SPARQL.
Pour accéder au Soleil, « ils SPARQL ».

Ateliers[edit]

Proposition d'ateliers. Soit individualisé sur des ordinateurs portables près du kiosque de Wikimédia Canada, soit dans un laboratoire informatique de l'UQAC si la demande est là.

big data : exploration de requêtes SPARQL pour Wikidata[edit]

Accès à des requêtes SPARQL préfabriquées pour obtenir des statistiques en temps réel telles que celles présentées en table ronde, et plus encore.

Les requêtes sont ci-bas. Il s'agit de cliquer sur le lien « Cliquez pour essayer ! » tout en bas des instructions.

Instructions

Pour obtenir le résultat désiré, vous devez enlever le début de la ligne concernée du dièse (#) jusqu'à l'expression ?item. Ainsi, par exemple, pour obtenir l'ensemble des éléments rattachés à Britannica, vous devez retirer #Britannica de la requête et laisser ?item wdt:P1417 [] . . Pour obtenir toutes les personnalités canadiennes présentes sur Universalis, vous devez retirer #Universalis , #être humain et #Canadien-ne-s de la requête ci-dessous.

#Requête permettant d'obtenir des statistiques
#concernant les entrées de Britannica et d'Universalis.

#Pour rendre opérante la requête, enlevez, au début
#de la ligne, du dièse (#) jusqu'à l'expression ?item

#Pour des requêtes qui dépassent les capacités de l'outil 
#(le message « Limite du temps de requête atteinte » s'affiche), remplacez 
#la première ligne (SELECT ?item ?itemLabel...[AUTO_LANGUAGE],fr" }) 
#par SELECT (COUNT(?item) AS ?count) WHERE {

SELECT ?item ?itemLabel ?coords WHERE { SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr" }
##Si excède capacités de l'outil SELECT (COUNT(?item) AS ?count) WHERE {
#Britannica ?item wdt:P1417 [] . 
#Universalis ?item wdt:P3219 [] .
#Dictionnaire biographique du Canada ?item wdt:P2753 [] .
#Canadiana ?item wdt:P1670 [] .
#localités ?item wdt:P31/wdt:P279* wd:Q486972 .
#êtres humains ?item wdt:P31 wd:Q5 . 
#femmes ?item wdt:P21 wd:Q6581072 .
#hommes ?item wdt:P21 wd:Q6581097 .
#Allemand-e-s ?item wdt:P27 wd:Q183 .
#Américain-e-s ?item wdt:P27 wd:Q30 .
#Belges ?item wdt:P27 wd:Q31 .
#Britanniques ?item wdt:P27 wd:Q145 .
#Canadien-ne-s ?item wdt:P27 wd:Q16 .
#Chinois-e-s ?item wdt:P27 wd:Q148 .
#Français-e-s ?item wdt:P27 wd:Q142 .
#Japonais-e-s ?item wdt:P27 wd:Q17 .
#Russes ?item wdt:P27 wd:Q159 .
#Russes (1721-1917) ?item wdt:P27 wd:Q34266 .
#Soviétiques ?item wdt:P27 wd:Q15180 .
#Suisse-sse-s ?item wdt:P27 wd:Q39 .
#musicien-ne-s ?item wdt:P106/wdt:P279* wd:Q639669 .
#artistes ?item wdt:P106/wdt:P279* wd:Q483501 .
#scientifiques ?item wdt:P106/wdt:P279* wd:Q901 .
#personnalité politique ?item wdt:P106/wdt:P279* wd:Q82955 .
#lien vers une version linguistique OPTIONAL {?article 	schema:about ?item ; schema:isPartOf <https://CODE_LANGUE.wikipedia.org/> .}
##sans lien vers une version linguistique FILTER (!BOUND(?article))
#lier au numéro des éléments Wikidata situé entre BORNE_INFÉRIEURE et BORNE_SUPÉRIEURE BIND( xsd:integer( STRAFTER( STR( ?item ), STR( wd:Q ) ) ) AS ?num ) . FILTER( BORNE_INFÉRIEURE < ?num && ?num < BORNE_SUPÉRIEURE ) .
#Géolocaliser les éléments wdt:P625 ?coords .    
}
#Classer par VARIABLE. ORDER BY ?VARIABLE
#Si temps limite atteint, limiter les résultats à X. LIMIT X
#Si temps limite atteint, fractionner les résultats en sautant les X premiers et en affichant les Y suivants. OFFSET X LIMIT Y

Cliquez pour essayer !

Autres requêtes
#Carte des éléments géolocalisés de Britannica et d'Universalis
#defaultView:Map
SELECT ?item ?itemL ?coords ?layer WHERE {
  {?item wdt:P1417 ?id .} UNION { ?item wdt:P3219 ?id .}
  ?item ?layer ?id .
  ?item wdt:P625 ?coords ; rdfs:label ?itemL .
  filter (lang(?itemL) = "fr") .
}

Cliquez pour essayer !

#Carte des observatoires astronomiques
#defaultView:Map
SELECT ?item ?itemL ?coords ?layer WHERE {
  ?item wdt:P31/wdt:P279* wd:Q62832 ;
        wdt:P625 ?coords ;
        rdfs:label ?itemL filter (lang(?itemL) = "fr") .
}

Cliquez pour essayer !

#Images de nébuleuses planétaires
#defaultView:ImageGrid
SELECT ?item ?label ?pic (LANG(?label) AS ?lang)
WHERE
{
  ?item wdt:P31/wdt:P279* wd:Q13632;
          rdfs:label ?label.
  FILTER(LANG(?label) IN ("fr")). # tweak to taste
   OPTIONAL {
		?item wdt:P18 ?pic
	}
SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr"}
}

Cliquez pour essayer !

#Lieux québécois
#defaultView:Map
SELECT ?item ?itemL ?coords ?layer WHERE {
?item wdt:P2100 [] ;
#Seulement SagLac wdt:P131/wdt:P279* wd:Q615914 ;
wdt:P625 ?coords .
}

Cliquez pour essayer !

#Cours d'eau se jettant dans le fleuve Saint-Laurent
#defaultView:Map
SELECT ?id
       ?idLabel
       ?link
       ?geo
WHERE {
       ?id wdt:P403 wd:Q134750 .
       ?id wdt:P625 ?geo . 
            SERVICE wikibase:label {
            bd:serviceParam wikibase:language 'fr'.
          }
          OPTIONAL {
            ?link schema:about ?id .
            ?link schema:isPartOf <https://fr.wikipedia.org/> .
          }
}

Cliquez pour essayer !

#Affluents et sous-affluents du fleuve Saint-Laurent
#defaultView:Map
SELECT ?id
       ?idLabel
       ?link
       ?geo
WHERE {
       ?id wdt:P403* wd:Q134750 .
       ?id wdt:P625 ?geo . 
            SERVICE wikibase:label {
            bd:serviceParam wikibase:language 'fr'.
          }
          OPTIONAL {
            ?link schema:about ?id .
            ?link schema:isPartOf <https://fr.wikipedia.org/> .
          }
}

Cliquez pour essayer !

#Villages québécois ayant des noms de saints et de saintes
#defaultView:Map
SELECT ?item ?itemL ?coords ?layer WHERE {
  ?item wdt:P31/wdt:P279* wd:Q3327873 ;
        wdt:P625 ?coords ;
        rdfs:label ?itemL filter (lang(?itemL) = "fr") .
  FILTER (STRSTARTS(?itemL, "Saint")) .
  BIND(SUBSTR(?itemL,1,6) AS ?layer).
}

Cliquez pour essayer !

#Stations météorologiques italiennes (plus de 600)
#defaultView:Map
SELECT ?item ?itemLabel ?coords ?layer WHERE {
  ?item wdt:P31/wdt:P279* wd:Q190107 ;
        wdt:P17 wd:Q38 ;
        wdt:P625 ?coords ;
SERVICE wikibase:label { bd:serviceParam wikibase:language "fr". }
}

Cliquez pour essayer !

#Metro lines in Montreal, Quebec, Canada
#defaultView:Map{"layer": "?lineLabel", "hide": ["?rgb", "?coord"]}
SELECT ?station ?stationLabel ?line ?lineLabel ?rgb ?coord ?image
WHERE {
  ?line wdt:P361 wd:Q392377.
  OPTIONAL { ?line wdt:P465 ?rgb. }
  ?station wdt:P81 ?line;
           wdt:P625 ?coord.
#MINUS{?station wdt:P31 wd:Q170584 .}
  OPTIONAL {?station wdt:P18 ?image}
  SERVICE wikibase:label { bd:serviceParam wikibase:language "fr" . }
}

Cliquez pour essayer !

#Genes named after fictional characters 
#with links to the scientific articles in which they were named.
SELECT ?gene ?geneLabel ?namesakeLabel ?article ?articleLabel 
WHERE 
{
  ?gene wdt:P31 wd:Q7187.
  ?gene wdt:P138 ?namesake;
        p:P138/prov:wasDerivedFrom/pr:P248 ?article.
  
  SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],fr". }
}

Cliquez pour essayer ![9]

Autres[edit]

  • Wikidata, de kossé ?
  • Projets pédagogiques sur Wikipédia en français : les bases
  • ...

Notes et références[edit]

  1. J'ai évalué ce pourcentage grâce à un échantillon aléatoire de 200 entrées de l'ensemble des entrées de mix'n'match obtenu avec ce site web.
  2. J'ai évalué ce pourcentage grâce à un échantillon aléatoire de 200 entrées Wikidata obtenu avec cette requête SPARQL déduite de cette conversation :
    SELECT ?item ?itemLabel ?burl WITH {
      SELECT ?item ?burl WHERE {
        wd:P1417 wdt:P1630 ?formaturl .
        ?item wdt:P1417 ?bid .
           BIND(IRI(REPLACE(?bid, '^(.+)$', ?formaturl)) AS ?burl).
      }
      ORDER BY MD5(CONCAT(STR(?item),STR(RAND())))
      LIMIT 200
    } AS %results WHERE {
      INCLUDE %results.
      SERVICE wikibase:label { bd:serviceParam wikibase:language "[AUTO_LANGUAGE],en". }
    }
    
    Cliquez pour essayer !
  3. Pour une raison qui m'est inconnue, il semblerait que le gouvernement du Québec soit très fermé à la diffusion de ses données, même envers des chercheurs. Voir http://plus.lapresse.ca/screens/79a9238f-5910-4e96-b788-1f3d7351c09d__7C___0.html