Abstract Wikipedia/Lizenzdiskussion

From Meta, a Wikimedia project coordination wiki
This page is a translated version of the page Abstract Wikipedia/Licensing discussion and the translation is 100% complete.

Abstract Wikipedia ist ein langfristiges Projekt mit dem Ziel, Inhalte aus neuen und bestehenden Wikimedia-Projekten zu kombinieren, um es Beitragenden zu ermöglichen, Wikipedia-Artikel sprachunabhängig zu erstellen und zu pflegen. Abstract Wikipedia wird auf Software-Funktionen, erstellt durch Beitragende, sowie Inhalten aus anderen Wikimedia-Projekten (hauptsächlich Wikidata) aufbauen, um Text in vielerlei Sprachen zu generieren.

Wikifunctions, ebenso wie andere Wikimedia-Projekte, wird stark auf Inhalten beruhen, die durch die Beitragenden bereitgestellt werden. Wikifunctions wird ebenso stark auf Entscheidungen beruhen, welche durch diese Beitragenden getroffen werden, um das Regelwerk des Projekts aufzubauen. Wir sollten daher entscheiden, welche Lizenzen für die Bestandteile von Abstract Wikipedia verwendet werden.

Auf Abstract Wikipedia kannst du mehr über Abstract Wikipedia und Wikifunctions erfahren.

Das Abstract Wikipedia-Team hat die Rechtsabteilung der Wikimedia Foundation um eine Stellungnahme gebeten, welche Lizenzen für jeden Abschnitt von Wikifunctions geeignet wären, und welche anderen rechtlichen Risiken bei der Wahl einer Lizenz berücksichtigt werden sollten. Dieses Dokument basiert auf ihren Vorschlägen und Handlungsempfehlungen.

Diese Seite beschreibt zuerst, was diese verschiedenen Bestandteile sind. Anschließend beschreibt sie, welche Lizenzen für welchen Bestandteil sinnvoll sind. Darauf folgt eine Erörterung der verschiedenen Optionen und ihrer Einwirkung aufeinander. Den Abschluss bilden individuelle Meinungsaussagen.

Übersicht und Bitte

(Aktualisiert: 2021-12-03)

Alle Beiträge zu Wikifunctions und den Abstract Wikipedia-Projekten allgemein werden unter freien Lizenzen veröffentlicht werden. Textuelle Inhalte auf Wikifunctions werden unter CC BY-SA veröffentlicht, Funktionssignaturen unter CC0. Wir müssen entscheiden, ob abstrakter Inhalt für Abstract Wikipedia unter CC BY-SA oder CC0 veröffentlicht wird, und ob Funktionsimplementierungen (Code) unter der Apache-Lizenz oder der GPL veröffentlicht werden.

Wir möchten gerne wissen, welche Lizenzen ihr bevorzugt, und ob ihr andere Vorschläge, Rückmeldungen, Bedenken, usw. habt. Bitte hinterlasst Kommentare auf der Diskussionsseite.

Wir werden die Diskussion und Meinungen um den 16. Dezember herum zusammenfassen, die Entwürfe der Zusammenfassung und Entscheidung bis zum 20. Dezember stehen lassen, und die Entscheidung kurz nach oder während der Sprechstunde fertigstellen, vorausgesetzt die Rückmeldungen sind positiv.

Bestandteile

Ein wichtiger Schritt auf dem Weg zu Abstract Wikipedia ist Wikifunctions, ein Wiki von Software-Funktionen, die mit Datenobjekten aus Wikidata kombiniert werden können. Wikifunctions wird eine Software-Hosting-Plattform sein, die es Beitragenden ermöglicht, Code vom Browser aus zu schreiben und auszuführen. Wikifunctions wird es möglich machen, Funktionen einzureichen und auszuführen, die Inhalte aus anderen Wikimedia-Projekten einbinden können.

Für die Lizenzdiskussion betrachten wir vier verschiedene Arten von Inhalten:

  • Funktionssignaturen: Die Definition einer Funktion, d.h. ihr Name, die Anzahl und Typen ihrer Eingabeargumente, und der Ausgabetyp;
  • Funktionsimplementierungen: Der Code, der innerhalb von Wikifunctions aufgerufen und ausgeführt wird, sowohl von Beitragenden eingereichter Code als auch im System verfügbare Softwarebibliotheken;
  • Abstrakter Inhalt: Die abstrakte Darstellung von Text oder Textbausteinen – im wesentlichen eine Abfolge spezieller Funktionsaufrufe, um ein Ergebnis zu produzieren; und
  • Ausgabeinhalt: Der Text, der entsteht, indem Funktionsimplementierungen auf abstraktem Inhalt aufgerufen werden, oft unter Bezugnahme auf Wikidata-Inhalte.

Im nächsten Abschnitt steht ein Beispiel jeder Art.

Die folgende Abbildung skizziert die verschiedenen Bestandteile von Abstract Wikipedia, die für diese Diskussion relevant sind. Wir beschreiben die verschiedenen Bestandteile im darauffolgenden Text.

Architektur, wie Wikifunctions zur Textgenerierung verwendet werden wird

Wikifunctions wird aus Funktionssignaturen, Funktionsimplementierungen, und anderen Objekten bestehen. Diese anderen Objekte können verschiedene Typen haben, wobei der Satz von Typen erweiterbar ist. Objekte werden dokumentiert sein.

Funktionsdefinitionen sind wie APIs (Programmierschnittstellen), sie geben den Namen einer Funktion und deren Argumente sowie die Argumenttypen und den Rückgabetyp an. Implementierungen sind der Quelltext der Funktionen – sie weisen den Computer an, wie die Argumente in ein Ergebnis umgewandelt werden können. Dokumentation kann für jede Definition, Implementierung, und andere Art von Objekt in Wikifunctions erstellt werden. Andere Objekte in Wikifunctions können Tester, individuelle Zeichenketten, Listen, Typen, abstrakte Inhalte, uvm. sein.

Einige der Funktionen werden abstrakten Inhalt entgegennehmen und daraus Ausgabeinhalte (oft Text in natürlicher Sprache) generieren. Einige der Funktionen werden Daten aus Wikidata oder anderen Quellen verwenden und daraus Text in natürlicher Sprache generieren. Die Funktionen können lexikographische Daten aus Wikidata verwenden, um den Text zu generieren.

Der erstellte Text kann in Wikipedia integriert werden, um Wissenslücken zu füllen.

Beispiele der Bestandteile

Hinweis: Diese Beispiele sind hochgradig vereinfacht, und zeigen englischsprachige Beispielwerte, die in Wirklichkeit übersetzbare Wikidata-QIDs wären (Beispiele).

Gibt es einen Konstruktor Superlative (Superlativ) mit den Schlüsseln subject (Subjekt), quality (Eigenschaft), class (Klasse), und location constraint (Ortseinschränkung), so können wir den folgenden abstrakten Inhalt formulieren:

Superlative(
  subject: Jupiter,
  quality: large,
  class: planet,
  location constraint: Solar System)

In Wikifunctions hätten wir folgende Funktionsdefinition:

generate text(superlative, language) : text

D.h., eine Funktion die ein Superlativ-Objekt (wie im abstrakten Inhalt oben gegeben) und eine Sprache (z.B. Englisch) entgegennimmt und Text zurückgibt.

Dies wäre dann eine mögliche Funktionsimplementierung in Python:

def generate_text(superlative, language):
  if language == English:
    subject = get_label(superlative.subject, language)
    adjective = superlative_form(superlative.quality, language)
    class = singular_form(superlative.class, language)
    location_clause = make_location_clause(superlative.location_constraint, language)
    text = ‘ ‘.join(subject, ‘is the’, adjective, class, location_clause)
    return text.capitalize_first(text)
  if language == Hausa:
    ...
  ... 

Die Anwendung der Funktion auf den abstrakten Inhalt würde den folgenden Ausgabeinhalt ergeben:

(auf Englisch) Jupiter is the largest planet in the Solar System.

(auf Kroatisch) Jupiter je najveći planet u Sunčevom sustavu.

Dieser Text kann dann in einer Wikipedia-Sprachversion angezeigt werden, um etwas Grundwissen über Jupiter bereitzustellen.

Rechtliche Analyse und Urheberrechtsnormen für verschiedene Inhaltsarten

Die Wikimedia-Bewegung hat sich eine Lizenzierungsrichtlinie gegeben, welche freie Lizenzen und Open-Source-Softwarelizenzen bevorzugt. Die Creative Commons Zero-Erklärung (CC0) bietet eine Verzichterklärung, die darauf zielt, Inhalte weltweit in die Gemeinfreiheit (oder das örtliche rechtliche Äquivalent dazu) zu überführen. Die Lizenz Creative Commons Namensnennung, Weitergabe unter gleichen Bedingungen (Attribution-ShareAlike, CC BY-SA) ermöglicht es, Inhalte zu verwenden, solange eine minimale Bedingung zur Namensnennung erfüllt wird und weitere Bearbeitungen unter einer kompatiblen Lizenz veröffentlicht werden. Und für Software folgt Wikimedia der Liste zertifizierter Lizenzen der Open Source Initiative (OSI).

Tatsachen

Tatsachen selbst sind im Allgemeinen nicht urheberrechtlich geschützt. In den Vereinigten Staaten hat der Oberste Gerichtshof dieses Prinzip in Feist Publications Inc. v. Rural Telephone Service Co. formuliert: „Der elementare Grundsatz des Urheberrechts ist, dass ‚kein Autor seine Ideen oder von ihm überlieferte Tatsachen urheberrechtlich schützen kann.‘“ Diese Grundregel des Urheberrechts gilt unabhängig davon, ob Inhalt ausdrücklich unter einer Lizenz veröffentlicht wird.

Die Wikimedia-Projekte haben für Projekte, die einfache Faktendaten zusammentragen sollen, die CC0-Lizenz gewählt. Das beinhaltet zum Beispiel Datenobjekte und Eigenschaften auf Wikidata, oder strukturierte Daten auf Wikimedia Commons. CC0 bietet eine einfache, internationale Verzichterklärung über Urheberrecht, um sicherzustellen, dass Faktendaten ohne Einschränkungen verwendet werden können. Dadurch ist es einfacher, dass Inhalte gefunden, wiederverwendet, und anderswo zitiert werden. Diese Lizenz kann auch nicht schutzwürdige Inhalte beinhalten, die aus Quellen kopiert werden, welche unter anderen Lizenzen stehen, z.B. Wikipedia-Text, der sonst unter CC BY-SA verfügbar ist.

Software

Software ist generell urheberrechtlich schutzwürdig, obwohl nicht alle Bestandteile von Software gleich behandelt werden sollten. Wikimedia vertritt die Position, dass die Gliederung und grundlegende Funktion von APIs unter US-Recht nicht urheberrechtlich geschützt sind.

Für schutzfähige Software verwendet die Foundation eine Open Source-Softwarelizenz, um Wiederverwendung unter minimalen Bedingungen zu erlauben. Wikimedias Richtlinie zu freier Software und Open Source schreibt vor, dass die Foundation sämtlichen von ihr erstellten Code unter einer geeigneten Open Source-Lizenz veröffentlicht. In Bereichen, in denen Wikimedia von Beitragenden erstellte Software unterstützt, etwa Wikimedia Cloud Services, erfordert sie auch, dass diese Software unter einer Open Source-Lizenz veröffentlicht wird. Es gibt eine breite Auswahl von Lizenzen, die als Open Source gelten, weshalb Wikimedia diese Anforderung üblicherweise über die Liste zertifizierter Softwarelizenzen der OSI implementiert.

Für MediaWiki ist die GNU General Public License (Version 2.0 oder eine neuere Version), eine Copyleft-Lizenz, die Hauptlizenz, und die meisten Erweiterungen, Benutzeroberflächen und PHP-Bibliotheken sind unter dieser Lizenz verfügbar. Für einige andere Projekte wählt Wikimedia eine freizügigere Lizenz, etwa die MIT-Lizenz oder die Apache License (Version 2.0).

Text- oder Medieninhalt

Unter der Wikimedia-Inhaltslizenzrichlinie können Wikimedia-Projekte Inhalte hosten, die unter einer Lizenz für freie Inhalte stehen, gemeinfrei sind (z.B. nach Ablauf von Schutzfristen oder nicht schutzwürdige Inhalte), oder unter eine Fair Use-Doktrin fallen (unter bestimmten Umständen). Für die meisten Wikimedia-Projekte, einschließlich Wikipedia, bedeutet dies, dass Texte und Medien unter CC BY-SA (Version 3.0) verfügbar sind.

Empfehlung der WMF-Rechtsabteilung

Wikimedia sollte die Lizenz für jede Inhaltsart durch klare und einfache Richtlinien für Wikifunctions festlegen. Wikimedia sollte Dokumentation bereitstellen, welche die Lizenzen für jeden Inhaltstyp erklärt, einschließlich der Gründe, diese Lizenz zu wählen. Spezielle Leitlinien für Software sollten sicherstellen, dass nur Drittcode unter geeigneten Lizenzen importiert wird. Die Bedienoberfläche sollte passende Lizenzerteilungen für jede Inhaltsart beinhalten.

Funktionssignaturen

Empfehlung: Funktionssignaturen sollten unter CC0 stehen.

Funktionssignaturen sollten aus Grundkomponenten bestehen (z.B. einer Liste von Parametern), die auf der zugrundeliegenden Funktionalität basieren. Der eigentliche Inhalt der Funktionssignaturen ist wahrscheinlich nicht urheberrechtlich schutzwürdig, und wo er es doch ist, kann er in den USA möglicherweise unter Fair Use verwendet werden. CC0 ist eine geeignete Lizenz für Informationen, deren urheberrechtliche Schutzwürdigkeit nicht gesichert ist. Die Verwendung von CC0 vermeidet es, Wiederverwerter*innen zu verwirren oder bei ihnen den Eindruck zu erwecken, dass urheberrechtliche Einschränkungen vorhanden seien, die in Wirklichkeit nicht existieren. Außerdem sichert CC0 maximale Kompatibilität mit anderen freien oder Open-Source-Lizenzen.

Funktionsimplementierungen

Empfehlung: Funktionsimplementierungen sollten unter der Apache-Lizenz stehen.

Funktionsimplementierungen sollten unter einer OSI-zertifizierten Lizenz stehen. Sollten das Wikifunctions-Team und die Community dies auf nur eine Lizenz einschränken wollen, so bietet die Apache-Lizenz ein optimales Niveau von freizügiger Flexibilität.

Zusätzlich könnte Wikifunctions andere freie Lizenzen, die mit der Apache-Lizenz kompatibel sind, etwa die MIT-Lizenz oder die BSD-Lizenz (3-Klausel-Version). Die Entscheidung, weitere Lizenzen zuzulassen, könnte es ermöglichen, mehr Inhalte aus anderen Quellen zu importieren. Allerdings entstehen dadurch auch weitere Anforderungen an die Software, etwa eine Bedienoberfläche, um eine Lizenz auszuwählen und passende Lizenzhinweise anzuzeigen. Wikifunctions könnte der Einfachkeit halber zu Beginn eine einzelne Lizenz auswählen und dann später die Unterstützung weiterer Lizenzen in Betracht ziehen, falls die Notwendigkeit dafür besteht.

Abstrakter Inhalt

Empfehlung: Abstrakter Inhalt sollte unter CC BY-SA oder CC0 stehen.

Abstrakter Inhalt kann unter einer CC BY-SA-Lizenz oder einer anderen ebenso toleranten Lizenz veröffentlicht werden, solange sie den Projektzielen genügt und Wikimedias Lizenzrichtlinie erfüllt. Wikimedia hat weitgehenden Handlungsspielraum bei der Wahl der besten Lizenz für abstrakten Inhalt.

Die Wahl von CC BY-SA wäre naheliegend, und hätte den Vorteil, konsistent mit Wikipedia und den meisten anderen Wikimedia-Projekten zu sein. Es würde Beitragenden ermöglichen, Inhalte aus Wikipedia irgendwie in abstrakte Inhalte zu kopieren und zu übernehmen. Allerdings würde es auch erfordern, eine Versionsgeschichte oder einen ähnlichen Mechanismus für abstrakten Inhalt zu implementieren, um die Namensnennung der Urheber*innen des Inhalts zu ermöglichen.

Alternativ könnte abstrakter Inhalt unter den toleranteren CC0-Bedingungen veröffentlicht werden. Dies würde der Software erlauben, die Namensnennungsbedingung zu umgehen, aber die Möglichkeiten für Beitragende einschränken, irgendwie geschützte Abschnitte aus Wikipedia-Artikeln oder anderen Quellen zu übernehmen.

Ausgabeinhalt

Empfehlung: Ausgabeinhalt sollte unter CC BY-SA oder CC0 stehen.

Da Ausgabeinhalt durch Software aus verschiedenen Datenquellen kombiniert wird, ist fragwürdig, ob das Ergebnis überhaupt urheberrechtlich schutzwürdig ist. 2019 erbat das US Copyright Office Stellungnahmen, wie Inhalte, die durch KI-Algorithmen oder -Prozesse erstellt wurden, urheberrechtlich behandelt werden sollten. In der Stellungnahme der Wikimedia Foundation erklärten wir, dass KI-Algorithmen genau so wie andere Softwarewerkzeuge behandelt werden sollten, und dass die Anwender*innen der Software als Urheberrechtsinhaber gelten sollten. Nach dem gleichen Prinzip könnte Wikimedia Ausgabeinhalt als kreatives Werk der Urheber des abstrakten Inhalts ansehen. Es wäre daher wahrscheinlich am effektivsten, Ausgabeinhalt konsistent mit bestehenden Wikimedia-Projekten zu lizenzieren, und die Communities können diskutieren, welche der aktuell verwendeten Lizenzen bevorzugt werden sollte(n).

Empfehlungen des Entwicklungsteams

Das Entwicklungsteam empfiehlt, den Empfehlungen der Rechtsabteilung zu folgen, als da wären (zusammengefasst): CC0 als Lizenz für Funktionssignaturen zu wählen; Apache für Funktionsimplementierungen (und mit einer einzelnen Lizenz zu beginnen, und die Unterstützung für mehrere Lizenzen erst bei Bedarf zu implementieren); entweder CC0 oder CC BY-SA für abstrakten Inhalt und Ausgabeinhalt zu wählen.

Für Dokumentation und andere Textinhalte auf Wikifunctions werden wir CC BY-SA wählen, um Kompatibilität mit den meisten anderen Wikimedia-Projekten bezüglich textueller Inhalte zu gewährleisten. Für andere Objekte in Wikifunctions außer Implementierungen bleiben wir konsistent mit der Wahl für Funktionssignaturen.

Das Entwicklungsteam empfiehlt ferner die Wahl von CC BY-SA für abstrakten Inhalt und Ausgabeinhalt. Während man anführen könnte, das abstrakter Inhalt den strukturierten Wikidata-Daten mehr ähnelt als dem Text in natürlicher Sprache, den man in Wikipedia findet, sind wir der Ansicht, dass mehrere Faktoren hinreichende Ähnlichkeit zwischen abstraktem Inhalt und Text bezeugen:

  1. Beitragende können sehr präzise auswählen, welche Tatsachen angezeigt werden und welche nicht. In Wikidata streben wir nach Vollständigkeit anstelle von Auslese.
  2. Beitragende können sehr präzise kontrollieren, in welcher Reihenfolge Tatsachen angezeigt werden, um Erzählungselemente zu bilden, welche auf Wikidata nicht verfügbar sind.
  3. Wir erwarten, dass die Textgenerierung in natürlicher Sprache den Beitragenden ermöglichen wird, ein gewisses Maß an Betonung und Wortwahl auszudrücken.

All dies weist darauf hin, dass abstrakter Inhalt Text mehr ähnelt als einer Ansammlung von Fakten, und daher schlagen wir vor, der gleichen Lizenz zu folgen, welche wir für Wikipedia-Text verwenden, also CC BY-SA. Andererseits könnte man dafür argumentieren, dass wir, wenn wir abstrakten Inhalt unter CC0 stellen, mehr Raum für mögliche Wiederverwertung in Anwendungen schaffen, die wir uns noch gar nicht vorstellen, geschweige denn die besten rechtlichen Rahmenbedingungen beurteilen können. CC0 erlaubt sicherlich die größtmögliche Freiheit bei der Wiederverwendung von abstraktem Inhalt.

Bitte um Rückmeldung

Wir laden die Community ein, diese Empfehlungen zu diskutieren und hoffentlich einen Konsens zur Lizenzentscheidung zu finden. Das Ziel ist, diese Diskussion etwa vier Wochen offen zu lassen, und, falls nötig, sie auszuweiten und umzustrukturieren. Falls dies nicht ausreichen sollte, um zu einer Übereinstimmung zu kommen, dann werden wir möglicherweise die Lizenzdiskussion neu gliedern, um uns vorerst auf Wikifunctions zu konzentrieren, und dann später eine Diskussion über Abstract Wikipedia folgen zu lassen.

Um die Wahl der Lizenz zu lenken mag es nützlich sein, die folgenden Fragen zu erwägen und diskutieren:

  1. Was sind die langfristigen Ziele der Projekte, und wie kann eine Urheberrechtslizenz diese Ziele unterstützen?
  2. Sollte abstrakter Inhalt den Beitragenden zugeschrieben werden?
  3. Wie nützlich ist es, mit Wikipedia-Lizenzen konsistent und kompatibel zu sein?

(Aktualisiert: 2021-12-03)

Spezifisch haben wir folgende zwei Fragen an die Community: sollten wir CC BY-SA oder CC0 für abstrakte Inhalte für Abstract Wikipedia verwenden; und sollten wir Apache oder GPL für Code-Implementierungen verwenden.

Selbst wenn du beide Optionen in Ordnung findest, wäre es großartig, deine Stimme ausdrücklich widergespiegelt zu sehen, um ein besseres Verständnis zu haben, wozu die Community tendiert.

Rückmeldungen sind in jeder Sprache willkommen.