Einträge von Jörg Lehmann

It’s the statistics, stupid

„It’s the statistics, stupid“, könnte man formulieren, wenn es um den Umgang mit generativen vortrainierten Sprachmodellen (generative pretrained transformer, GPT) geht. Den müssen wir jedoch alle noch lernen, ein Jahr nach der Präsentation von ChatGPT. Statistische Zusammenhänge bilden den Schlüssel, um zu begreifen, wie stochastische Vorhersagemodelle funktionieren und was sie zu leisten imstande sind. Einfach […]

Preisfrage: Openness vs. Arkanwissen im 21. Jahrhundert

Im Jahr 1798 schrieb die Königliche Societät der Wissenschaften in Göttingen im Reichs-Anzeiger folgende Preisfrage aus: “Wie können die Vortheile, welche durch das Wandern der Handwerksgesellen möglich sind, gefördert und die dabei vorkommenden Nachtheile verhütet werden?” Zwölf Preisschriften wurden begutachtet, u.a. durch Georg Christoph Lichtenberg und Johann Christian Blumenbach. Den ersten Preis erhielt ein gewisser […]

Wessen Offenheit? Wessen Ethik?

Offenheit – oder „openness“ – kann als eine derjenigen Logiken beschrieben werden, die die zeitgenössische Wissenschaft und Kultur antreibt. Der Mechanismus dahinter ist recht einfach: Die Nationalstaaten nehmen einen Teil ihrer Steuereinnahmen und investieren sie in die Finanzierung von Wissenschaft und Kultur, in letzterem Bereich zum Beispiel in die Digitalisierung kulturellen Erbes. Im Gegenzug sind […]

Kulturerbedaten, künstliche Intelligenz, und die Ethik der Nichtintervention

Es ist eine bekannte Tatsache, dass Algorithmen des maschinellen Lernens die statistischen Schiefe der Datensätze, auf denen sie trainiert wurden, noch verstärken. In jüngster Vergangenheit wurde diese Tatsache gut belegt, z. B. durch Cathy O’Neills Buch „Weapons of Math Destruction“ (2016), in Kate Crawfords und Trevor Paglens „Excavating AI“ (2019), oder in Artikeln wie „Data […]

Über die Verwendung von Lizenzen in Zeiten von großen Sprachmodellen

An sich könnte ja alles ganz einfach sein: Kulturerbeeinrichtungen und andere öffentliche Stellen bieten qualitativ hochwertige Daten in großem Umfang an, und das möglichst unter einer permissiven Lizenz wie etwa CC0 oder Public Domain Mark 1.0. Das entspricht der Ausgangsidee: Kulturerbeeinrichtungen werden aus Steuermitteln finanziert, daher sollen ihre Dienstleistungen und Produkte auch allen zugutekommen; im […]

Über den Einsatz von ChatGPT in Kulturerbeeinrichtungen

Seit der Veröffentlichung des Dialogsystems ChatGPT im November 2022 hat die gesellschaftliche Debatte über Künstliche Intelligenz (KI) deutlich an Fahrt aufgenommen und auch Kulturerbeeinrichtungen wie Bibliotheken, Archive und Museen erreicht. Dabei geht es vor allem um die Einschätzung, wie leistungsfähig solche grossen Sprachmodelle (Large Language Models, LLMs) im Allgemeinen und Generative Pre-trained Transformers (GPTs) im […]