Während der Arbeit an der NRM KI haben die Beteiligten früh festgestellt, dass es immer wieder eine gewisse Verwirrung bezüglich der verwendeten Begriffe unter den Mitwirkenden gab. Aus diesem Grund entstand eine Glossar-Gruppe (der die Autoren dieses Artikels angehörten), deren zentrales Anliegen die Bewältigung
dieses Sprachgewirrs war, das heißt, die Vereinheitlichung der Begriffe inkl. der zugehörigen Koordination der Teilnehmenden. Unter Leitung der Glossar-Gruppe entstand ein gemeinsames Glossar für die knapp 450 Seiten starke NRM KI, das einerseits die Schwerpunktthemen hinsichtlich der Anwendungen (z. B. Medizin, Mobilität, Energie & Umwelt, Finanzdienstleistungen, Industrielle Automation) und grundlegenden Fragen (z. B. KI-Klassifizierung, Sicherheit, Zertifizierbarkeit, Soziotechnische Systeme, Ethik) abdeckt. Andererseits verschafft es quer durch verschiedenste Interessensgruppen und Informationsquellen einen Überblick über die zentralen Begriffe im Bereich von KI und dessen Umfeld.
Abb. 1: „Humanoide Roboter, die Wörterbücher lesen, als Infografik“. Ein von der KI „DALL-E“ (OpenAI [Ope23b]) erzeugtes Bild für diesen Beitrag. Selbst für Experten ist schwer zu beschreiben und zu verstehen, wie dieses Bild zustande gekommen ist. Umso wichtiger ist bei Expertengesprächen, Missverständnisse selbst über elementare Begriffe zu vermeiden - nicht nur unter Robotern
Eine Roadmap für KI-Normen
den aktuellen Entwicklungen immer stärker Beförderer von exponentiellen Technologien, die unterschiedlichste Branchen und Disziplinen enger denn je miteinander verbinden. General Purpose KI-Modelle, basierend auf maschinellem Lernen (ML), lösen bereits heute Probleme aus sehr unterschiedlich sensiblen Bereichen, von personalisierter Werbung bis zu medizinischer Diagnostik und autonomem Fahren. Sie können Sprache oder Bilder nicht nur analysieren, sondern auch künstlich erzeugen, und betreffen dabei die Spitzenforschung ebenso wie mittelständische Unternehmen oder Privatanwenderinnen und -anwender.
Einige KI-Anwendungen sind dem Menschen in Teilbereichen bereits überlegen, beispielsweise erstmals 2012 in der Bildauswertung bei der Erkennung von Straßenschildern [Cir12] oder im Rahmen der Erkennung von Hautkrebs in der Medizin [EST17]. Was die Zukunft bereithält, erahnen wir gerade erst an aktuellen Entwicklungen wie ChatGPT [Ope23a] oder DALL-E 2 [Ope23b]. Um den Mehrwert dieser Technologien zu maximieren, und gleichzeitig Risiken zu minimieren, wird schon heute für übermorgen geplant: Die NRM KI von DIN und DKE hat das Ziel, zu identifizieren, wo Normen und Standards nötig sind, um KI verlässlich entwickeln, betreiben und insbesondere verstehen zu können. Im vergangenen Jahr haben sich dazu Experten aus Wirtschaft, Gesellschaft und Forschung zusammengetan, um gemeinsam diese „Roadmap“ zu einer zweiten Ausgabe weiterzuentwickeln.
Wer aber zusammen reden und arbeiten will, sollte sicher sein, auch dieselbe Sprache zu sprechen. Und gerade das ist bei KI alles andere als einfach: Schon der Begriff „KI“ selbst ist auf unterschiedlichste Arten definiert worden (die Uneinigkeit beginnt spätestens beim Begriff „Intelligenz“). Zudem verbindet er so unterschiedliche Branchen, dass sich sogar branchenspezifische Standards in ihren Begriffsdefinitionen widersprechen können. Das führt zu der kuriosen Situation, dass zwei Experten aus unterschiedlichen Branchen völlig aneinander vorbeireden können, obwohl beide standardisierte Begriffe verwenden – wie wir an Beispielen in diesem Beitrag sehen und diskutieren werden, und wie auch in Abbildung 2 und 3 sichtbar wird.
Abb. 2: Selbst identische Begriffe aus der Welt der KI können unterschiedliche Definitionen in verschiedenen Standards haben. Hier zwei Beispiele aus dem AI-Glossary [AIG23] mit Verweisen auf verschiedene Quellen (links der Begriff „KI“) oder in unter-schiedlichem Kontext (rechts der Begriff „Validierung“)
Abb. 3: Vereinfachter bildlicher Vergleich der Begriffswelten der System- und Produkt-entwicklung einerseits (oben), und des maschinellen Lernens (ML) andererseits (unten). Auch den unteren Teil des Roboters hat übrigens [Ope23b] für uns gezeichnet
Gerade im technisch-wissenschaftlichen Bereich ist ein wesentlicher Erfolgsfaktor, dass die Beteiligten einheitliche Begriffe verwenden. Das kennen wir beispielsweise in technischen Systemen: Wenn Softwaresysteme nicht dieselbe „Sprache“ verstehen, wenn sie Daten und deren Inhalte nicht einheitlich interpretieren, dann kommt es mit großer Wahrscheinlichkeit früher oder später zu Schwierigkeiten. Ein Beispiel dafür aus dem technischen Umfeld ist der Absturz der NASA-Sonde „Mars Climate Orbiter”, die im Rahmen des Discovery-Programms zur Untersuchung des Marsklimas zum Einsatz kam. Im Zuge der Untersuchungen wurde der Absturz auf Berechnungen in unterschiedlichen Maßeinheiten seitens der involvierten Teams aus Europa und den Vereinigten Staaten zurückgeführt [Mer99]. Davon ausgehend sind Übereinkünfte nicht nur auf der Ebene technischer Systeme wichtig, sondern auch für die Zusammenarbeit verschiedener Partner, zum Beispiel von unterschiedlichen Unternehmen oder organisatorischer Ebenen.
Wie wirksam man mit sprachlicher Verwirrung technische Entwicklungen zum Erliegen bringen kann, hat schon die Bibel (Genesis 11, 1-9) erzählt: Als die Babylonier den Bau eines Turms beginnen, der bis in den Himmel reichen soll, gibt Gott ihnen unterschiedliche Sprachen – das allein genügt, um das Vorhaben scheitern zu lassen.
Ziele der Arbeitsgruppe Glossar
Um die genannten Mehrdeutigkeiten bestmöglich einzudämmen, zumindest aber klar zu benennen und für die Arbeit eine verbindende Sprache zu schaffen, hat das DIN in der NRM KI eine Arbeitsgruppe für ein gemeinsames, branchen- und bereichsübergreifendes Glossar eingesetzt. Im Rahmen dieser Tätigkeit haben wir, die Mitglieder dieser Arbeitsgruppe und Autoren dieses Artikels, uns die Aufgabe gestellt, für die gängigsten Fachbegriffe im Umfeld von KI und maschinellem Lernen (ML) prägnante, kurze Definitionen aufzustellen: mit Verweis auf bereits bestehende Normen oder Definitionen, insbesondere dort, wo diese zu Missverständnissen und Bedeutungsunterschieden führen können.
Dass dies nicht nur einem akademischen Zweck dient, haben wir in unseren Diskussionen um manche Begriffe hautnah erlebt. Einige davon greifen wir im Folgenden als Beispiele auf, geben einen Einblick in die Arbeiten und ihre Besonderheiten im Vergleich zu sonst üblichen Glossaren und zeigen, wie Anwender auch zukünftig von diesem Mehrwert profitieren.
Normen und Gesetze – nicht immer in Harmonie
Eine grundlegende Eigenschaft von Dokumenten aus Normung und Gesetzgebung ist, die Terminologie für die jeweils im Dokument beschriebenen Sachverhalte festzulegen. Das allein verschafft aber noch keine breite Anwendung der festgelegten Terminologien: Normungsdokumente müssen oft erst teuer erworben werden. Zudem können Normen auf nationaler, europäischer oder internationaler Ebene in der Definition identischer Begriffe stark voneinander abweichen. Zum Beispiel existiert für Begriffe in ISO-Normen eine Suchmaschine namens Online Browsing Platform (ISO OBP) [ISO23], die bei der Suche zum Beispiel nach dem Begriff „Metadaten” mindestens 96 Normen mit 46 unterschiedlichen Definitionen ergibt [Fur20].
Im Gegensatz zu kostenpflichtigen Normen sind Gesetzesdokumente staatlicher Organe üblicherweise kostenfrei vollständig einsehbar, können aber identische Begriffe wiederum anders als Normungsdokumente definieren. Ein Beispiel dafür sind die unterschiedlichen terminologischen Formulierungen zwischen dem europäischen Gesetzesvorschlag zu KI („AI Act”) [Eur21] und der
internationalen Norm zu KI-Konzepten und Terminologie „ISO/IEC 22989”. Unternehmen, die sich auf Gesetzesdokumente stützen, stehen möglicherweise schneller vor einem schwer nachvollziehbaren Geflecht ineinandergreifender Begriffe und Querbezüge zu unterschiedlichen Dokumententeilen. Allerdings können auch terminologische Beschreibungen erst nach einer Analyse miteinander verknüpfter Normen und Gesetze nachvollzogen werden.
Das AI-Glossary als neuer Ansatz
Selten orientiert sich (auch aus den genannten Gründen) der Sprachgebrauch innerhalb von Zivilgesellschaft, Wirtschaft und Wissenschaft direkt an terminologischen Beschreibungen in Normungsund Gesetzesdokumenten. Wir haben uns in der Glossar-Gruppe der Aufgabe gestellt, für jeden wichtigen Begriff im Kontext der KI-Thematik eine Liste der Definitionen aus den wichtigsten Normungsdokumenten zusammenzustellen und neben der NRM KI in vollem Umfang zugänglich als „AI-Glossary“ zu veröffentlichen [AIG23].
Neben den häufig genutzten KI-Begriffen mit ihrer Bedeutung und definierenden Normen, wie in Abbildung 2 gezeigt, haben wir zudem grundlegende Fachbegriffe aus den Bereichen bestehender und absehbarer KI-Anwendungen aufgenommen. Dies war für das von der NRM KI abgedeckte breite Spektrum an Fachdisziplinen oft eine sinnvolle Ergänzung. Zusätzlich enthält es aber auch Begriffe aus verschiedenen Fachdisziplinen, die besonders von KI-Entwicklungen betroffen sind oder bald sein werden (wie Informatik, Recht, Soziologie …), um die interdisziplinäre Kommunikation zu erleichtern.
Weil die Begriffsdefinitionen auch mit Experten anderer Fachdisziplinen abgestimmt wurden, sollten diese zudem fachfremden Nutzern leichter verständlich sein. Das AI-Glossary schafft so eine gemeinsame Grundlage für einen disziplinübergreifenden Dialog und erlaubt eine sachlichere, zielführende und vor allem missverständnisarme Diskussion über KI und deren Vorteile wie auch Herausforderungen.
Woher kommen die Begriffsunterschiede zwischen Branchen?
Begriffe in Normen sind bislang vor allem so definiert worden, dass sie – wie lokale Variablen einer Software – im Kontext („Scope“) des Normtexts konsequent schlüssig sind. Zwar werden innerhalb von verschiedenen Normen derselben Branche, zum Beispiel Fahrzeugentwicklung, Begriffe weitgehend durchgängig gleich oder ähnlich verwendet – zwischen unterschiedlichen Branchen hingegen klaffen aber oft Welten zwischen gleichlautenden Begriffen.
Ein wichtiger Grund dafür ist, dass Begriffe stark vom jeweiligen Kontext abhängig sind und sich zum Teil aus ganz unterschiedlichen Richtungen entwickeln. Ein Beispiel dafür ist der Begriff Validierung (s. Abb. 3). Im Bereich des ML bezieht er sich auf eine Auswahl beziehungsweise Optimierung eines geeigneten KI-Modells (siehe ISO/IEC 22989 – “Artificial intelligence concepts and terminology” [ISO22]). Nachdem die Modelle eintrainiert sind, wird anhand von unabhängigen Validierungsdaten geprüft, welches der Modelle und welche der übergeordneten Modellparameter (Hyperparameter) am besten passen.
Diese Interpretation des Begriffs Validierung hat sich in der KI-Community so stark verankert, dass er auch in Normen Einzug gefunden hat. Im allgemeinen Kontext der Produktentwicklung bezeichnet Validierung klassischerweise jedoch die Erbringung eines objektiven Nachweises, dass Produktanforderungen für eine gegebene Anwendung ausreichend erfüllt worden sind (siehe ISO/IEC 17000 - „Konformitätsbewertung - Begriffe und allgemeine Grundlagen”). Diese ist quasi ein finaler Check, dass das Produkt in seiner ihm zugedachten Umgebung das gestellte Ziel erfüllt, und stellt nicht nur einen Zwischenschritt dar, der einer Optimierung von Modellen dient. Der Kasten „Unterschiedliche Verwendung des Begriffs Validierung” beschreibt für Interessierte die Zusammenhänge nochmals detaillierter.
Ein anderer Grund für die kontextabhängige Belegung von Begriffen ist der allgemeine sprachliche Bedeutungswandel [Koc01]. Wenn wir zum Beispiel vom „Trinken-Gehen“ sprechen, haben wir Alkohol und nicht Wasser im Sinne. Das ist eine Bedeutungsverengung. Mit „KI“ ist in vielen Kontexten nur noch „Deep Learning“ gemeint. Wurde der Begriff „KI“ bis zu den 1990er Jahren beispielsweise noch für konventionell entwickelte Expertensysteme verwendet, zählen diese aus heutiger Sicht oft gar nicht mehr dazu. Den Bedeutungswandel dieses Begriffs bezeichnet die Fachwelt auch als „KI-Effekt" [ISTQB21]. Aufgrund des schon genannten Bedeutungswandels und des Auftauchens neuer Konzepte soll die Online-Version des AI-Glossary ständig aktualisiert werden.
Welche praktischen Probleme ergeben sich daraus?
Durch die unterschiedliche Verwendung der Begriffe können zum Beispiel bei der Zertifizierung und Konformitätsbewertung von Produkten erhebliche Probleme entstehen. Wenn benannte Stellen, die die Bewertungen von Produkten durchführen (z. B. TÜV), ein anderes Verständnis zugrunde legen als Hersteller, dann könnten Zertifizierungen aufgrund der unterschiedlichen Auffassungen selbst dann nicht erfolgreich sein, wenn das Produkt eigentlich die gesetzlichen Anforderungen erfüllt.
Nehmen wir nochmals das Beispiel Validierung, wie in Abbildung 3 gezeigt. Der Entwurf des AI Acts [Eur21], den die Europäische Union (EU) im April 2021 auf den Weg gebracht hat, um KI-Produkte zu regulieren, verwendet den Begriff „Validierung“ hauptsächlich so, wie er in der KI-Community etabliert ist. Produktspezifische Gesetze wie die Medizinprodukteverordnung, die ebenfalls von der EU stammt, verwenden ihn hingegen im klassischen Sinn. Wir sehen also, dass selbst innerhalb einer Organisation (EU) unterschiedliche Begriffsbildungen verwendet werden. Hinzu kommt, dass auch die Entwicklung von Normen durch unterschiedliche Organisationen vorangetrieben wird. Im Bereich technischer Systeme gibt es zum Beispiel mit der ETSI (Bereich Telekommunikation), IEC (Bereich Elektrotechnik) und ISO (allgemeine Bereiche) unterschiedliche internationale Standardisierungsorganisationen, die eigene Normen entwickeln. So gibt es speziell für die Terminologie im Bereich von KI-basierten Verfahren mit der ETSI GR ENI 004 V2.2.1 [ETSI21] sowie der ISO/IEC 22989 [ISO22] zwei dedizierte Normen, die bei der Begriffsdefinition zwar viele Ähnlichkeiten, aber auch einige Abweichungen aufweisen. Bei letzterer haben sich zumindest IEC und ISO zusammengesetzt und sich mit der ISO/IEC 22989 auf einen einheitlichen Standard geeinigt. Andere Organisationen wie auch die EU oder weitere Organisationen, die Normen bereitstellen (z. B. IE-EE), weichen aber wiederum davon ab.
Mehrwert und Nutzbarkeit des AI-Glossary
Während in der NRM KI aus Platzgründen nur ein Teil der über 200 gesammelten Begriffe gelistet werden konnte, enthält die Online-Version den vollen erarbeiteten Umfang. Das AI-Glossary listet dabei nicht nur die Begriffe, sondern enthält zudem Verweise auf die Normen zur KI-Terminologie, welche diese Begriffe ebenfalls definieren (vgl. Abb. 2). Dabei haben wir gegebenenfalls Unterschiede in der Begriffsbildung gezielt herausgearbeitet. Damit liefert das AI-Glossary die Möglichkeit, einen weitreichenden Überblick über die Begriffswelt im Bereich KI zu erhalten. Es bildet so eine Basis für einen Vergleich, eine konsistente Verwendung und auch eine weitere Vereinheitlichung der Begriffe. In der konkreten Anwendung kann das Glossar als eine einheitlich genutzte Referenz im Zuge gemeinsamer Arbeiten sowie der organisatorischen Abstimmung zwischen und innerhalb von Teams genutzt werden. Im Zuge organisatorischer Arbeiten bietet das Glossar eine Orientierung für umzusetzende Anforderungen an Produkte und Dienste sowie die damit zusammenhängenden operativen Schritte.
Es ist direkt als Webseite kostenfrei verfügbar, auf der man nach passenden Begriffen suchen kann. Somit ist ein sehr universeller Zugang zu der vollständigen Liste der Begriffe gesichert. Uns ist wichtig, dass das AI-Glossary in zitierfähiger Form vorliegt. Deshalb werden dedizierte Stände freigegeben werden, die als Version eindeutig referenziert werden können. Das AI-Glossary beinhaltet damit auch die Möglichkeit, den Stand der Entwicklungen in diesem sehr dynamischen Umfeld widerzuspiegeln. Zudem wollen wir die Funktionalität in weiteren Stufen ausbauen. Das betrifft insbesondere erweiterte Such- und Filterfunktionen, mit denen Begriffe aus einem bestimmten Unterbereich gezielt gesammelt werden können.
Konkret profitieren dadurch viele Rollen wie Anwender, Entwickler, Tester, Manager, Architekten oder Entscheider durch eine bessere Kommunikation mit weniger Missverständnissen selbst unter Experten unterschiedlicher Fachdisziplinen. Ergebnis sind typischerweise Produkte besserer Qualität und effizientere Prozesse.
Wir hoffen, dass dieses Glossar, das im Mai – also kurz vor Erscheinen dieses Hefts – verfügbar sein wird, vielen bei der Arbeit mit KI-Systemen hilfreich sein wird und dazu beiträgt, Klarheit in das etwas „babylonische“ Sprachgewirr im Bereich der KI-Terminologie zu bringen.
Unterschiedliche Verwendung des Begriffs Validierung
Literatur und Links
[AIG23]
AI-Glossary, entstanden aus der Arbeit an der Deutschen Normungsroadmap KI, Ausgabe 2, s.
[DIN22],
https://ai-glossary.org
[BMW20]
BMWK, Strategie Künstliche Intelligenz der Bundesregierung, Fortschreibung 2020,
https://www.bmwk.de/Redaktion/DE/Publikationen/Technologie/strategie-kuenstliche-intelligenzfortschreibung-2020.pdf
[Cir12]
D. Ciresan, U. Meier, J. Schmidhuber, Multi-column Deep Neural Networks for Image Classification, in: IEEE Conf. on Computer Vision and Pattern Recognition, p. 3642–3649, 2012
[DIN22]
DIN und DKE, Deutsche Normungsroadmap KI, Version 2, 2022-12-09,
https://www.dke.de/de/arbeitsfelder/core-safety/normungsroadmap-ki
[EST17]
A. Esteva et al., Dermatologist-level classification of skin cancer with deep neural networks, in: Nature, 2017 Feb 2, 542(7639):115-118. doi: 10.1038/nature21056, Epub 2017 Jan 25
[ETSI21]
ETSI GR ENI 004 - Experiential Networked Intelligence (ENI). Terminology for Main Concepts in ENI, Version 2.2.1, 2021
[Eur21]
European Commission, Proposal for a Regulation of the European Parliament and of the Council Laying Down Harmonised Rules on Artificial Intelligence (Artificial Intelligence Act) and Amending Certain Union Legislative Acts Com/2021/206 Final, 2021, verfügbar unter:
https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX:52021PC0206
[Fur20]
J. Furner, Definitions of “metadata”: A brief survey of international standards, in: J. of the Association for Information Science and Technology 71.6 (2020): E33-E42
[ISO20]
ISO/IEC TR 29119-11 - Software and systems engineering — Software testing — Part 11: Guidelines on the testing of AI-based systems, 2020
[ISO22]
ISO/IEC 22989 - Information technology — Artificial intelligence — Artificial intelligence concepts and terminology, 2022
[ISO23]
International Organization for Standardization's Online Browsing Platform,
https://www.iso.org/obp/ui#home
[ISTQB21]
International Software Testing Qualifications Board - Certified Tester AI Testing Syllabus, Version 1, 2021
[Koc01]
P. Koch, Bedeutungswandel und Bezeichnungswandel, in: Zeitschrift für Literaturwissenschaft und Linguistik 31.1 (2001): 7-36
[Mea90]
C. Mead, Neuromorphic Electronic Systems, in: Proc. of the IEEE 78 (10) (1990) 1629–1636
[Mer99]
A. Merwarth et al., Mars Climate Orbiter Mishap Investigation Board Phase I Report, 10.11.1999,
https://www.dcs.gla.ac.uk/~johnson/Mars/MCO_report.pdf
[Ope23a]
Open AI Plattform, ChatGPT,
https://openai.com/blog/chatgpt/
[Ope23b]
Open AI Plattform, DALL•E 2, openai.com/dall-e-2