Technologie

Wie lernt eine Maschine eigentlich? Künstliche Intelligenz basiert auf technischen Systemen, die Daten verarbeiten und Muster erkennen. Wer diese Grundlagen versteht, erkennt Chancen für den Unterricht und gewinnt Sicherheit im Umgang mit den neuen Möglichkeiten.

Technologische Perspektive

Im Folgenden liegt der Fokus auf der technologischen Perspektive des Dagstuhl-Dreiecks. Im Zentrum steht das Verständnis der Funktionsweise und der zugrundeliegenden Konzepte von KI-Systemen

Hier erfahren Sie, wie KI-Systeme technisch entwickelt und trainiert werden und nach welchen Prinzipien sie Entscheidungen treffen. Zudem erhalten Sie Einblick in die zentralen Konzepte, die modernen Anwendungen wie ChatGPT, Gemini oder Bildgeneratoren zugrunde liegen.

(Gesellschaft für Informatik e.V, 2019)

BeLEARN, Technologie

Schwache vs. starke KI: Realität und Zukunft

Viele Menschen haben Angst vor einer KI-geprägten Zukunft, wie sie in Science-Fiction-Filmen oft dargestellt wird. In diesen Filmen sehen wir Roboter, die zunächst von Menschen programmiert werden, sich dann aber gegen die Menschheit wenden und zu bedrohlichen, eigenständig denkenden und handelnden Wesen werden.

Um diese Angst zu überwinden, ist es wichtig, sich dem Unterschied zwischen schwacher und starker KI bewusst zu werden.

BeLEARN, Technologie
Mehr zu diesem Thema erfahren

Schwache KI
Die schwache KI, zu der digitale Assistenzsysteme wie Siri oder Alexa oder eben auch Chatbots gehören, ist auf menschliche Eingriffe angewiesen und konzentriert sich auf das Ausführen von bestimmten vorprogrammierten Aufgaben, die auf den zur Verfügung gestellten Trainingsdaten (IBM, o.D.)​ basieren. Klar definierte Aufgaben können dadurch mit einer festgelegten Methode gelöst werden, wodurch sich die schwache KI gut für die Automatisierung und das Controlling von Prozessen eignet.

Starke KI
Bei den KI-Systemen, die wir aus Science-Fiction Filmen kennen, würden wir hingegen von einer starken KI sprechen. Diese KI-Systeme könnten beispielsweise selbstständig Aufgabenstellungen erkennen, Wissen dazu erarbeiten und durch Analyse zur Problemlösung gelangen, wobei die Lösung ganz neu sein kann. Eine starke KI wäre also in der Lage, neue Inhalte zu generieren. Eine solche KI-Entwicklung ist heute jedoch nicht in Sicht und bleibt vorerst ein theoretisches Konzept ​(IBM, o. D.).

KI einfach erklärt

Was hat Ihr Musikgeschmack mit der Wegbeschreibung Ihres Navigationsgerätes zu tun? Beides wird sehr wahrscheinlich zumindest zu einem gewissen Teil von KI beeinflusst! Hinter vielen Applikationen, die uns im Alltag begleiten, steckt bereits seit Jahren eine Form von KI. Seien es Musik-Apps, die personalisierte Musikvorschläge generieren, oder das Navigationsgerät im Auto, das uns den kürzesten Weg zur Zieldestination empfiehlt​ (Akgun & Greenhow, 2022).

Doch was ist KI und wie funktioniert sie? Grundsätzlich versteht man unter Künstlicher Intelligenz eine Software, die bestimmte Aufgaben ausführt, die in der Regel menschliche Intelligenz erfordern würden.

SRF Kids Videoerklärung: Was ist Künstliche Intelligenz?

Prompting: Interaktion zwischen Mensch und Maschine

Laut der Arbeitsgruppe KI des Kantons Bern stammt das Wort «prompten» aus dem Englischen und bedeutet so viel wie «Aufforderung». Genauer gesagt ist es eine gezielte Anweisung an eine KI, damit diese eine bestimmte Aufgabe erledigt. Ein Prompt wird grundsätzlich in das Eingabefeld eines bestimmten Tools (zum Beispiel Gemini, ChatGPT, Mistral usw.) eingegeben.

Der folgende Button öffnet Ihnen ein Dokument vom Kanton Bern mit Tipps zum Prompting im Umgang mit generativer KI.

Was ist Prompt Engineering?

Prompt Engineering beschreibt die Kunst, KI klare und gut formulierte Anweisungen zu geben, damit sie passende und hochwertige Antworten liefert. Generative KI-Modelle wie ChatGPT, DALL·E oder Gemini reagieren stark auf die Formulierung der Eingabe. Kurz gesagt führen gute Prompts zu besseren Ergebnissen.

Warum ist Prompt Engineering wichtig?

Ein sorgfältig gestalteter Prompt hilft der KI, die Absicht hinter einer Anfrage besser zu verstehen und genauere, relevantere und kreativere Antworten zu erzeugen. So wird Zeit bei der Nachbearbeitung gespart und die Ergebnisse liegen näher an der gewünschten Lösung.

Wie funktioniert Prompt Engineering?

Generative KI-Systeme arbeiten mit grossen Sprachmodellen (engl. Large Language Models oder LLMs), die Sprache verstehen und Muster in riesigen Datenmengen erkennen. Dabei nutzen Prompt Engineers verschiedene Techniken:

– Zero-Shot-Prompting: Die KI bekommt eine neue Aufgabe ohne Beispiele.
– Few-Shot-Prompting: Die KI erhält einige Beispielantworten zur Orientierung.
– Chain-of-Thought-Prompting: Eine komplexe Aufgabe wird in Zwischenschritte zerlegt, damit die KI logischer denkt.

Halluzinierende KI-Systeme

Halluzinationen in KI entstehen, wenn ein Modell Antworten erzeugt, die nicht aus seinen Trainingsdaten ableitbar sind oder falsch aus ihnen rekonstruiert werden. Technisch passiert das, weil grosse Sprachmodelle (engl. Large Language Models) Muster vorhersagen, nicht Wahrheiten. Wenn Datenlücken, verzerrte Trainingsdaten, Überanpassung oder fehlerhafte Wahrscheinlichkeitsabschätzungen auftreten, generiert das Modell plausible klingende, aber falsche Informationen. Zudem kann die hohe Komplexität von Transformern dazu führen, dass das Modell Zusammenhänge «erfindet», um eine statistisch passende Antwort zu liefern (IBM o.J.). Manche KI-Systeme können auch absichtlich in die Irre geführt werden, wenn jemand Eingaben ganz leicht verändert. Durch diese minimalen Manipulationen der Eingabe (feindliche Angriffe, engl. adversarial attacks) können solche Halluzinationen ausgelöst werden (Xu et al., 2020).

Erfahren Sie mehr zum Umgang mit halluzinierenden KI-Systemen in Gesellschaft & Kultur.

BeLEARN, Technologie Ein halluzinierendes KI-System nach Gemini (Modell: Nano Banana)

Vertiefung zur technischen Perspektive

Wenn Sie sich mit Künstlicher Intelligenz vertiefter auseinandersetzen möchten, finden Sie im folgenden Bereich weitere Informationen zu den Themen:

Was bedeutet maschinelles Lernen?

Beim maschinellen Lernen (ML) versuchen Computer, ähnlich wie Menschen aus Erfahrungen zu lernen. Statt dass alles Schritt für Schritt programmiert wird, erkennt die Maschine selbst Muster in Daten und wird dadurch immer besser. Ein ML-System besteht aus drei Teilen:

  1. Entscheidungsprozess: Der Computer bekommt Daten und versucht daraus etwas vorherzusagen (z. B. ein Muster erkennen oder etwas sortieren).
  2. Fehlerfunktion: Danach prüft das System, wie gut diese Vorhersage war. Es vergleicht sie mit bekannten Beispielen und sieht, wo es falsch lag.
  3. Optimierung: Der Computer passt seine «Gewichte» an (also die inneren Einstellungen des Modells) und versucht es erneut. Dieser Kreislauf läuft viele Male, bis die Vorhersagen möglichst genau sind.

So lernt die Maschine Schritt für Schritt aus Daten und wird mit der Zeit zuverlässiger.

HSLU Videoerklärung: ML einfach erklärt

Trainingsprozesse und Methoden des Maschinellen Lernens

Wie lernt eine KI?
Beim Modelltraining lernt eine KI aus vielen Beispielen, wie sie Aufgaben lösen kann. Mit anderen Worten wird die KI also «unterrichtet». Das Ziel besteht darin, aus Beispieldaten zu lernen, um später Aufgaben selbstständig lösen zu können. Hierzu gehören beispielsweise das Erkennen von Bildern, das Verstehen von Texten oder das Treffen von Vorhersagen. Im gesamten Prozess lernt das Modell, seine Leistung an Trainingsdaten zu optimieren, die den echten Anwendungsfällen möglichst ähnlich sind. Je besser diese Daten die Realität abbilden, desto genauer kann das Modell später neue Situationen einschätzen. Während des Trainings werden die Parameter des Modells so angepasst, dass die Abweichung zwischen richtiger und vorhergesagter Antwort immer kleiner wird.

Die sogenannte Verlustfunktion soll dabei minimiert werden, um den Fehler möglichst gering zu halten. Beim verstärkenden Lernen (siehe unten) wird dagegen eine sogenannte Belohnungsfunktion maximiert.

Der Trainingsprozess läuft so lange in Zyklen ab, bis das Modell verlässlich arbeitet:

  1. Daten sammeln und vorbereiten
  2. Modell mit den Daten trainieren
  3. Ergebnisse prüfen (Fehler messen)
  4. Parameter anpassen und wiederholen

Manchmal wird ein Modell nach dem Grundtraining noch feinabgestimmt (engl. fine-tuning), um es an neue Aufgaben anzupassen.

Drei Arten des Lernens

 

Überwachtes Lernen

Die KI bekommt Beispiele mit richtigen Antworten und lernt, diese nachzuahmen.

BeLEARN, Technologie

Unüberwachtes Lernen

Die KI erhält nur Daten und sucht darin selbst nach Strukturen oder Gruppen.

BeLEARN, Technologie

Verstärkendes Lernen

Die KI probiert Handlungen aus und lernt durch Rückmeldungen. Ähnlich wie beim Ausprobieren und Belohnen.

BeLEARN, Technologie

(Bergmann & Stryker für IBM)

(Illustrationen von Seegerer, Michaeli & Jatzlau)

Wie funktioniert ein neuronales Netzwerk?

Neuronale Netzwerke – Aufbau und Funktionsweise als Grundlage der Künstlichen Intelligenz

Ein neuronales Netzwerk ist ein zentrales Konzept der Künstlichen Intelligenz und orientiert sich in vereinfachter Form an der Funktionsweise des menschlichen Gehirns. Es besteht aus vielen künstlichen Neuronen, die miteinander vernetzt sind und Informationen schrittweise weiterverarbeiten. Jedes dieser Neuronen nimmt Eingabewerte entgegen, gewichtet sie unterschiedlich stark und berechnet daraus ein Ergebnis, das an weitere Neuronen weitergegeben wird. Das Lernen erfolgt, indem das Netzwerk mit vielen Beispielen trainiert wird. Es vergleicht seine Ausgaben mit den richtigen Lösungen und passt die Gewichtungen der Verbindungen schrittweise an. Dieser Prozess wird so lange wiederholt, bis das Netzwerk möglichst genaue Ergebnisse liefert. Je mehr Schichten ein neuronales Netzwerk besitzt, desto komplexere Strukturen kann es erfassen. In diesem Fall spricht man von Deep Learning.

BeLEARN, Technologie

Ein neuronales Netzwerk ist in Schichten (Layers) aufgebaut:
Der Aufbau eines neuronalen Netzwerks ist schichtweise organisiert. Die Eingabeschicht (Input Layer) nimmt Rohdaten auf, zum Beispiel Zahlenwerte, Bildpixel oder einzelne Wörter. Die Ausgabeschicht (Output Layer) liefert das Endergebnis, etwa eine Klassifikation, eine Vorhersage oder eine Entscheidung. Dazwischen liegen eine oder mehrere versteckte Schichten (Hidden Layers), in denen das Netzwerk komplexe Muster, Zusammenhänge und Bedeutungen erkennt.

Was ist Deep Learning?

Deep Learning ist eine spezielle Form des Lernens mit neuronalen Netzwerken. Der Begriff «deep» bezieht sich darauf, dass diese Netzwerke aus sehr vielen hintereinander geschalteten Schichten bestehen.

Durch diese Tiefe können Deep-Learning-Modelle besonders komplexe Muster erkennen, zum Beispiel in Bildern, Sprache oder Texten. Sie sind die Grundlage vieler moderner KI-Anwendungen wie Sprachassistenten, Bildgeneratoren oder Übersetzungsdienste. Deep Learning benötigt grosse Datenmengen und hohe Rechenleistung, ist dafür sehr leistungsfähig und liefert sehr gute Ergebnisse