künstliche intelligenz zeichnen

Geht das? Künstliche Intelligenz Zeichnen per KI-Bildgenerator vs. Graphic Recording

Lesezeit: 9 min

Wie visualisiert künstliche Intelligenz? Zeichnen per KI-Bildgenerator vs. Graphic Recording

Kann künstliche Intelligenz zeichnen bzw. visualisieren? Und was hat das mit der Visualisierungs-Praxis von Profis zu tun, die für Kunden maßgeschneiderte Lösungen schaffen? Ich habe verschiedene AI-Tools wie MidJourney ausprobiert, um herauszufinden, ob diese mir (und unserem großen Team) den Job als Visualisierungsexperte streitig machen würden oder nicht. Nun, die Ergebnisse waren beruhigend.

Lies weiter für mehr Informationen – und für ein Fazit am Schluss.

Künstliche Intelligenz erschafft Bilder – Grundlagen

Visualisierungsexperten haben schon immer neue Technologien integriert. Es wurden Grafiktablets und iPad-Apps in Profinutzung gebracht und bereits lange vor den Regierungs-Lockdowns wurde online gearbeitet. Und nun kommt eine ganz neue Art und Weise hinzu: künstliche Intelligenz Zeichnen. Wie funktioniert das?

Stell Dir vor, Du sagst einem Software-Tool, was Du möchtest: „Ein Sketch von einem Meeting, wo vier Personen um ein Flipchart stehen, diskutieren und ein Chart betrachten.” So sieht das dann aus, eine Minute später:

künstliche intelligenz zeichnen

Dieses Software-Tool mit KI – bekannte Namen dafür sind DALL-E, DALL-E Mini, Imagen, MidJourney etc. – kann Dir aber auch ein Bild liefern wie: „Ein Hund, der am Steuer eines fliegenden Auto sitzt – photorealistisch.” Ja, das geht, Kombinationen jeglicher Art sind abbildbar – ebenfalls in einer Minute.

künstliche intelligenz zeichnen

Erfindungen rund um Bilderstellung wurden in der menschlichen Geschichte viele gemacht (von Stiften über iPads über Fotografie und vieles mehr. Einige haben sich als extrem umwälzend herausgestellt. Handelt es sich bei KI-Bildern auch um so etwas, und was bedeutet das für unsere Jobs?

Denk an den Impact

Diese Frage hat Menschen immer wieder bewegt. In den derzeitigen Zeiten der „Vierten Industriellen Revolution“ ist dies umso mehr der Fall: Unser Denken und unsere Annahmen darüber, was eine bestimmte berufliche Tätigkeit sein sollte, wird forciert verändert. Denkst Du nun an Deinen Job, so könnte das Angst machen – denn es ist nur eine Frage der Zeit, bis eine neue Technologie diesen Job in Frage stellt, „amazonisiert” oder sogar ganz überflüssig macht. Fokussierst Du jedoch mehr auf Impact und Wirkung, so bieten Dir neue Technologien immer wieder neue Möglichkeiten, in der Welt auf neue und bessere Weise genau Dein eigenes Ding zu machen.

Kann künstliche Intelligenz zeichnen oder visualisieren?

Das Auftauchen von KI-gestützten Bildgeneratoren macht viele Menschen in den Bereichen Visualisierung, Illustration, Kunst, Design und Fotografie ganz schön nervös. Grafiken aus diesen Diensten sind ziemlich beeindruckend. Hier ist, was ich aus MidJourney erhalten habe, als ich „Erreichen einer schönen und reichen Vision” eingegeben habe:

künstliche intelligenz zeichnen vs Graphic Recording

Es ist ein Algorithmus zur Bilderzeugung, der hier arbeitet. Dieser wird von echten Menschen programmiert und hat eingelernte Informationen und Verknüpfungen von Assoziationen aus Datenbanken (menschengemachter) Bilder zur Verfügung. Dieses „Wissen“ fließt dann ein in ein neues Bild. Was die KI als „ausspuckt” hat also immer etliche Entscheidungen über Layout, Inhalt, Farbgebung etc. aus den gelernten Strukturen als Grundlage.

Es gilt also: Wenig Input = austauschbarer und fader Output. Doch je präziser und umfassender die Aufforderungen (d.h. die Anweisungen an den Algorithmus) sind, desto umfassender, genauer oder detailreicher das Ergebnis. Ganz wie unter Menschen: Spreche ich mehr mit meinem Illustrator, bekomme ich mehr (qualitativ) und/oder bessere (qualitativ) Ergebnisse.

Was bedeutet das also? Ein paar Dinge fallen auf:

Die Bilder sind zwar neu, aber nicht originell. Jedes KI-Bild ist ein Re-Sampling von bestimmten Mustern von „Noise”, die bereits existieren. Kann originelle Kunst aus vorhandener Kunst entstehen? Ja, absolut. DJs im Genre der elektronischen Musik sampeln und mixen bestehende Stücke auch neu zusammen. Das ergibt Musik, die wir noch nie gehört haben.

KI-generierte Bilder stellen nicht absichtlich bestehende Muster und Kompositionen in Frage oder interpretieren Bestehendes neu. Die Software liefert eine Reihe von automatisch erstellten Vorschlägen – und wir wählen aus, was heraussticht und was nicht. Das wahrgenommene Neue, Originelle oder Ästhetische, das wir einem dieser Bilder zuschreiben, kommt von uns – nicht von der künstlichen Intelligenz.

Die Magie liegt in unserer Interpretation, nicht in ihrer Entstehung. Als einst der Fotoaparat aufkam, löste das wilde Diskussionen über Kunst und damalige Bewegungen wie Impressionismus, Expressionismus, Surrealismus und Kubismus aus. Menschen reagierten also auf diese dereinst neue Technologie auch dadurch, dass sie damalige Standards, Vorlieben und Sichtweisen in Frage stellten. Es entstanden neue Möglichkeiten, sich visuell auszudrücken.

Wo liegen die Grenzen von Zeichnen via künstliche Intelligenz?

Dazu gleich ein Beispiel: Hier findest Du ein Bild, welches in einem Captcha eingesetzt wird.

künstliche intelligenz zeichnen

Die Aufforderung lautet: Klicke alle Bildelemente an, die ein Fahrrad enthalten. Nun, ein Zweirad ist zu sehen – doch ist es ein echtes? Es gibt zwei richtige Antworten – wobei das Captcha natürlich nur eine als korrekt gelten lassen wird. Und der davor sitzende Mensch weiss nicht, welche einprogrammiert wurde.

Doch was bedeutet das für das Arbeitsfeld von Visualisierung und Visual Facilitation? Was kennzeichnet diese Tätigkeit?

  • Sie entstand um 1980 aus dem Kontext Facilitation, Prozessbegleitung und Organisationsentwicklung.
  • Sie ist prozessorientiert und nur sekundär bildorientiert.
  • Sie kombiniert viele Perspektiven in ein Big Picture. Sie schaffte ein „Meta-Wissen“.
  • Sie wird vornehmlich nicht bei einfachen Sachverhalten eingesetzt sondern spielt am besten auf dem Spielfeld, je komplexer Themen und Problemlösungen sind.

Wir sind Meister der Synthese und Vernetzung

Wenn Du einen Visualiserer, Graphic Recorder oder Visual Facilitator für Dein Meeting oder Deine Strategie buchst, macht dieser folgendes:

  1. Sinn schaffen: Wir orientieren uns am größeren Sinn und Zwecke (Purpose) eines Meetings, Events oder Projekts. Von der inneren Haltung her schaffen wir Wert dafür und arbeiten diesen Zielen zu. Es geht also primär nicht ums Bild.
  2. Zuhören, Aufnehmen und Verstehen: Wir überprüfen, ob wir die Inhalte und Konzepte, um die es geht, „verstehen“.
  3. Synthetisieren: Dann treffen unsere klugen Köpfe eine Vielzahl von Entscheidungen darüber, was das Aufgenommene bedeutet, was wir einbeziehen und was nicht, was wir betonen und wie wir die Zielgruppe ansprechen. Auch Mustererkennung, ob eine Metapher verwendet wird und vieles mehr.
  4. Übersetzen: Folglich beginnen wir, diese Synthese zu visualisieren und zu einer Kommunikation werden zu lassen. Dabei nutzen wir einen inneren Schatz an kultureller Symbol- und Bildsprache, Erfahrung, Intuition, Vertrauen und natürlich der Skills, etwas auf Papier oder in Pixeln darzustellen.
  5. Vernetzen: Währenddessen lassen wir ein inneres Bild darüber entstehen, wie alles miteinander verbunden ist. Wir haben ein ausgeprägtes Bewusstsein sowohl für kleine Details als auch die höchsten Flughöhen an Meta-Ebenen.

Ich glaube, dass künstliche Intelligenz Zeichnen und Bildgeneratoren eine erstaunliche Leistung beim Übersetzen (3.) erbringen, aber sie können weder Sinn schaffen (1.), Verstehen (2.) noch Synthetisieren oder Vernetzen (3. und 4.). Die Software sucht nach „Standardobjekten“ die zu den eingegebenen Worten/Befehlen passen, oder findet abstrakte Symbole, die ein Konzept darstellen.

künstliche intelligenz zeichnen

Komplexe Ziel- oder Strategiebilder, Strategielandkarten, Leitbilder usw. bestehen dagegen aus einer Fülle von den Szenen und Einzelbildern. Welche dann bewusst erstellt in einer bestimmten sinngebenden Art und Weise angeordnet sind. Und die dazu noch vernetzt und oft durch Pfeile und Prozesse verbunden sind (Stichwort „Wimmelbilder“).
Die Szenen und Einzelbilder könnte eine KI durchaus anfertigen. Doch die Synthese und Vernetzung kann die künstliche Intelligenz Zeichnen-Erstellung nicht leisten. Die Synthese und Vernetzung basiert vom Know-how her auf Facilitation, Prozessbegleitung und Erfahrung rund um Veränderungsgestaltung. Sie wird oft dialogorientiert und mit partizipativen, cokreativen Methoden eingesetzt. Sie kann sogar mit Intuition, Energie und Bauchgefühl zu tun haben. Vor allem jedoch mit einer Unmenge an Erfahrung.

In dem Sinne also erstmal Entwarnung für die als Visualiserer, Graphic Recorder oder Visual Facilitator Tätigen. Und unsere Kunden gewinnen Verständnis dafür, welchen Wert unser Beitrag derzeit hat. Vor allem beispielsweise bei der Lösung komplexester Probleme, bei Large Scale Change und bei den herausfordernden Projekten, von denen die Welt gerade eine Fülle hat. Visualiserer und Visual Facilitator leisten derzeit einen wichtigen Beitrag in Krisenbewältigung, Visionsgestaltung und Neuerfindung einer besseren Welt und Wirtschaft. Als eine Art Metadisziplin.

Stichwort Metadisziplin

Das Erschaffen eines wirklichen Big Pictures, um schwierige Probleme, Themen und Kontexte abzubilden, ist also sozusagen eine integrative Metatheorie. Damit können wir vielversprechende Ziele für globalen Wandel unterstützen und Transformationspunkte (evolutionäre Akupunkturpunkte) angehen.
Wir Visual Facilitator als Profession lassen dafür umfassende „Landkarten der Realität“ entstehen. Dies basiert auf unserer Überzeugung, dass die tatsächliche Komplexität von Wirtschaft und Gesellschaft die Komplexität der Weltanschauungen, die versuchen, sie zu bewältigen, überholt hat. Was natürlich derzeit auch gilt angesichts einer globalen, sich gegenseitig durchdringenden „Metakrise“.
Wir Visual Facilitator stehen dafür, dass wir enge ideologische Vorurteile, persönliche Silos und unsere institutionellen Agendas überwinden sollten, so dass die überwältigende reale Komplexität und die unzureichende Sensibilisierung als Menschheit angehen können. Darum geht es für unsere Kunden und noch größere ganzheitliche Zusammenhänge – und kein per künstliche Intelligenz Zeichnen kann den Facilitator dabei ersetzen.

Doch zurück zu zukünftigen Entwicklungen …

Was wird die Zukunft rund um Zeichnen durch künstliche Intelligenz bringen?

Alleine der Blick auf das Geld, welches derzeit in diese Technologie hinein fliesst, reicht schon aus um die Entwicklung zu erahnen. Anfang Januar 2023 hat gerade alleine nur Microsoft 10 Mrd. Dollar in OpenAI investiert, das hinter DALL-E steht.

Wie wird das exponentielle Lernen und Wachsen dieser Technologie Branchen und Standards verändern? Eine Auswahl möglicher Entwicklungen:

  • Wahrnehmung: Es wird (hoffentlich) unsere Sinne schärfen, unsere Bewusstheit anheben und unseren Realitätssinn verfeinern.
  • Kunst: Es bringt uns dazu, zu hinterfragen, was wir als Kunst betrachten. Und dies zu erweitern.
  • Recht: Wir werden Originalität, Rechteinhaberschaft und Eigentum neu bewerten.
  • Apps: AI-Bildgeratoren werden mehr und mehr in Apps und Software inkludiert sein, ohne dass wir es merken (z.B. derzeit schon in Microsoft Designer oder diversen Smartphone-Apps).
  • Illustration: Stell Dir vor, Du hast ein Buch geschrieben. Es fehlt noch ein Coverdesign. An wen wendest Du Dich? Entweder an einen Profi (Illustrator) oder einen KI-Grafikgenerator. Bei beiden durchläufst Du (einmal ganz pauschal gesagt) ziemlich die gleichen Schritte: Du gibst Hinweise auf die Erwartung, die Stimmung, nennst Stichworte und Beispiele und Farben, wie du Dir Dein Cover vorstellst. Egal ob Mensch oder KI-Generator, sie hören zu und liefern auf Basis des Inputs.
  • Bezahlung: Wenn Künstler die hier in diesem Artikel gezeigten Beispielbilder geschaffen hätten, würden sie dafür honoriert werden. Bei großen Kinofilmen arbeiten oft Hunderte von Künstlern verschiedener Disziplinen zusammen. Alle tragen zu einem einzigen Kunstwerk bei, und sie werden dafür entlohnt. Wie ist das mit per KI-Software kreierten Werken, wer sollte dann entschädigt werden? Es ist klar, dass die Unternehmen, die generative KI-Software und Rechenleistung bereitstellen, eine beträchtliche Entschädigung verdienen. So habe ich eine Abonnementgebühr bezahlt, um meine MindJourney-Tests durchzuführen.

Und? – Visualisierung, Graphic Recording mit künstlicher Intelligenz?

Von den Dächern zu schreien, dass die KI den Menschen in der Visualisierung ersetzt, wäre zu kurz gedacht. Es gibt Platz für alle, auch für KI. Jedoch ist zu beobachten: Per KI gezeichnete Bilder verwischen die Grenzen. Und auch wenn ihre offensichtliche Neuartigkeit für einige Illustratoren unangenehm sein mag, macht sie das nicht weniger kreativ, wenn es um maßgeschneiderte Bilder geht.

Und das auch deshalb, weil das menschliche Gehirn so wunderbar ist, dass keine KI mitkommt. Drei Fakten dazu:

  1. Stelle Dir Umfang und Komplexität des kompletten Telefonsystems der Erde vor: Jeder einzelne Gehirnzelle bietet dieselbe Komplexität und Kapazität. Und wir haben 100 Milliarden solcher Zellen!
  2. Zweitens hat unser Gehirn einen bewussten Teil und einen unterbewussten Teil. Ersterer, also der der hier liest, denkt und plant, ist unglaublich limitiert. Er macht 2-4% der Hirnmasse aus, schläft ab und zu, setzt auch mal aus, und bewegt sich die ganze Zeit in Vergangenheit oder Zukunft. Der nicht bewusste Teil vergisst nichts, schläft nie, ist stets im Hier und Jetzt und macht die restlichen 98% der Hirnmasse aus. Von der Leistungsfähigkeit läge „bewusst“ bei der eines 90iger-Jahre Internet-Modems verglichen mit „unterbewusst“ bei der eines heutigen Transatlantik-Internetkabels.
  3. Drittens ist das, was wir Bewusstsein nennen, ist nicht auf das Gehirn beschränkt. Es ist also nicht das Gehirn, welches unser Bewusstsein produziert oder „sendet” – im Sinne von wenn man es abschaltet, wäre es weg. Das Gehirn gleicht eher einem Radioempfänger, der omnipräsentes Bewusstsein zeigen, verstärken, lenken und einsetzen kann. Je nachdem was wir mit freiem Willen daraus machen.

Wir sehen: von der Hirn- als auch Bewusstseinsforschung betrachtet besteht gar keine Gefahr, dass KI uns Menschen überflüssig machen wird. Auch wenn uns Medien, AI-Influencer, und globale NGOs etwas anderes weis machen wollen. Und Bewusstsein ist absolut grenzenlos, während jede KI auf das beschränkt ist, was ihr einprogrammiert wurde und was ihre Algorithmen zu leisten in der Lage sind. Und dabei die Färbung derjenigen trägt, die dies getan haben (Stichwort „AI Bias“).

Viel unserer Visual Facilitation Arbeit dreht sich um Werte, Vision und Unternehmenskultur. Dem gegenüber ist KI im Moment eher eine Art nützliches Spielzeug. Du kannst damit sprechen, als ob Du eine Kollegin an der Kaffeemaschine getroffen hättest – wenn Du sie fragst, wie es den Kindern geht, wird sie Dir sagen, dass sie eine Maschine ist und sich nicht fortpflanzen kann. Neu ist, wie überzeugend menschlich die Ergebnisse sind, zumindest oberflächlich betrachtet. Wenn man jedoch etwas tiefer einsteigt, leiden selbst die flüssigsten Antworten manchmal unter Logikfehlern oder enthalten komplette Erfindungen. Das liegt daran, dass KI nicht „denkt“, sondern stattdessen Vorhersagen trifft: Das Programm wurde anhand von Internettexten und -bildern trainiert, aus denen es Muster erkannte; später wurde es von Menschen „feinabgestimmt“, indem die Qualität der Antworten auf bestimmte Aufforderungen bewertet wurde.

Sich bei der Beantwortung von Fragen auf Roboter zu verlassen, selbst wenn sie gute Absichten haben, kann gefährlich sein. Auch wenn sie immer fortschrittlicher werden, werden sie immer noch Fehler machen – etwas, von dem die Menschen laut Psychologen annehmen, dass sie es nicht tun. Hinzu kommt, dass diese Modelle alle Vorurteile wiederholen können, die in den Daten, die sie aufgenommen haben, enthalten sind. Und schlimmer noch: Wenn wir von KI generierten Text oder Bilder weitergeben, verstärken wir diese Vorurteile.

Die Einmischung in Rohdaten, um eine beispielsweise Werte, Vision oder Kulturthemen in die Algorithmen zu packen, wirft eigene Fragen auf. Wer ist dafür verantwortlich, der KI Werte einzuimpfen? Wessen Werte sollten das überhaupt sein? Und wie können wir jemals wirklich wissen, was sich hinter dem „Gehirn“ eines Bots verbirgt, auf den wir uns bei der Gestaltung unseres täglichen Lebens verlassen? Deshalb ist es sinnvoll, sowohl von den Unternehmen, die sie herstellen, als auch von Regulierungsseite Regeln für diese Modelle zu fordern, die von Transparenz über Tests bis hin zu Nutzungsbeschränkungen reichen (vielleicht gibt es Dinge, die Roboter und KI einfach nicht tun sollten – wie das derzeit im Aufbau befindliche globale Sozialkreditsystem).

Neben dem Thema des Artikels – Visualisierung und KI – gibt es also auch größere Fragen, wie KI die Gesellschaft in demselben Ausmaß verändern kann wie andere technologische Revolutionen. Was erhoffen wir uns als Spezies von der künstlichen Intelligenz, und – was vielleicht noch wichtiger ist – was sind wir bereit, aufzugeben?

künstliche intelligenz zeichnen

Fazit

Künstliche Intelligenz Zeichnen kann meisterhaft einzelne Bilder und Szenen zeigen. Wir Visualisierer sind Meister der Synthese und Vernetzung.
Diese Vernetzung, Synthese und Bedeutunggeben, das Sinnschaffen für eine Gruppe und den Purpose sind (derzeit) nicht durch Algorithmen ersetzbar. Bewusstsein darüber und ein klarer Fokus darauf ist für zwei Gruppen wichtig: Erstens die Einkäufer der Leistungen (Kunden), und zweitens die Ausübenden (Visualisierer, Graphic Recorder und Visual Facilitator).

Für beide Gruppen sind drei Dinge wichtig:

  • Lernt das Verstehen und Bilden von Synthesen: Trainiert und verbessert Skills wie Mustererkennung, Zuhören und beobachten, zu hinterfragen, mitzufühlen, kritisch zu denken, (neu) zu formulieren, (neu) zu klassifizieren, (neu) zu gruppieren, (neu) zu formulieren und (neu) zusammenzustellen.
  • Betrachtet Visualisierung als Metadisziplin: Sie erfordert eine Menge an Skills und Erfahrung, lange bevor jemand den Stift hebt um etwas zu Papier oder auf einen Screen zu bringen. Denkt an Kelvy Bird (Generative Scribing), die in ihrem bewusstseins-basierten Systemwandel-Ansatz bei einem dreitägigen Event durchaus einmal die zwei ersten Tage nur Notizen macht, beobachtet, spürt und synthetisiert – bevor sie am dritten Tag an die Bildwand tritt.
  • Fokussiert auf Impact: Arbeitet mit Visualisierern, weniger über das Bild beraten sondern mehr Purpose- und Ziele-orientiert vorgehen. Und als Anbieter von Visualisierung, nutzt und lebt diesen Fokus.

So haben meiner Meinung und Recherche nach wir alle zusammen einen großen Vorteil angesichts der sich verbreitenden KI-gestützten Bilderzeugung.

Lust auf echte handgezeichnete Visualisierung? Starte mit unserem unverbindlichen Erstgespräch:

Geschrieben von:
Weitere Artikel:

Fallstudie anfordern

Fordern Sie diese Fallstudie an: Zielbild „Fabrik der Zukunft”

Hidden
Dieses Feld dient zur Validierung und sollte nicht verändert werden.