E Frënd geet just duerch d’Beweegungen. E Mann, deen an d’Routine vun der Gewunnecht getraff ass. E jetlagged Reesender Message vun Erschöpfung-fraught Verlaangen. En ënnerdréckte Kuss, ongewollt oder schlecht Zäit. Dëst waren e puer vun den Interpretatiounen, déi a mengem Gehir widderholl hunn nodeems ech a gekuckt hunn Komesch digital Konscht Trifle vum Emoji Mashup Bot, e populären awer defunkten Twitter Kont deen d’Deeler vun zwee Emoji an nei, iwwerraschend an erstaunlech resonant Kompositioune kombinéiert hunn. De Bot hat d’Hand an d’Aen aus dem ? Gässende Emoji geholl an se mam Mond vum ? Kuss-Häerz Emoji zesummegebrach. Dat ass et.
Vergläicht déi einfach Method mat vermeintlech méi sophistikéierte Maschinnléiere-baséiert generativ Tools, déi am leschte Joer oder sou populär ginn. Wann ech Midjourney gefrot hunn, en AI-baséiert Konschtgenerator, en neien Emoji ze kreéieren baséiert op deene selwechten zwee, huet et Kompositioune produzéiert déi sécherlech Emojiform waren awer näischt vum Stil oder Bedeitung vum einfache Mashup besëtzt: eng Serie vu giel, Häerz- geformte Kierper mat Zong erausstécht. Ee schéngt eng aner Zong ze iessen. Alles huet mech opgefall wéi d’Aarte vu Monstrositéiten déi als Präisser fir Karnevalsspiller ugebuede kënne ginn, oder als Stickere geliwwert mat Kannerkriibs-Spendenaktiounen Junkmail.
ChatGPT, der léif Text-Generatioun Bot, huet et net vill besser. Ech hunn et gefrot fir Beschreiwunge vun neien Emoji ze generéieren op Basis vun Deeler vun existéierenden. Seng Iddie ware gutt, awer alldeeglech: e “gäischen Sonn” Emoji, mat engem giele Gesiicht an engem oppene Mond, fir e schlofen oder faulen Dag ze representéieren; e “Multi-tasking” Emoji, mat Aen déi a verschiddene Richtungen kucken, fir den Akt ze representéieren fir verschidde Aufgaben gläichzäiteg ze jongléieren. Ech hunn dës Beschreiwunge zréck an d’Midjourney gefiddert a krut kompetent awer faarweg Resultater: e Set vu jäizende Sonnen, eng Serie vun Aen op engem giel Gesiicht, deen vun uewen mat engem schwaarzen, tar-ähnlechen Oze drippt.
Vläicht hätt ech besser Ufroen ausgeschafft oder méi Zäit verbruecht fir meng Resultater am ChatGPT a Midjourney ze verfeineren. Awer dës zwee Programmer sinn den Héichpunkt vun der AI-driven generativ-Kreativitéitsfuerschung, a wann et drëm koum fir expressiv, nei Emoji ze maachen, goufen se vun engem dout-einfache Computerprogramm bestätegt, deen Gesiichtsdeeler aus engem Hutt auswielt a se zesumme collagéiert.
D’Leit hunn Dreem fir AI Kreativitéit. Si dreemen vun Computeren déi dreemen, fir Ufänger: datt eemol Terabytes vun Text- a Bilddaten gefiddert hunn, Software kann eppes wéi eng Maschinn Fantasie ofsetzen fir Auteur funktionnéiert anstatt se nëmmen auszeginn. Awer deen Dram enthält e Conceit: datt AI Generatoren wéi ChatGPT, DALL-E a Midjourney erreechen kënnen iergendeen Aart vu Kreativitéit mat gläicher Liichtegkeet a Leeschtung. Hir Creatoren an Affekote werfen se als kapabel all Form vu mënschlecher Intelligenz unzegoen – wéi alles Generatoren.
An net ouni Grond: dës Tools kënnen eng Versioun vu bal alles generéieren. Vill vun dëse Versioune si falsch, irféierend oder souguer potenziell geféierlech. Vill sinn och oninteressant, wéi d’Emoji Beispiller weisen. E Software-Tool ze benotzen dat eng bestëmmte Saach ka maachen ass zimmlech anescht – a vill méi erfreelech – wéi een ze benotzen deen alles ka maachen, stellt sech eraus.
D’Kate Compton, e Professer fir Informatik op der Northwestern University, déi generativ Konscht Software fir méi wéi engem Joerzéngt mécht, denkt net datt hir Tools kënschtlech intelligent sinn – oder iwwerhaapt intelligent. “Wann ech en Tool maachen,” sot de Compton mir, “Ech hunn eng kleng Kreatur gemaach, déi eppes ka maachen.” Datt eppes normalerweis méi expressiv ass wéi et nëtzlech ass: Hir Bots stellen sech déi bannenzeg Gedanken vun engem verluer autonom Tesla an molen Biller vun hypothetesch alien Raumschëff. Ähnlech Gizmos Offer Hipster Cocktail Rezepter oder nennen gefälschte britesch Stied. Wat och ëmmer hiert Zil ass, Compton beméit sech net fir Software Generatoren wéi dës fir hiren Domain ze beherrschen. Amplaz hofft si datt si “déi kleng, e bëssen domm Versioun dovunner ubidden.”
Dat ass wäit ewech vum ChatGPT Creator OpenAI seng Ambitioun: kënschtlech allgemeng Intelligenz ze bauen, “héich autonom Systemer, déi d’Mënschen op déi meescht wirtschaftlech wäertvoll Aarbecht iwwertreffen.” Microsoft, déi scho 1 Milliard Dollar an OpenAI investéiert huet, ass gemellt a Gespréicher fir weider 10 Milliarden Dollar an d’Firma ze dumpen. Dës Zort vu Suen gëtt ugeholl datt d’Technologie e massive Gewënn Zukunft ka maachen. Wat nëmmen dem Compton seng Fuerderung méi schockéiert mécht. Wat wann all déi Suen eng schlecht Iddi verfollegen?
Ee vun den erfollegräichsten Tools vum Compton ass e Generator mam Numm Tracery, deen Templates a Lëschte mat Inhalt benotzt fir Text ze generéieren. Am Géigesaz zu ChatGPT a senge Koseng, déi op massiven Datesets trainéiert ginn, erfuerdert Tracery d’Benotzer eng explizit Struktur ze kreéieren, eng “kontextfräi Grammatik” genannt, als Modell fir seng Ausgab. De Tool gouf benotzt fir Twitter Bots vu verschiddene Formen ze maachen, dorënner thinkpiece-Headline Pechpabeier an abstrakte Landschaften.
Eng kontextfräi Grammatik funktionnéiert e bësse wéi e nestéierte Mad Lib. Dir schreift e Set vu Templates (sot, “Sorry, ech hunn et net op d’ [event]. Ech hat [problem].”) an Inhalt fir dës Schablounen ze fëllen (Problemer kéinten “en Hangnail”, “e Caprice”, “explosive Diarrho”, “a” sinn [conflict] mat mengem [relative]”), an d’Grammatik setzt se zesummen. Dat erfuerdert den Autor vun der generativer Konscht fir d’Struktur vun der Saach ze berücksichtegen, déi se wëllen generéieren, anstatt d’Software no engem Ausgang ze froen, wéi se mat ChatGPT oder Midjourney maache kënnen. De Schëpfer vum Emoji Mashup Bot, en Entwéckler mam Numm Louan Bengmah, hätt all Quell-Emoji an eng Rei vun Deeler missen opdeelen ier e Programm geschriwwen huet, deen se erëm an nei Konfiguratiounen zesummesetzen. Dat erfuerdert vill méi Effort, fir net ze schwätzen iwwer technesch Kompetenzen.
Fir Compton ass dësen Effort net eppes fir ze entzéien – et ass de Punkt vun der Übung. “Wann ech just eppes maache wollt, kéint ech eppes maachen,” sot si mir. “Wann ech eppes maache wollt, kéint ech eppes maachen.” Am Géigesaz zu der Missioun vum OpenAI, gesäit de Compton den Zweck vun generativ Software anescht: D’Praxis vu Software-Tool-Making ass ähnlech wéi eng Software Kreatur gebuer (“eng Chibi Versioun vum System,” wéi se et mir gesot huet) déi eppes ka maachen – meeschtens schlecht oder komesch oder op jidde Fall karikaturéiert Versiounen dovun – a fir Zäit mat deem Kreatur ze verbréngen, wéi ee mat engem Spillsaachen, engem klenge Kand oder engem gudden Auslänner kéint. D’Zil ass net déi bescht oder genaust Ähnlechkeet vun engem Hipster Cocktailmenü oder engem Dagesausbléck ze produzéieren, mee eppes méi wouer wéi d’Realitéit ze erfassen. Dem ChatGPT seng Iddien fir nei Emoji si liewensfäeg, awer d’Offer vum Emoji Mashup Bot fille sech passend; Dir kënnt se benotzen anstatt just iwwer d’Tatsaach ze posten datt e Computer se generéiert huet.
“Dëst ass vläicht wat mir an de Generatoren alles verluer hunn,” sot Compton: e Verständnis vun deem wat d’Maschinn probéiert an der éischter Plaz ze kreéieren. De System kucken, d’Méiglechkeeten dobannen gesinn, seng Mustere identifizéieren, dës Mustere a Software oder Daten kodéieren, an dann kucken wéi d’Saach ëmmer erëm funktionnéiert. Wann Dir eppes an ChatGPT oder DALL-E 2 tippt, ass et wéi wann Dir eng Mënz an e Wonschbrunn geheien an den Eemer zréck zéien fir e Koup Kelp oder e Welpen op senger Plaz ze fannen. Mee Compton Generatoren si méi wéi eng Mënz an engem gachapon Maschinn, wëssen am Viraus de Genre vun Objet d’Saach wäert dispense. Dësen Effort proposéiert eng Praxis, wou en Auteur hofft d’Benotzer ze hëllefen, de Rapport mat hirer Software ze sichen anstatt e Resultat dovun ofzezéien. (Et erkläert och firwat Twitter als esou e fruchtbare Host fir dës Bots entstanen ass – d’Plattform encouragéiert natiirlech Karikatur, Kuerzegkeet a Widderhuelung.)
Vill gëtt gewonnen andeems se gewise ginn wéi e Software Generator funktionnéiert, a wéi säi Schëpfer d’Muster verstanen huet déi säin Thema definéieren. Den Emoji Mashup Bot mécht dat andeems Dir déi zwee Emoji weist, aus deenen et eng bestëmmte Kompositioun konstruéiert huet. Ee vun den éischten Textgeneratoren, déi ech mech erënnere wéi ech benotzt hunn, war e komeschen Softwarespiller genannt Kant Generator Pro, fir Macs an den 1990er gemaach. Et huet kontextfräi Grammatik benotzt fir turgiden Text ze komponéieren, deen un den däitschen Opklärungsphilosoph Immanuel Kant erënnert, obwuel et och Modeller fir manner esoteresch Kompositioune enthalen huet, wéi zum Beispill Merci. De Programm ass mat engem Editor komm, deen de Benotzer erlaabt Grammatik ze gesinn oder ze komponéieren, e Wee bitt fir ënner der Hood ze kucken an d’Wourecht vun der Software ze verstoen.
Awer sou Transparenz ass schwéier oder onméiglech a Maschinnléieresystemer wéi ChatGPT. Keen weess wierklech wéi oder firwat dës AIs hir Resultater produzéieren – an d’Ausgänge kënne vu Moment zu Moment op onerklärbare Weeër änneren. Wann ech ChatGPT fir Emoji Konzepter froen, hunn ech kee Sënn vu senger Theorie vun Emoji – wéi eng Mustere oder Modeller et als wichteg oder relevant interpretéiert. Ech kann ChatGPT ënnersichen fir seng Aarbecht z’erklären, awer d’Resultat ass ni erklärend – éischter, et ass just méi generéierten Text: “Fir d’Iddien fir Emojis ze generéieren, hunn ech mäi Wëssen iwwer allgemeng Konzepter an Themen benotzt, déi dacks an Emojis vertruede sinn, och wéi mäi Verständnis vu mënschlechen Emotiounen, Aktivitéiten an Interessen.
Vläicht, wéi kreativ Zesummenaarbecht mat Software Generatoren méi verbreet ginn, ginn d’Alles Generatoren als Middleware ëmgestalt, déi vu spezielle Software mat méi spezifeschen Ziler benotzt gëtt. Dem Compton seng Aarbecht ass charmant awer strieft net wierklech op Utility, an et gëtt sécherlech vill Méiglechkeete fir generativ AI fir Leit ze hëllefen nëtzlech, och schéi Saachen ze maachen. Trotzdem, fir dës Zukunft ze erreechen, wäert vill méi Aarbecht erfuerderen wéi just mat engem Computerprogramm ze chatten, deen op den éischte Bléck schéngt eppes iwwer alles ze wëssen. Wann deen éischte Roude verschwannen, gëtt et kloer datt ChatGPT net wierklech weess näischt– amplaz gëtt et Kompositioune eraus déi Wëssen duerch iwwerzeegend Struktur simuléieren. A wéi d’Neiheet vun där Iwwerraschung ofleeft, gëtt et kloer datt ChatGPT manner eng magesch Wonsch-Zentralmaschinn ass wéi en interpretative Sparringpartner, en Tool dat méi interessant ass wann et schlecht ass wéi gutt op senger Aarbecht.
Kee wëll wierklech en Tool dat alles ka maachen, well esou e Besoin eng theoretesch Wahn ass, eng kapitalistesch Fantasie oder béid. D’Hoffnung oder d’Angscht datt ChatGPT oder Midjourney oder all aner AI-Tool Expertise, Handwierk an Aarbecht kéint behalen, verréit eng offensichtlech Wourecht: Dës nei Gizmos enthalen ganz nei Regime vun Expertise, Handwierk an Aarbecht. Mir hu mat Tech Demos gespillt, net fäerdeg Produkter. Eventuell ginn d’Rohmaterialien vun dësen AI Tools benotzt a Saachen déi d’Leit, leider, Sue bezuelen. E puer vun där neier Aarbecht wäert domm an beleidegend sinn, well Organisatiounen fuerderen Wäertgeneratioun ronderëm d’AI-Systemer an deenen se investéiert hunn (Microsoft gëtt gemellt ChatGPT op Office ze addéieren). Anerer kéinten erfreelech an och offenbarend beweisen – wa se Creatoren an Zuschauer iwwerzeege kënnen datt d’Software eppes spezifesch mécht a mat Absicht schwätzt, hinnen d’Méiglechkeet ze bidden fir en Dialog domat anzegoen.
Fir de Moment ass deen Dialog méi simuléiert wéi real. Jo, sécher, Dir kënnt mat ChatGPT “chatten”, an Dir kënnt op Biller mat Midjourney iteréieren. Awer en eidel Gefill entsteet vu ville vun dëse Begeeschterungen, well d’Software duerch d’Beweegunge geet. Et schéngt ze lauschteren an ze reagéieren, awer et veraarbecht just Inputen an Ausgänge. AI Kreativitéit muss den domm, hubristeschen Dram vu kënschtlecher allgemenger Intelligenz zugonschte vu konkrete Spezifizitéiten opginn. Eng onendlech intelligent Maschinn déi alles nëtzlos maache kann.
.