A ChatGPT tisztességes UX-ért kiált

A jelenlegi generatív AI eszközök mint a ChatGPT korántsem felhasználóbarátok, nehézkes prompt-driven felületeik miatt. Ez kiváló lehetőséget kínál a UX szakma számára. 

Közel egy éve, 2022. november 30-án launcholta az OpenAI a ChatGPT-t, ami felforgatta a világot. Ahogyan az ilyen trendeknél lenni szokott hatalmas hype alakult ki, ami magával hozta a gyenge minőségű tartalmak és kommentárok sorát is. 

Okkal akartam maradtam ki a sorból hosszú ideig – mert bár gondolataim és kommentjeim is folyamatosan akadtak – számomra is egy év kellett, hogy felvállalható megnyilvánulásaim legyenek a témában. Valamint ugyanannyi időt kívánt meg körülbelül annak a készségnek a kifejlesztése is, ami alapján ki tudom válogatni a sok szemét közül a használható forrásokat a gen AI témában.

A generatív AI a UX design utolsó esélye?

Az egyik következtetésem, hogy a ChatGPT – és általában a generatív AI technológiák, ide tartozik a Bard, és a Bing Chat is – lehetőséget adnak a design szakmának, különösen a UX designnak, hogy újra magára találjon. Az utóbbi pár évben ugyanis olyan a UX designhoz esszenciális skillek és szakmák szorultak érthetetlen módon háttérbe, mint információs architektúra tervezés, usability, nem is beszélve a kutatásról

Történt mindez a UI súlyának felerősödése mellett, amely kiegyensúlyozatlanság nagyon sok szempontból káros, de például pozicionálási szempontból sem túl szerencsés trend egyébként, mert produkciós – ”megvalósító ember” – kategóriában maradhatnak a designerek. Erről persze nem kizárólag a UX design/product design szakma tehet, nagyban az üzleti oldal rossz fókuszai is hozzájárulhatnak a mostani, remélhetőleg átmeneti állapothoz.

Ebben a cikkben a generatív AI témának azzal a szeletével foglalkoznék, ami az egyik legnyilvánvalóbb lehetőséget adja a UX design második eljövetelének, ez pedig a ChatGPT és a hasonló rendszerek kapcsán az ember gép interakció fejlesztésének potenciálja.

Jakob Nielsen sokat írt az AI és a UX kapcsolata témájában, az NN/g pedig sokat kutatott, ezekből indultam ki. 

Prompt alapú interakciók kihívásai 

A technológiai világából jövő megmondó emberek kezdetben úgy nyilatkoztak, hogy a ChatGPT a “lakossági AI”, mert hozzáférhetővé tette a nagy nyelvi modelleket a halandók számára, egy chat alapú interface-el. Egyesek hozzátették, hogy ezzel az összes usability probléma eleve fel sem merülhet, hiszen ez egy csevegés alapú UI, amit mindenki ismer. A felhasználók promptokkal adnak parancsokat, és így elvben sokkal gyorsabban juthatnak el a kívánt eredményig. 

A potenciális probléma ezzel a fajta interakcióval, hogy a felhasználótól jelentős erőfeszítéseket kíván meg, hiszen pontosan kell artikulálniuk a szándékukat írásban.  

Jakob Nielsen úgy érvel, hogy ez egy olyan belépési korlát amivel számolni kell, ugyanis a lakkosság szövegértési szintje a legtöbb országban nem a legjobb. Habár arra nincs külön kutatás, hogy az íráskészség szintje globálisan hogyan alakul, vélhetően hasonlóan, mert legalább annyira összetett kognitív készség mint az olvasás, tehát még az is elképzelhető, hogy az írásban jól kommunikálni tudók aránya még rosszabb. 

Magyarország egyébként ebben a tekintetben nem áll túl jól, az OECD listájában az átlag alatt szerepelünk szövegértésben:

Szövegértésben az OECD átlag alatt vagyunk – Forrás

A promptok megfelelő artikulálása tehát nem készségszintű feladat – például mert az AI toolok válaszaiból nem derül ki miként lehetne jobb/elég jó-e maga a prompt -, ezért is valószínű, hogy egyes cégek elkezdtek keresni úgynevezett prompt engineereket, akik arra szakosodtak, hogy megírják a szükséges szöveget ahhoz, hogy egy mesterséges intelligencia kiköpje a kívánt eredményt.

Ez az igény arra utal, hogy az üzleti oldal sem tudja jelenleg megfelelően artikulálni az inputjait az ilyen toolokkal való interakció során, ezért ennek betöltésére született a prompt engineering terület. 

Igényeket megfogalmazni valóban nem olyan egyszerű. Mindannyian, akik a tágabb értelemben vett design világában dolgoztunk valaha, jól ismerjük a rosszul megfogalmazott igényekből eredeztethető szívást, elég csak visszagondolunk, hány rettenetes briefből próbáltuk kihámozni, hogy mit is akar a kedves ügyfél. 

Jakob Nielesen becslése szerint az olyan országokban, mint az Egyesült Államok, Észak-Európa és Kelet-Ázsia, a lakosság kevesebb, mint 20%-a képes olyan szintű promptok írására, amely halandó szinten képes kiaknázni az AI rendszereket. Összességében tehát szerinte – amit még lehet ugyan kutatni, de hipotézisnek elfogadható – a lakosság fele nem tud eléggé pontosan fogalmazni a ChatGPT használatához. 

Ez a fajta artikulációs akadály egyébként még magasabb a képgenerátorok estében. Az ilyen promptok még összetettebbek, nemcsak a kívánt fotó tárgyának részletes leírását kell pontosan definiálni, hanem az elképzelt vizuális esztétikához kapcsolódó elvont fogalmakat is. A jó promptok megadják a végső cél szempontjából releváns összes képelemet. Előfordulhat, hogy a felhasználók nem is tudják vagy nem képesek felidézni a megfelelő szavakat ezen elemek nagy részére.

A “conversational UI” nehéz műfaj

Ahogy említettem, technológiai szakemberek, de főleg felületes értéssel rendelkező újságírók hangoztatják, hogy a chatbot az egyszerű, párbeszéd alapú UI révén megoldja a legtöbb usability problémát. Beírunk valamit, és a számítógép válaszol: nem tévedtünk el ebben az egyszerű lineáris interakcióban, nem úgy mint egy weboldalon. Sőt a generatív AI megoldások úgynevezett “intent-based outcome specification”-t kínálnak, vagyis a felhasználók egyszerűen elmondják, amit akarnak, és a bot teljesíti.

Az eddig rendelkezésre álló kutatások alapján nem egészen ez a helyzet. Az NN/g user kutatásaiban azt találta, hogy az AI-t használó emberek mindig többlépcsős iterációra kényszerülnek, mivel az AI nem pontosan azt nyújtja, amit a felhasználó akar – csak sejteni képes a szándékot. 

A research során két új felhasználói viselkedési mintát azonosítottak: az Accordion Editing-et és az Apple Picking-et.

  • Accordion Editing akkor történik, amikor a felhasználók arra kérik az AI-t, hogy csökkentse vagy bővítse ki a kimeneteit, gyakran egymás után és ismételten egy egyedi cél elérése érdekében. A hangszer után a „Harmonika szerkesztés” nevet adták, amelyet felváltva tágítva és összehúzva játszanak.
  • Apple Picking pedig történik, amikor a felhasználók egy vagy több korábbi AI válaszra hivatkoznak a következő promptban, hogy eljussanak a kívánt kimenetig. „Apple Picking”-nek nevezték el, mivel sok görgetést és a válaszok válogatását igényeli.

Mindkét viselkedési a pattern az AI interfészek, például a ChatGPT lineáris interakciós formájának jelenlegi korlátainak eredménye, és szinte mindig jelentős iterációt igényel a felhasználótól a kívánt kimenet eléréséhez.

Még rosszabb, hogy a jelenlegi AI chatbotokban megjelenő végtelenig görgethető csevegő ablakban az emberek eltévednek görgetés közben – lásd Apple Picking. 

Ha elfogadjuk ezeket a korai kutatásokat bizonyítékként, akkor úgy tűnik a “conversational user interface” nem igazán egyszerű műfaj. A felhasználóknak igen jelentős többletmunkát kell végezniük, hogy a kimenetet igényeiknek megfelelően módosítsák. 

Hogyan lehet javítani az AI usabilityt?

A UX design elvben éppen ilyen kihívások leküzdésére szolgál. Egy olyan szakaszban vagyunk – ami jellemző az új technológiákra sajnos -, hogy az AI toolokon egyelőre leginkább engineerek dolgoznak, UX munka még nyomokban sem bukkant fel, lehetőség továbblépni innen bőven akad. 

Először is user kutatásokra van szükség különböző szintű szövegértéssel rendelkező felhasználókkal, ChatGPT vagy más AI tool használatát tesztelve. 

Másrészt a kutatások birtokában vélhetően a mostaninál többféle interface kialakításával lehet számolni, amit persze újabb usability teszteléseknek kellene alávetni. Hogy a generatív AI toolok következő generációjának az interface és működése milyen lehetne nyilván senki sem tudja még, de nem kizárt, hogy valamiféle hibrid, amiben egyrészt megjelennek a  – userek által jól megszokott – grafikus felhasználói felületének egyes aspektusai is. 

A GUI használhatóság szempontjából elvileg egy ideálisabb interface, mert megmutatja a felhasználóknak, hogy mit tudnak csinálni, nem pedig megkövetelik tőlük, hogy megfogalmazzák, mit akarnak. Az alábbi koncepció erre hoz egy példát:

A promptok megírása nem egyszerű feladat. Ebben a képgenerátor koncepcióban a jelenlegi promptot használják inputként, ami alapján új variációkra tesz javaslatot az interface. Ez segíthet a felhasználóknak, mert felismerés mindig jobb mint az emlékezés. Ha a lehetséges alternatívákat látják maguk előtt, az segíthet nekik kevesebb erőfeszítéssel javítani a promptjukat.

Segítsünk a felhasználóknak – újra

A jelenlegi generatív AI eszközök a jelek szerint korántsem felhasználóbarátok, nehézkes prompt-driven interface-ik miatt. Ennek ellenére már elég jók ahhoz, hogy az üzleti döntéshozók gondolataiban a produktivitás vagy a termelékenységnövekedés vágyát táplálják. 

A vállalatok globálisan rákapcsoltak és elkezdték beépíteni, vagy minimum keresik a módját annak, hogyan tudják ezeket az eszközöket beépíteni működésükbe. Noha ennek megvannak a maga előnyei és elképzelhető, hogy a vállalatok némi termelékenységnövekedést tudnak ilyen módon elérni, de az elérhető potenciál így messze elmarad attól, amit user-centered megközelítés alkalmazásával tudnának befutni.  

Mindeközben a felhasználók pedig rosszul használható interfacek foglyai lehetnek. 

Az AI eszközök felhasználói kutatásának szükségessége nyilvánvaló, csakúgy mint a UX designerek új generációinak munkája az AI alkalmazások következő hullámának kialakításához.

Invesztíció nélkül nem lesz jobb AI usability

Ahhoz, hogy jó élménye legyen a generatív AI tooloknak, van néhány alapigazság, amit ebben a szektorban is alkalmazni kellene:

  • A jól használható digitális termékekhez továbbra is szándékos design erőfeszítések kellenek, jó felhasználói felület soha nem jön létre, ha a design csupán a megvalósítás mellékterméke.
  • Olyan tehetséges designerekre van szükség, akik UX designra szakosodtak.
  • A design munkát a kutatás drivolja, az iterációk alapja a rendszeres használhatósági tesztelés.

Minél inkább innovációról van szó, annál több design kutatásra van szükség. Egy jól ismert területen értelemszerűen amit már agyonkutattak/tesztelek, jobban lehet támaszkodni a meglévő használhatósági irányelvekre és az adott design csapat tapasztalataira.

A generatív AI termékek nagyon újak, valamint az első potenciálisan radiálisan más felhasználói felület paradigma váltás hatvan év után, amely a parancsvezérelt interakciókról a szándékalapú interakciókra akar átváltani.

Viszont ahogyan a fenti példákban láttuk úgy tűnik a látszat ellenére egyáltalán nem „természetesebb” a “conversational design”, mert ez az interakciós mód egyelőre rengeteg használhatósági problémához vezethet.

Jakob Nielsen mindezt a következőképpen fordította:

AI firms need more UX, not less

A jelen azonban kissé más képet mutat. Nielsen 2023. augusztusában a Linkedinen megvizsgálta, hogy milyen arányban vannak UX szakemberek a vezető mesterséges intelligencia cégeknél és az alábbiakat találta:

  • OpenAI (a ChatGPT mögött álló cég): 1122 alkalmazott, 6 fő UX vagy egyéb designer (plusz néhány szabadúszó). 0,5%-os UX designer arány
  • Midjourney (a legfelkapottabb generatív képalkotó szolgáltatás): 86 alkalmazott, 0 fő UX szakember. 0,0%-os UX designer arány
  • Runway (a vezető videós AI): 95 alkalmazott, 5 UX-szakember. 5,3%-os UX designer arány

Az OpenAI és a Midjourney csehül állnak a designeri arányokban, legalább 10%-os UX designeri szakembergárdával kellene rendelkezniük.

Egyelőre úgy tűnik a jövőt nem a felhasználói szükségletek köré építik, itt a lehetőség a UX szakma számára.

A történelem egyik tanulsága, hogy az innovációk első generációja ritkán szokott sikeres lenni, lásd nem a Google volt az első webes kereső, de a Google lett az első igazán jó kereső a felhasználók szempontjából. A generatív AI megoldások használhatósági problémákkal küzdenek, amelyek megoldása egy jó esélyt adhat a UX design szakmának. 

Boros Norbert

Innovation Designer | Experience Research Leader in Finance

Üzleti problémák megoldásában segítek designeri gondolkodásmóddal.