A mesterséges intelligencia a közelmúltban felforgatta a világot. Az új eszközök egy része ingyenesen bárki számára hozzáférhető az interneten – azonban használatuk közel sem triviális. A “prompt engineering”, vagyis az AI számára adott instrukciók helyes kialakítása mára önálló diszciplína, annak alapjai azonban könnyen elsajátíthatóak.
Mesterséges intelligencia a mindennapokban
2023 egyértelműen a generatív AI modellek felfutásáról szólt. Ha így nem ismerős: a ChatGPT-ről és társairól van szó. A világszinten az elmúlt évben kibontakozó mesterséges intelligencia-forradalom legnagyobb hétköznapi eredménye, hogy mindenki számára hozzáférhetővé vált a generatív AI-technológia. A szövegeket létrehozni képes ChatGPT mellett megjelentek a külfönéle vizuális modellek (DALL-E, Craiyon, Bing Image Creator, stb) is, ezeket pedig ma már programozói ismeretek nélkül is használhatjuk.
Különösen hasznos lehet mindkét fajta eszköz az üzleti életben, mivel jelentősen meggyorsítják az új tartalmak létrehozását. Azonban ez csak akkor igaz, ha a megfelelő instrukciókat (szaknyelven promptokat) adjuk az AI-modelleknek. A prompt az a szöveges utasítás, amit a nagy nyelvi modellnek (LLM) biztosítunk, és amelyre válaszul az tartalmat generál. Rosszul megadott promptok esetén az eszközök által generált tartalmak nem fognak találkozni az elvárásainkkal, ezért fontos, hogyan alakítjuk ki ezeket.
Egy jó prompt olyan főbb pontokat, kulcsszavakat tartalmaz, amelyek tisztázzák az AI számára a kontextust és a konkrét instrukciókat is. Emellett figyelembe veszi a technológia képességeit és mai limitációit, a generatív mesterséges intelligencia működésének ismeretéről tanúskodik – így kaphatunk a promptokra válaszul releváns, pontos, koherens válaszokat.
A prompt-fogalmazás alapjai
Bár a promptok helyes megfogalmazása misztikus dolognak tűnik, valójában a prompt engineering alapja három tiszta, általános érvényű tanács:
- Fogalmazzunk tisztán és pontosan
- Használjuk ki az AI képességeit
- Adjunk megfelelő teret a kreativitásra
Lássuk, mit is jelentenek ezek a gyakorlatban!
Fogalmazzunk tisztán és pontosan
Ahhoz, hogy az AI megértse, mit kérünk tőle, a gép nyelvét kell használnunk. Amennyiben instrukciókat és egyéb inputokat is adunk, válasszuk el ezeket tisztán egymástól! Erre használhatjuk a következő karakterek valamelyikét:
- Három idézőjel: “””
- Három ún. backtick, vagyis: “`
- Három gondolatjel: –––
- Csúcsos zárójelek < >
- XML tagek <tag></tag>
Így a mesterséges intelligencia tudtára adhatjuk, meddig tartanak az instrukciók, és hol kezdődnek azok az adatok, amelyek feldolgozására kérjük a modellt.
A bemeneti adatok mellett az outputokra, vagyis a generált válaszokra vonatkozóan is megfogalmazhatunk instrukciókat. Utasíthatjuk az AI-t, hogy a nekünk megfelelő formában biztosítsa a választ: pontokba szedve, blog bejegyzés formájában, vagy akár (további felhasználásra szánva) kódként. De arra is “megkérhetjük”, hogy a bementi adatok bizonyos elemeit hagyja figyelmen kívül válaszában.
Érdemes lehet emellett azzal is kísérletezni, hogy egy nekünk tetsző választ példaként állítunk az AI elé a promptban, és arra utasítjuk a modellt, hogy ahhoz hasonló válaszokat adjon.
Használjuk ki az AI képességeit
A mesterséges intelligencia-alapú eszközök egyik nagy előnye, hogy befolyásolhatjuk a modell “gondolkodásának” működését. Megszabhatjuk, hogy hol van tér több kreativitásra, illetve milyen területen várjuk el, hogy a modell igazodjon az elvárásainkhoz. Jó ötlet például lépésekre bontani a feladatot: pontosan adjuk meg, milyen folyamaton szeretnénk, hogy végighaladjon az AI a prompt megválaszolásában.
Ha például arra kérjük, hogy kategorizálja a bemeneti adatokat, szabjuk meg az elvárt kategóriákat. Ha arra utasítjuk, hogy elemezze a bemeneti adatokat, hozzon döntést egy általunk meghatározott szabályrendszer szerint, majd adjon választ minden egyes bemeneti adatra, akkor az utasítás minden elemét specifikáljuk részletesen.
Adjunk megfelelő teret a kreativitásra
Az előző pont példájánál maradva: a bemeneti adatok elemzését és a döntést magát bízhatjuk a modellre, míg a formai követelményeket és a döntési logikát mi határozzuk meg. Így a lehető legjobban kihasználjuk a képességeit, miközben korlátozzuk a “kreativitását”, hogy biztosan hasznos végeredményt kapjunk.
Azzal is érdemes számolnunk, hogy az AI-modell a bemeneti adatok alapján dolgozik. Így ha szabadjára engedjük saját kreativitásunkat, és részletes “tájleírást” adunk az eszköznek a kontextusról, az jobban fogja “érteni”, milyen kiemenetre számítunk, és valószínűleg pontosabb, hasznosabb választ fog adni.
Profi AI-felhasználók kísérletezhetnek a ‘Temperature’ (hőfok) változó használatával is, ami azt szabja meg, hogy a modell mennyire használjon az adott szavak mellett nagy valószínűséggel előforduló szavakat, vagy mennyire emelhet be kevésbé valószínű következő szavakat. Egy 0 közeli ‘temperature’ paraméter kevés teret ad a modell kreativitásának, míg 1-es értékkel olyan szavak is előfordulhatnak a szövegben, amik kevésbé gyakran használatosak az adott szövegkörnyezetben. A 1,5 feletti ‘temperature’ értékek használata gyakran teljesen értelmetlen szöveghez vezet.
Végezetül fontos tudomásuk vennünk, hogy ritkán fogunk pontos választ kapni rögtön az első promptra. A prompt engineering egy kísérletezős műfaj, ahol minden újabb iteráció egyre pontosabb eredményekhez vezet.