Sg.hu - Miként érhetjük el anyagi függetlenségünket az MI-rendszerek promptjainak elemzésével?
Brad Menezes, a Superblocks nevű programozási támogatással foglalkozó startup vezérigazgatója úgy gondolja, hogy a következő milliárd dolláros startup-ötlet szinte kézzelfogható közelségben van. Szerinte mindössze annyira van szükség, hogy alaposan megvizsgáljuk a már létező unikornis MI-startupok által alkalmazott rendszerpromptokat.
A rendszerpromptok azok a hosszú - több mint 5000-6000 szavas - parancsok, amelyeket az MI-startupok arra használnak, hogy az olyan cégek, mint az OpenAI vagy az Anthropic alapmodelljeinek megmutatják hogyan hozzák létre az alkalmazásszintű MI-termékeiket. Menezes szerint ezek olyanok, mint egy mesterkurzus a prompt engineeringből. "Minden egyes vállalatnak teljesen más rendszer promptja van ugyanahhoz az alapmodellhez" - mondta. "Megpróbálják rávenni a modellt, hogy pontosan azt tegye, amire egy adott területen, adott feladatokhoz szükség van".
Ezek a rendszerpromtok nem éppen titkosak. Az ügyfelek számos mesterséges intelligencia eszközt felkereshetnek, hogy megosszák velük a saját verziójukat, de ezek nem mindig könnyen hozzáférhetőek. A Superblocks, új termékének, a Clark nevű vállalati kódoló MI-ügynöknek a bejelentése alkalmából, úgy döntött, hogy megosztja a legnépszerűbb MI-kódoló termékek, mint például a Windsurf, Manus, Cursor, Lovable és Bolt 19 rendszerpromtjait tartalmazó fájlt. Menezes tweetje villámgyorsan terjedt, közel 2 millió megtekintéssel büszkélkedhet, és olyan prominens Szilícium-völgyi személyiségek is felfigyeltek rá, mint Sam Blond, a Founders Fund és a Brex korábbi vezetője, valamint Aaron Levie, a Superblocks befektetője. A Superblocks a múlt héten bejelentette, hogy sikeresen 23 millió dolláros tőkebevonást hajtott végre.
Menezes azt magyarázta, hogy a Clark rendszerének kiépítése és a rendszerpromptok átvizsgálása során arra a következtetésre jutottak, hogy a rendszerprompt körülbelül 20%-a képezi a titkos szószt. Ez a prompt szolgáltatja az alapot az LLM számára, hogy milyen irányba haladjon. A fennmaradó 80% a "prompt gazdagítás", amely az a háttérinfrastruktúra, amelyet egy startup az LLM hívásai köré alakít ki. Ebbe beletartoznak a felhasználói prompthoz kapcsolódó utasítások, valamint a válaszok visszaküldésekor végrehajtott műveletek, mint például a pontosság ellenőrzése. Hangsúlyozta, hogy a rendszerpromptok három fő aspektusát érdemes alaposan megvizsgálni: a szerepkörökre vonatkozó promptokat, a kontextuális promptokat és az eszközhasználatot.
Az első észrevétel, amit érdemes tenni, hogy a rendszer súgói bár természetes nyelven íródtak, rendkívül specifikusak. "Alapvetően úgy kell kommunikálni, mint ha egy emberi kollégához fordulnánk" - magyarázta Menezes. "A megfogalmazott utasításoknak precízeknek kell lenniük." A szerepfelkérés kulcsszerepet játszik az LLM-ek következetességében, mivel célt és karaktert biztosít számukra. Például a Deviné felkérés így kezdődik: "Ön Devin, egy szoftvermérnök, aki egy valódi számítógépes operációs rendszert használ. Ön egy kivételes kódzseni: kevesen értenek olyan jól a kódbázisokhoz, a funkcionális és tiszta kód írásához, valamint a változtatások folyamatos finomításához, amíg azok tökéletesek nem lesznek." Ez a felhívás keretet ad a modelleknek, amelyet figyelembe kell venniük a cselekvés előtt. Célja, hogy olyan védőkorlátokat biztosítson, amelyek segítenek a költségek csökkentésében és a feladatok egyértelműsítésében.
A Cursor javaslatai a következőképpen fogalmazhatók meg: "Eszközöket csak szigorúan szükség esetén hívjon meg, és a felhasználónak soha ne említse az eszközök nevét – inkább fókuszáljon arra, mit végeznek. Kódot csak akkor mutasson, ha kifejezetten kérik. Mielőtt bármilyen módosítást végezne, alaposan olvassa át a vonatkozó fájl tartalmát, és javítson ki minden nyilvánvaló hibát, de kerülje a találgatásokat, és ne ismételje meg a javításokat háromnál többször." Az eszközök alkalmazása lehetővé teszi a komplex feladatok végrehajtását, irányítva a modellek működését a csupán szöveggeneráláson túl. Például a Replité sokoldalú szolgáltatásokat kínál, beleértve a kód szerkesztését, a nyelvek telepítését, a PostgreSQL adatbázisok konfigurálását és lekérdezését, valamint a parancssori utasítások végrehajtását, és még sok más hasznos funkciót.
Menezes számára mások rendszerkövetelményeinek alapos tanulmányozása lehetőséget teremtett arra, hogy megértse, milyen szempontokra helyezik a hangsúlyt a különböző vibe kódolók. Az olyan eszközök, mint a Loveable, a V0 és a Bolt a "gyors iterációra" összpontosítanak, míg a "Manus, a Devin, az OpenAI Codex és a Replit" a felhasználóknak komplex alkalmazások fejlesztésében nyújtanak segítséget, habár a végeredmény még mindig egyfajta nyers kód marad. Menezes abban lát lehetőséget, hogy a nem programozók is képesek legyenek alkalmazásokat létrehozni, amennyiben a startupja képes kezelni a biztonsági kérdéseket és hozzáférést biztosítani olyan vállalati adatforrásokhoz, mint a Salesforce. Bár még nem vezeti álmai milliárdos startupját, a Superblocks már sikeresen megszerezte néhány neves ügyfelet, köztük az Instacartot és a Paypaya Global-t is.
Menezes a termékfejlesztés során nem csupán a külső tényezőkre figyel, hanem belsőleg is aktívan részt vesz a folyamatban. Szoftvermérnökeik nem készíthetnek belső eszközöket; kizárólag a termék építésére összpontosíthatnak. Ennek eredményeként az üzleti területek munkatársai saját igényeikhez igazodva fejlesztettek ki ügynököket, például egyet, amely a CRM-adatokra támaszkodik a leadek azonosításához, egy másikat, amely a teljesítménymutatók nyomon követésére szolgál, vagy egy harmadikat, amely segít az értékesítési csapat feladatainak optimális elosztásában. "Ez alapvetően egy innovatív megközelítés arra, hogy saját eszközeinket hozzuk létre a vásárlás helyett" – mondja.