Tweġiba qasira: Biex tibni aġent tal-IA li jaħdem fil-prattika, ittrattah bħala ċiklu kkontrollat: ħu input, iddeċiedi l-azzjoni li jmiss, sejjaħ għodda b'ambitu ristrett, osserva r-riżultat, u rrepeti sakemm tgħaddi verifika ċara ta' "lest". Jaqla' l-valur tiegħu meta l-kompitu jkun b'ħafna passi u mmexxi mill-għodda; jekk prompt wieħed isolvih, aqbeż l-aġent. Żid skemi stretti tal-għodda, limiti tal-passi, logging, u validatur/kritiku sabiex meta l-għodod ifallu jew l-inputs ikunu ambigwi, l-aġent jeskala minflok ma jagħmel ċiklu.
Punti ewlenin:
Ċirkwit tal-kontrollur : Implimenta input→act→observa r-ripetizzjoni b'kundizzjonijiet ta' waqfien espliċiti u passi massimi.
Disinn tal-għodda : Żomm l-għodod dojoq, ittajpjati, bil-permessi, u vvalidati biex tevita l-kaos ta' "do_anything".
Iġjene tal-memorja : Uża stat kompatt għal żmien qasir flimkien ma' rkupru għal żmien twil; evita li tirrilaxxa traskrizzjonijiet sħaħ.
Reżistenza għall-użu ħażin : Żid listi permessi, limiti tar-rata, idempotenza, u "dry-run" għal azzjonijiet riskjużi.
Testabilità : Żomm sett ta' xenarji (fallimenti, ambigwità, injezzjonijiet) u erġa' ħaddem ma' kull bidla.

🔗 Kif tkejjel il-prestazzjoni tal-AI
Tgħallem metriċi prattiċi biex tqabbel il-veloċità, l-eżattezza u l-affidabbiltà.
🔗 Kif titkellem mal-AI
Uża suġġerimenti, kuntest, u tweġibiet ta' segwitu biex tikseb tweġibiet aħjar.
🔗 Kif tevalwa l-mudelli tal-IA
Qabbel mudelli bl-użu ta' testijiet, rubriki, u riżultati ta' kompiti fid-dinja reali.
🔗 Kif tottimizza l-mudelli tal-AI
Ittejjeb il-kwalità u l-ispiża bl-irfinar, it-tneħħija tal-piż u l-monitoraġġ.
1) X'inhu aġent tal-IA, f'termini ta' persuna normali 🧠
Aġent tal-AI huwa linja. Dokumenti ta' "Aġenti" ta' LangChain
Dak hu. Ċirkwit b'moħħ fin-nofs.
Input → aħseb → aġixxi → osserva → irrepeti . Irreaġixxi karta (raġuni + azzjoni)
Fejn:
-
L-input huwa talba tal-utent jew avveniment (email ġdida, biljett ta' appoġġ, ping tas-sensor).
-
Aħseb huwa mudell lingwistiku li jirraġuna dwar il-pass li jmiss.
-
Azzjoni hija sejħa ta' għodda (tiftix ta' dokumenti interni, tħaddim ta' kodiċi, ħoloq biljett, abbozza tweġiba). Gwida għas-sejħa ta' Funzjonijiet OpenAI
-
Osserva qed taqra l-output tal-għodda.
-
Ir-ripetizzjoni hija l-parti li tagħmilha tħossha "aġenta" minflok "taħdita". Dokumenti ta' LangChain "Aġenti".
Xi aġenti huma bażikament makros intelliġenti. Oħrajn jaġixxu aktar bħal operatur junior li jista' jorganizza l-kompiti u jirkupra minn żbalji. It-tnejn li huma jgħoddu.
Ukoll, m'għandekx bżonn awtonomija sħiħa. Fil-fatt... probabbilment ma tridhiex 🙃
2) Meta għandek tibni aġent (u meta m'għandekx) 🚦
Ibni aġent meta:
-
Ix-xogħol jinvolvi diversi stadji u jinbidel skont x'jiġri f'nofs il-proċess.
-
Ix-xogħol jeħtieġ l-użu ta' għodda (databases, CRMs, eżekuzzjoni ta' kodiċi, ġenerazzjoni ta' fajls, browsers, APIs interni). Dokumenti ta' "Għodda" ta' LangChain
-
Trid riżultati ripetibbli b'protezzjonijiet, mhux biss tweġibiet ta' darba.
-
Tista' tiddefinixxi "lest" b'mod li kompjuter jista' jivverifika, anke b'mod laxk.
Tibnix aġent meta:
-
Prompt sempliċi + tweġiba ssolviha (tiżżejjedx l-inġinerija, se tobgħod lilek innifsek aktar tard).
-
Għandek bżonn determiniżmu perfett (l-aġenti jistgħu jkunu konsistenti, imma mhux robotiċi).
-
M'għandekx għodda jew dejta biex tikkonnettja - allura l-aktar huma biss vibrazzjonijiet.
Ejjew inkunu onesti: nofs il-“proġetti tal-aġenti tal-IA” jistgħu jkunu fluss tax-xogħol bi ftit regoli ta’ fergħat. Imma xi kultant l-atmosfera hija importanti wkoll 🤷♂️
3) X'jagħmel verżjoni tajba ta' aġent tal-IA ✅
Hawn hi t-taqsima "X'jagħmel verżjoni tajba ta'" li tlabt, ħlief li se nkun daqsxejn dirett:
Verżjoni tajba ta' aġent tal-IA mhijiex dik li taħseb l-aktar. Hija dik li:
-
Jaf x'inhu permess li jagħmel (limiti tal-ambitu)
-
Juża l-għodod b'mod affidabbli (sejħiet strutturati, tentattivi mill-ġdid, timeouts) Gwida għas-sejħiet tal-Funzjoni OpenAI AWS "Timeouts, tentattivi mill-ġdid, u backoff bil-jitter"
-
Iżomm l-istat nadif (memorja li ma titmermirx) LangChain “Ħarsa ġenerali lejn il-memorja”
-
Jispjega l-azzjonijiet tiegħu (traċċi tal-verifika, mhux ammonti ta' informazzjoni dwar raġunament sigriet) NIST AI RMF 1.0 (affidabbiltà u trasparenza)
-
Jieqaf kif suppost (verifiki tat-tlestija, passi massimi, eskalazzjoni) Dokumenti tal-"Aġenti" ta' LangChain
-
Jifalli mingħajr periklu (jitlob l-għajnuna, ma jalluċinax awtorità) NIST AI RMF 1.0
-
Jista' jiġi ttestjat (tista' tħaddmu fuq xenarji ppreparati u tikseb riżultati tal-punteġġ)
Jekk l-aġent tiegħek ma jistax jiġi ttestjat, bażikament hija magna tal-islott kunfidenti ħafna. Pjaċevoli fil-festi, tal-biża' fil-produzzjoni 😬
4) Il-pedamenti ewlenin ta' aġent (l-"anatomija" 🧩)
Il-biċċa l-kbira tal-aġenti solidi għandhom dawn il-biċċiet:
A) Il-linja tal-kontrollur 🔁
Dan huwa l-orkestratur:
-
ħu l-gowl
-
staqsi lill-mudell għall-azzjoni li jmiss
-
għodda tal-ġiri
-
osservazzjoni miżjuda
-
Irrepeti sakemm tkun lest Dokumenti tal-"Aġenti" ta' LangChain
B) Għodod (magħrufa wkoll bħala kapaċitajiet) 🧰
L-għodod huma dak li jagħmel aġent effettiv: Dokumenti ta' "Għodda" ta' LangChain
-
mistoqsijiet tad-database
-
tibgħat emails
-
ġbid ta' fajls
-
kodiċi tat-tħaddim
-
sejħa ta' APIs interni
-
kitba fuq spreadsheets jew CRMs
Ċ) Memorja 🗃️
Żewġ tipi huma importanti:
-
memorja għal żmien qasir : il-kuntest tal-ġirja attwali, passi reċenti, pjan attwali
-
memorja fit-tul : preferenzi tal-utent, kuntest tal-proġett, għarfien miksub (spiss permezz ta' embeddings + maħżen vettorjali) karta RAG
D) Politika ta' ppjanar u teħid ta' deċiżjonijiet 🧭
Anke jekk ma ssejjaħlux “ippjanar”, għandek bżonn metodu:
-
listi ta' kontroll
-
Dokument ReAct fl-istil ta' ReAct "aħseb imbagħad uża l-għodda"
-
graffs tal-kompiti
-
mudelli superviżur-ħaddiem
-
mudelli ta' superviżur-ħaddiem Microsoft AutoGen (qafas b'ħafna aġenti)
E) Poġġamani u evalwazzjoni 🧯
-
permessi
-
skemi ta' għodda sikuri Outputs Strutturati tal-OpenAI
-
validazzjoni tal-output
-
limiti tal-passi
-
qtugħ tas-siġar
-
testijiet NIST AI RMF 1.0
Iva, huwa aktar inġinerija milli tħeġġiġ. Li huwa... xi ftit jew wisq il-punt.
5) Tabella ta' Paragun: modi popolari biex tibni aġent 🧾
Hawn taħt hawn "Tabella ta' Paragun" realistika - bi ftit karatteristiċi partikolari, għax it-timijiet reali huma partikolari 😄
| Għodda / Qafas | Udjenza | Prezz | Għaliex jaħdem | Noti (kaos ċkejken) | |
|---|---|---|---|---|---|
| LangChain | bennejja li jħobbu komponenti stil lego | free-ish + infra | ekosistema kbira għal għodod, memorja, ktajjen | tista' tiekol spaghetti malajr jekk ma ssemmix l-affarijiet b'mod ċar | |
| LlamaIndex | Timijiet b'ħafna RAG | free-ish + infra | mudelli ta' rkupru b'saħħithom, indiċjar, konnetturi | Tajjeb ħafna meta l-aġent tiegħek ikun bażikament "fittex + jaġixxi"... li huwa komuni | |
| Approċċ tal-istil tal-Assistenti OpenAI | timijiet li jixtiequ setup aktar mgħaġġel | ibbażat fuq l-użu | mudelli ta' sejħiet ta' għodda integrati u stat ta' tħaddim | inqas flessibbli f'xi kantunieri, iżda nadif għal ħafna applikazzjonijiet | OpenAI Runs API Sejħa tal-funzjoni tal-Assistenti OpenAI |
| Kernel Semantiku | żviluppaturi li jridu orkestrazzjoni strutturata | xi ftit ħieles | astrazzjoni pulita għal ħiliet/funzjonijiet | iħoss "negozju pulit" - xi kultant dan huwa kumpliment 😉 | |
| Ġenerazzjoni Awtomatika | sperimentaturi b'aġenti multipli | xi ftit ħieles | mudelli ta' kollaborazzjoni bejn aġent u aġent | jista’ jitkellem iżżejjed; jistabbilixxi regoli stretti dwar it-terminazzjoni | |
| CrewAI | fannijiet ta’ “timijiet ta’ aġenti” | xi ftit ħieles | Ir-rwoli + il-kompiti + it-trasferimenti huma faċli biex jiġu espressi | jaħdem l-aħjar meta l-kompiti jkunu ċari, mhux imċajprin | |
| Munzell tat-tiben | tiftix + pipelines nies | xi ftit ħieles | pajpijiet solidi, irkupru, komponenti | inqas “teatru tal-aġent”, aktar “fabbrika prattika” | |
| Irrombla tiegħek (linja apposta) | dawk li jħobbu l-kontroll (affettivi) | il-ħin tiegħek | maġija minima, ċarezza massima | ġeneralment l-aħjar fit-tul... sakemm terġa' tivvinta kollox 😅 |
Ma hemm l-ebda rebbieħ wieħed. L-aħjar għażla tiddependi fuq jekk ix-xogħol ewlieni tal-aġent tiegħek huwiex l-irkupru , l-eżekuzzjoni tal-għodda , il-koordinazzjoni bejn diversi aġenti , jew l-awtomazzjoni tal-fluss .
6) Kif Tibni Aġent tal-AI pass pass (ir-riċetta attwali) 🍳🤖
Din hija l-parti li ħafna nies jaqbżuha, imbagħad jistaqsu għaliex l-aġent jaġixxi bħal rakkun f'dispensa.
Pass 1: Iddefinixxi x-xogħol f'sentenza waħda 🎯
Eżempji:
-
"Abbozza tweġiba għall-klijent billi tuża l-politika u l-kuntest tat-ticket, imbagħad itlob l-approvazzjoni."
-
"Investiga rapport ta' bug, irriproduċih, u ppropona soluzzjoni."
-
"Ibdel noti imperfetti tal-laqgħat f'kompiti, sidien, u skadenzi."
Jekk ma tistax tiddefinixxiha b'mod sempliċi, l-aġent tiegħek lanqas ma jista'. Jiġifieri jista', imma jimprovizza, u l-improvizzazzjoni hija fejn il-baġits imorru biex imutu.
Pass 2: Iddeċiedi l-livell ta' awtonomija (baxx, medju, pikkanti) 🌶️
-
Awtonomija baxxa : tissuġġerixxi passi, klikks umani "japprovaw"
-
Medju : iħaddem l-għodod, jabbozza l-output, jeskala minħabba l-inċertezza
-
Għoli : jesegwixxi minn tarf sa tarf, jagħmel pings biss lill-bnedmin fuq eċċezzjonijiet
Ibda aktar baxx milli trid. Dejjem tista' żżidu aktar tard.
Pass 3: Agħżel l-istrateġija tal-mudell tiegħek 🧠
Tipikament tagħżel:
-
mudell wieħed b'saħħtu għal kollox (sempliċi)
-
mudell wieħed b'saħħtu + mudell iżgħar għal passi rħas (klassifikazzjoni, rottaġġ)
-
mudelli speċjalizzati (viżjoni, kodiċi, diskors) jekk meħtieġ
Iddeċiedi wkoll:
-
tokens massimi
-
temperatura
-
jekk tippermettix traċċi twal ta' raġunament internament (tista', imma tesponix katina ta' ħsieb mhux ipproċessata lill-utenti finali)
Pass 4: Iddefinixxi l-għodod bi skemi stretti 🔩
L-għodda għandha tkun:
-
dejjaq
-
ittajpjat
-
permess
-
Outputs Strutturati tal-OpenAI vvalidati
Minflok għodda msejħa do_anything(input: string) , agħmel:
-
search_kb(mistoqsija: string) -> riżultati[] -
create_ticket(title: string, body: string, priority: enum) -> ticket_id -
send_email(to: string, subject: string, body: string) -> statusGwida għas-sejħa tal-Funzjoni OpenAI
Jekk tagħti lill-aġent serrieq tal-katina, tixxokkjax meta jqatta' sisien tal-ħaxix billi jneħħi wkoll l-ilqugħ.
Pass 5: Ibni l-linja tal-kontrollur 🔁
Ċirkwit minimu:
-
Ibda bil-mira + kuntest inizjali
-
Staqsi lill-mudell: “L-azzjoni li jmiss?”
-
Jekk is-sejħa tal-għodda - eżegwixxi l-għodda
-
Żid osservazzjoni
-
Iċċekkja l-kundizzjoni tal-waqfien
-
Irrepeti (bil-passi massimi) id-dokumenti tal-"Aġenti" ta' LangChain
Żid:
-
ħinijiet ta' skadenza
-
tentattivi mill-ġdid (attenzjoni - it-tentattivi mill-ġdid jistgħu jirrepetu ruħhom) AWS “Timeouts, tentattivi mill-ġdid, u backoff bil-jitter”
-
ifformattjar ta' żball fl-għodda (ċar, strutturat)
Pass 6: Żid il-memorja bir-reqqa 🗃️
Fuq medda qasira ta' żmien: żomm "sommarju tal-istat" kompatt aġġornat f'kull pass. "Ħarsa ġenerali lejn il-memorja" ta' LangChain.
Fuq medda twila ta' żmien: aħżen fatti durabbli (preferenzi tal-utent, regoli tal-organizzazzjoni, dokumenti stabbli).
Regola ġenerali:
-
jekk jinbidel spiss - żommu għal żmien qasir
-
jekk ikun stabbli - aħżen għal żmien twil
-
jekk ikun sensittiv - aħżnuh minimament (jew xejn)
Pass 7: Żid validazzjoni u pass ta' "kritiku" 🧪
Mudell irħis u prattiku:
-
aġent jiġġenera riżultat
-
Il-validatur jivverifika l-istruttura u r-restrizzjonijiet
-
Reviżjonijiet fakultattivi tal-mudell kritiku għal passi neqsin jew ksur tal-politika NIST AI RMF 1.0
Mhux perfett, imma jaqbad ammont xokkanti ta' bla sens.
Pass 8: Irreġistra dak kollu li se jiddispjaċik li ma rreġistrajtx 📜
Reġistru:
-
sejħiet tal-għodda + inputs + outputs
-
deċiżjonijiet meħuda
-
żbalji
-
riżultati finali
-
Primer tal-osservabbiltà tat-tokens u l-latenza
Futur - int se tirringrazzjak. Preżent - int se tinsa. Hekk hi l-ħajja 😵💫
7) Sejħa ta' għodda li ma tkissirlekx ruħek 🧰😵
Is-sejħa tal-għodda hija fejn "Kif Tibni Aġent tal-AI" issir inġinerija tas-softwer vera.
Agħmel l-għodda affidabbli (l-affidabbiltà hija tajba)
Għodod affidabbli huma:
-
deterministiku
-
ambitu dejjaq
-
faċli biex tittestja
-
sikur li terġa' tħaddem "talbiet Idempotent" ta' Stripe
Żid guardrails fis-saff tal-għodda, mhux biss prompts
Il-prompts huma suġġerimenti edukati. Il-validazzjoni tal-għodda hija bieb imsakkar. Outputs Strutturati OpenAI
Agħmel:
-
listi permessi (liema għodod jistgħu jaħdmu)
-
validazzjoni tal-input
-
limiti tar-rata Gwida tal-limiti tar-rata tal-OpenAI
-
kontrolli tal-permess għal kull utent/organizzazzjoni
-
"modalità ta' tħaddim mingħajr skop" għal azzjonijiet riskjużi
Disinn għal falliment parzjali
L-għodod ifallu. In-netwerks jitħarrek. L-awtorizzazzjoni tiskadi. Aġent irid:
-
interpreta żbalji
-
prova mill-ġdid b'backoff meta jkun xieraq l-istrateġija ta' tentattiv mill-ġdid ta' Google Cloud (backoff + jitter)
-
agħżel għodod alternattivi
-
teskala meta tkun imblukkata
Trukk effettiv bil-kwiet: irritorna żbalji strutturati bħal:
-
tip: żball_ta'_awtentikazzjoni -
tip: mhux_misjub -
tip: rate_limited
Sabiex il-mudell ikun jista' jirrispondi b'mod intelliġenti minflok ma jippanikja.
8) Memorja li tgħinek minflok ma ttormentak 👻🗂️
Il-memorja hija qawwija, iżda tista' wkoll issir kexxun tal-iskart.
Memorja għal żmien qasir: żommha kompatta
Użu:
-
l-aħħar passi N
-
sommarju tat-tħaddim (aġġornat f'kull ċiklu)
-
pjan attwali
-
restrizzjonijiet attwali (baġit, ħin, politiki)
Jekk titfa’ kollox fil-kuntest tiegħu, ikollok:
-
spiża ogħla
-
latenza aktar bil-mod
-
aktar konfużjoni (iva, anke dakinhar)
Memorja fit-tul: irkupru aktar milli "mili"
Il-biċċa l-kbira tal-“memorja fit-tul” hija aktar bħal:
-
inkorporazzjonijiet
-
ħanut tal-vettur
-
Karta RAG ta' ġenerazzjoni miżjuda ta' rkupru (RAG)
L-aġent ma jimmemorizzax. Jirkupra l-aktar siltiet rilevanti waqt ir-runtime. LlamaIndex “Introduzzjoni għall-RAG”
Regoli prattiċi tal-memorja
-
Aħżen il-“preferenzi” bħala fatti espliċiti: “L-utent iħobb is-sommarji bil-bullets u jobgħod l-emojis” (lol, mhux hawn għalkemm 😄)
-
Aħżen id-“deċiżjonijiet” b’timestamps jew verżjonijiet (inkella l-kontradizzjonijiet jakkumulaw)
-
Qatt ma taħżen sigrieti sakemm ma jkollokx verament bżonn
U din hija l-metafora imperfetta tiegħi: il-memorja hija bħal friġġ. Jekk qatt ma tnaddafha, eventwalment is-sandwich tiegħek ikollu togħma ta’ basal u dispjaċir.
9) Mudelli ta' ppjanar (minn sempliċi għal sofistikati) 🧭✨
L-ippjanar huwa biss dekompożizzjoni kkontrollata. Tagħmilhiex mistika.
Mudell A: Pjanifikatur tal-lista ta' kontroll ✅
-
Il-mudell joħroġ lista ta' passi
-
Eżegwixxi pass pass
-
Aġġornamenti tal-istatus tal-lista ta' kontroll
Tajjeb ħafna għall-onboarding. Sempliċi, u tista' tiġi ttestjata.
Mudell B: Ċirku ta' ReAct (raġuni + att) 🧠→🧰
-
il-mudell jiddeċiedi s-sejħa li jmiss tal-għodda
-
josserva l-output
-
tirrepeti l-karta ReAct
Din hija s-sensazzjoni klassika ta' aġent.
Mudell Ċ: Superviżur-ħaddiem 👥
-
is-superviżur jaqsam l-għan f'kompiti
-
il-ħaddiema jwettqu kompiti speċjalizzati
-
superviżur jgħaqqad ir-riżultati Microsoft AutoGen (qafas b'ħafna aġenti)
Dan huwa ta' valur meta l-kompiti jkunu parallelizzabbli, jew meta trid "rwoli" differenti bħal:
-
riċerkatur
-
kodifikatur
-
editur
-
Verifikatur tal-QA
Mudell D: Ippjana-imbagħad-eżegwixxi b'ippjanar mill-ġdid 🔄
-
oħloq pjan
-
eżegwixxi
-
jekk ir-riżultati tal-għodda jibdlu r-realtà, ippjana mill-ġdid
Dan jipprevjeni lill-aġent milli jsegwi b'mod riġidu pjan ħażin. Il-bnedmin jagħmlu dan ukoll, sakemm ma jkunux għajjenin, f'liema każ isegwu wkoll pjanijiet ħżiena.
10) Sigurtà, affidabbiltà, u li ma titkeċċix 🔐😅
Jekk l-aġent tiegħek jista' jieħu azzjonijiet, għandek bżonn disinn ta' sigurtà. Mhux "sabiħ li jkollok". Meħtieġa. NIST AI RMF 1.0
Limiti stretti
-
passi massimi għal kull ġirja
-
sejħiet massimi ta' għodda kull minuta
-
infiq massimu għal kull sessjoni (baġit tat-tokens)
-
għodod ristretti wara l-approvazzjoni
Immaniġġjar tad-dejta
-
editja l-inputs sensittivi qabel ma tirreġistra
-
ambjenti separati (żvilupp vs produzzjoni)
-
permessi tal-għodda bl-inqas privileġġ
Restrizzjonijiet fl-imġiba
-
ġiegħel lill-aġent jiċċita siltiet ta' evidenza interna (mhux links esterni, biss referenzi interni)
-
jeħtieġu bnadar ta' inċertezza meta l-fiduċja tkun baxxa
-
jirrikjedi "staqsi mistoqsija ta' kjarifika" jekk l-inputs huma ambigwi
Aġent affidabbli mhuwiex l-aktar wieħed kunfidenti. Huwa dak li jaf meta jkun qed jaqta'... u jgħid hekk.
11) Ittestjar u evalwazzjoni (il-parti li kulħadd jevita) 🧪📏
Ma tistax ittejjeb dak li ma tistax tkejjel. Iva, dik il-frażi hija banali, imma hija vera b'mod tedjanti.
Ibni sett ta' xenarji
Oħloq 30-100 każ ta' test:
-
mogħdijiet kuntenti
-
każijiet ta' limitu
-
każijiet ta’ “falliment tal-għodda”
-
talbiet ambigwi
-
prompts avversarji (tentattivi ta' injezzjoni fil-pront) OWASP Top 10 għal Applikazzjonijiet LLM OWASP LLM01 Injezzjoni fil-Pront
Riżultati tal-punteġġ
Uża metriċi bħal:
-
rata ta' suċċess tal-kompitu
-
ħin għat-tlestija
-
rata ta' rkupru ta' żbalji fl-għodda
-
rata ta' alluċinazzjonijiet (dikjarazzjonijiet mingħajr evidenza)
-
rata ta' approvazzjoni umana (jekk f'modalità sorveljata)
Testijiet ta' rigressjoni għal prompts u għodod
Kull meta tbiddel:
-
skema tal-għodda
-
struzzjonijiet tas-sistema
-
loġika ta' rkupru
-
ifformattja l-memorja
Erġa' ħaddem is-suite.
L-aġenti huma bhejjem sensittivi. Bħal pjanti tad-dar, iżda jiswew aktar.
12) Mudelli ta' skjerament li ma jdubux il-baġit tiegħek 💸🔥
Ibda b'servizz wieħed
-
API tal-kontrollur tal-aġent
-
servizzi tal-għodda warajha
-
Primer tal-osservabbiltà tal-OpenTelemetry għall-logging + monitoraġġ
Żid kontrolli tal-ispejjeż kmieni
-
riżultati tal-irkupru fil-caching
-
kompressjoni tal-istat tal-konverżazzjoni b'sommarji
-
l-użu ta' mudelli iżgħar għar-rottaġġ u l-estrazzjoni
-
il-limitazzjoni tal-"modalità ta' ħsieb profond" għall-aktar passi diffiċli
Għażla komuni tal-arkitettura
-
kontrollur mingħajr stat + maħżen tal-istat estern (DB/redis)
-
Is-sejħiet tal-għodda huma idempotenti fejn possibbli “Talbiet idempotenti” ta’ Stripe
-
kju għal kompiti twal (sabiex ma żżommx talba tal-web miftuħa għal dejjem)
Ukoll: ibni "kill switch". Mhux se jkollok bżonnu sakemm ma jkollokx bżonnu tassew 😬
13) Noti tal-għeluq - il-verżjoni qasira dwar Kif Tibni Aġent tal-AI 🎁🤖
Jekk ma tiftakar xejn aktar, ftakar dan:
-
Kif Tibni Aġent tal-AI huwa l-aktar dwar il-bini ta' linja sikura madwar mudell. Dokumenti ta' "Aġenti" ta' LangChain
-
Ibda b'mira ċara, awtonomija baxxa, u għodod stretti. Outputs Strutturati tal-OpenAI
-
Żid il-memorja permezz ta' rkupru, mhux mili bla tmiem tal-kuntest. Karta RAG
-
L-ippjanar jista' jkun sempliċi - il-listi ta' kontroll u l-ippjanar mill-ġdid iwasslu ħafna.
-
Ir-reġistrazzjoni u t-testijiet ibiddlu l-kaos tal-aġenti f'xi ħaġa li tista' tibgħat. Gwida għall-osservabbiltà ta' OpenTelemetry
-
Il-guardrails jappartjenu fil-kodiċi, mhux biss fil-prontijiet. L-aqwa 10 tal-OWASP għall-Apps tal-LLM
Aġent mhuwiex maġija. Hija sistema li tieħu deċiżjonijiet tajbin spiss biżżejjed biex tkun ta’ valur... u tammetti t-telfa qabel ma tikkawża ħsara. Ta’ faraġ kwiet, f’ċertu sens 😌
U iva, jekk tibniha sew, tħossok qisek qed timpjega intern diġitali ċkejken li qatt ma jorqod, kultant jippanikja, u jħobb ix-xogħol tal-karti. Mela, bażikament intern.
Mistoqsijiet Frekwenti
X'inhu aġent tal-AI, fi kliem sempliċi?
Aġent tal-AI huwa bażikament ċiklu li jirrepeti ruħu: jieħu input, jiddeċiedi l-pass li jmiss, juża għodda, jaqra r-riżultat, u jirrepeti sakemm ikun lest. Il-parti "aġentika" ġejja mill-azzjoni u l-osservazzjoni, mhux biss miċ-chat. Ħafna aġenti huma sempliċement awtomazzjoni intelliġenti b'aċċess għall-għodda, filwaqt li oħrajn jaġixxu aktar bħal operatur junior li jista' jirkupra minn żbalji.
Meta għandi nibni aġent tal-AI minflok ma nuża biss prompt?
Ibni aġent meta x-xogħol ikun f'diversi stadji, bidliet ibbażati fuq riżultati intermedji, u jeħtieġ użu affidabbli ta' għodda (APIs, databases, ticketing, eżekuzzjoni tal-kodiċi). L-aġenti huma wkoll utli meta trid riżultati ripetibbli b'guardrails u mod kif tiċċekkja "lest." Jekk rispons immedjat sempliċi jaħdem, aġent ġeneralment ikun overhead bla bżonn u modi żejda ta' falliment.
Kif nibni aġent tal-AI li ma jeħelx f'loops?
Uża kundizzjonijiet ta' waqfien iebes: passi massimi, sejħiet massimi tal-għodda, u kontrolli ta' tlestija ċara. Żid skemi strutturati tal-għodda, timeouts, u tentattivi li ma jerġgħux jippruvaw għal dejjem. Irreġistra d-deċiżjonijiet u l-outputs tal-għodda sabiex tkun tista' tara fejn tiżbalja. Valv ta' sigurtà komuni huwa l-eskalazzjoni: jekk l-aġent ma jkunx ċert jew jirrepeti żbalji, għandu jitlob l-għajnuna aktar milli jimprovizza.
X'inhi l-arkitettura minima għal Kif Tibni Aġent tal-AI?
Mill-inqas għandek bżonn linja ta' kontroll li titma' l-mudell b'għan u kuntest, titlob l-azzjoni li jmiss, tesegwixxi għodda jekk tintalab, iżżid l-osservazzjoni, u tirrepeti. Għandek bżonn ukoll għodod b'forom stretti ta' input/output u kontroll ta' "done". Anke linja roll-your-own tista' taħdem tajjeb jekk iżżomm l-istat nadif u tinforza l-limiti tal-passi.
Kif għandi niddisinja s-sejħa tal-għodda sabiex tkun affidabbli fil-produzzjoni?
Żomm l-għodod dojoq, ittajpjati, bil-permessi, u vvalidati—evita għodda ġenerika ta' "do_anything". Ippreferi skemi stretti (bħal outputs strutturati/sejħiet ta' funzjonijiet) sabiex l-aġent ma jkunx jista' jħaddem l-inputs manwalment. Żid listi permessi, limiti tar-rata, u kontrolli tal-permessi tal-utent/organizzazzjoni fis-saff tal-għodda. Iddisinja l-għodod biex ikunu sikuri biex jerġgħu jitħaddmu meta jkun possibbli, bl-użu ta' mudelli ta' idempotenza.
X'inhu l-aħjar mod biex iżżid il-memorja mingħajr ma tagħmel l-aġent agħar?
Ittratta l-memorja bħala żewġ partijiet: stat ta' tħaddim fuq medda qasira ta' żmien (passi riċenti, pjan attwali, restrizzjonijiet) u rkupru fuq medda twila ta' żmien (preferenzi, regoli stabbli, dokumenti rilevanti). Żomm qafas fuq medda qasira ta' żmien b'sommarji kontinwi, mhux traskrizzjonijiet sħaħ. Għall-memorja fit-tul, l-irkupru (embeddings + ħażna vettorjali/mudelli RAG) ġeneralment jegħleb li "timla" kollox fil-kuntest u tħawwad il-mudell.
Liema mudell ta' ppjanar għandi nuża: lista ta' kontroll, ReAct, jew superviżur-ħaddiem?
Planner ta' lista ta' kontroll huwa tajjeb ħafna meta l-kompiti jkunu prevedibbli u trid xi ħaġa faċli biex tittestja. Il-linji stil ReAct jispikkaw meta r-riżultati tal-għodda jibdlu dak li tagħmel wara. Il-mudelli superviżur-ħaddiem (bħas-separazzjoni tar-rwoli stil AutoGen) jgħinu meta l-kompiti jistgħu jiġu parallelizzati jew jibbenefikaw minn rwoli distinti (riċerkatur, kodifikatur, QA). Ippjana-imbagħad-eżegwixxi b'ippjanar mill-ġdid huwa mezz prattiku biex jiġu evitati pjanijiet ħżiena u stubborn.
Kif nista' nagħmel aġent sigur jekk jista' jieħu azzjonijiet reali?
Uża permessi tal-inqas privileġġ u rrestrinġi għodod riskjużi wara modi ta' approvazzjoni jew "dry-run". Żid baġits u limiti: passi massimi, infiq massimu, u limiti ta' sejħiet ta' għodod kull minuta. Reddi d-dejta sensittiva qabel ma tirreġistra, u ssepara l-ambjenti tal-iżvilupp minn dawk tal-produzzjoni. Eżiġi bnadar ta' inċertezza jew mistoqsijiet ta' kjarifika meta l-inputs ikunu ambigwi, minflok ma tħalli l-kunfidenza tissostitwixxi l-evidenza.
Kif nittestja u nevalwa aġent tal-IA sabiex jitjieb maż-żmien?
Ibni sett ta' xenarji b'mogħdijiet kuntenti, każijiet estremi, fallimenti tal-għodda, talbiet ambigwi, u tentattivi ta' injezzjoni fil-pront (stil OWASP). Ikklassifika riżultati bħas-suċċess tal-kompitu, il-ħin għat-tlestija, l-irkupru minn żbalji fl-għodda, u talbiet mingħajr evidenza. Kull meta tbiddel l-iskemi tal-għodda, il-prontijiet, l-irkupru, jew il-formattjar tal-memorja, erġa' ħaddem is-sett. Jekk ma tistax tittestjah, ma tistax tibgħatu b'mod affidabbli.
Kif nista' niskjerja aġent mingħajr ma nżid il-latenza u l-ispejjeż?
Mudell komuni huwa kontrollur mingħajr stat b'maħżen tal-istat estern (DB/Redis), servizzi ta' għodda warajh, u logging/monitoraġġ b'saħħtu (spiss OpenTelemetry). Ikkontrolla l-ispejjeż bil-caching tal-irkupru, sommarji tal-istat kompatti, mudelli iżgħar għar-rottaġġ/estrazzjoni, u limitazzjoni tal-"ħsieb profond" għall-aktar passi diffiċli. Uża kjuwijiet għal kompiti twal sabiex ma żżommx it-talbiet tal-web miftuħa. Dejjem inkludi kill switch.
Referenzi
-
Istitut Nazzjonali tal-Istandards u t-Teknoloġija (NIST) - NIST AI RMF 1.0 (affidabbiltà u trasparenza) - nvlpubs.nist.gov
-
OpenAI - Outputs Strutturati - platform.openai.com
-
OpenAI - Gwida għas-sejħa tal-funzjonijiet - platform.openai.com
-
OpenAI - Gwida għall-limiti tar-rata - platform.openai.com
-
OpenAI - Tmexxi l-API - platform.openai.com
-
OpenAI - Sejħa għall-funzjonijiet tal-Assistenti - platform.openai.com
-
LangChain - Dokumenti tal-Aġenti (JavaScript) - docs.langchain.com
-
LangChain - Dokumenti tal-Għodda (Python) - docs.langchain.com
-
LangChain - Ħarsa ġenerali lejn il-memorja - docs.langchain.com
-
arXiv - Dokument ta' ReAct (raġuni + att) - arxiv.org
-
arXiv - Dokument RAG - arxiv.org
-
Librerija tal-Bennejja tal-Amazon Web Services (AWS) - Timeouts, tentattivi mill-ġdid, u backoff b'jitter - aws.amazon.com
-
OpenTelemetry - Introduzzjoni għall-Osservabbiltà - opentelemetry.io
-
Stripe - Talbiet idempotenti - docs.stripe.com
-
Google Cloud - Strateġija ta' tentattiv mill-ġdid (backoff + jitter) - docs.cloud.google.com
-
OWASP - L-aqwa 10 għal Applikazzjonijiet ta' Mudelli ta' Lingwa Kbira - owasp.org
-
OWASP - Injezzjoni fil-Prompt LLM01 - genai.owasp.org
-
LlamaIndex - Introduzzjoni għall-RAG - developers.llamaindex.ai
-
Microsoft - Kernel Semantiku - learn.microsoft.com
-
Microsoft AutoGen - Qafas b'ħafna aġenti (dokumentazzjoni) - microsoft.github.io
-
CrewAI - Kunċetti tal-aġenti - docs.crewai.com
-
Haystack (deepset) - Dokumentazzjoni dwar ir-Retrievers - docs.haystack.deepset.ai