Qatt qgħadt hemm tobrox rasek, taħseb... minn fejn ġej dan l-għalf fil-fatt ? Jiġifieri, l-AI mhix tfittex f'munzelli ta' libreriji mimlija trab jew tara shorts ta' YouTube bil-moħbi. Madankollu b'xi mod toħroġ tweġibiet għal kollox - minn lasagna hacks għal fiżika ta' black hole - bħallikieku għandha xi kabinett tal-iffajljar bla qiegħ ġewwa. Ir-realtà hija aktar stramba, u forsi aktar intriganti milli taħseb. Ejja niżvelawha ftit (u iva, forsi nkissru xi ftit miti matul it-triq).
Hija Seħer? 🌐
Mhijiex xi ħaġa tas-seħer, għalkemm xi kultant tħossha hekk. Dak li qed jiġri taħt il-kappa huwa bażikament tbassir ta’ mudelli . Il-Mudelli L-Kbar tal-Lingwa (LLMs) ma jaħżnux fatti bil-mod kif moħħok iżomm ir-riċetta tal-gallettini tan-nanna tiegħek; minflok, huma mħarrġa biex jaħsbu l-kelma li jmiss (token) ibbażata fuq dak li ġie qabel [2]. Fil-prattika, dan ifisser li jaqbdu mar-relazzjonijiet: liema kliem imorru flimkien, kif is-sentenzi ġeneralment jieħdu l-forma, kif ideat sħaħ jinbnew bħal scaffolding. Huwa għalhekk li l-output jinstema’ tajjeb, anke jekk - onestament sħiħ - hija mimika statistika, mhux komprensjoni [4].
Allura x'inhu li fil-fatt jagħmel l-informazzjoni ġġenerata mill-AI utli ? Numru żgħir ta' affarijiet:
-
Diversità tad-dejta - ġbid minn għadd kbir ta' sorsi, mhux minn fluss wieħed dejqa.
-
Aġġornamenti - mingħajr ċikli ta' aġġornament, ma jibqax jaħdem malajr.
-
Iffiltrar - idealment jaqbad l-iskart qabel ma jidħol (għalkemm, ejja nkunu realisti, dik ix-xibka għandha toqob).
-
Verifika inkroċjata - tiddependi fuq sorsi ta' awtorità (aħseb fin-NASA, id-WHO, universitajiet ewlenin), li hija essenzjali fil-biċċa l-kbira tal-kotba tal-governanza tal-IA [3].
Xorta waħda, xi kultant tivvinta - b'kunfidenza. Dawk l-hekk imsejħa alluċinazzjonijiet ? Bażikament bla sens illustrat mogħti b'wiċċ serju [2][3].
Artikoli li forsi tixtieq taqra wara dan:
🔗 L-AI tista' tbassar in-numri tal-lotterija
Esplorazzjoni ta' miti u fatti dwar it-tbassir tal-lotterija bl-AI.
🔗 Xi tfisser li tieħu approċċ olistiku għall-IA
Nifhmu l-IA b'perspettivi bbilanċjati dwar l-etika u l-impatt.
🔗 X’tgħid il-Bibbja dwar l-intelliġenza artifiċjali
Eżami tal-perspettivi bibliċi dwar it-teknoloġija u l-ħolqien tal-bniedem.
Paragun Malajr: Minn Fejn Tiġbed l-AI 📊
Mhux kull sors huwa ugwali, iżda kull wieħed għandu rwol. Hawnhekk hawn ħarsa ġenerali.
| Tip ta' Sors | Min Jużah (AI) | Kost/Valur | Għaliex Jaħdem (jew ma Jaħdimx...) |
|---|---|---|---|
| Kotba u Artikoli | Mudelli lingwistiċi kbar | Prezzjuż (xi ftit) | Għarfien dens u strutturat - sempliċement jixjieħ malajr. |
| Websajts u Blogs | Kważi l-AIs kollha | Ħieles (bl-istorbju) | Varjetà selvaġġa; taħlita ta' brillanti u żibel assolut. |
| Dokumenti Akkademiċi | AIs li huma bbażati fuq ir-riċerka b'mod intensiv | Xi kultant paywall | Rigorożità + kredibilità, iżda mfassal b'ġargon tqil. |
| Dejta tal-Utent | AIs Personalizzati | Sensittiv ħafna ⚠️ | Ħjata preċiża, iżda uġigħ ta' ras kbir għall-privatezza. |
| Web f'Ħin Reali | AIs marbuta mat-tfittxija | B'xejn (jekk online) | Iżomm l-informazzjoni friska; l-iżvantaġġ huwa r-riskju ta' amplifikazzjoni tax-xnigħat. |
L-Univers tad-Data tat-Taħriġ 🌌
Din hija l-fażi tat-“tagħlim tat-tfulija”. Immaġina li tagħti lil tifel miljuni ta’ kotba tal-istejjer, qatgħat ta’ aħbarijiet, u rabbit toles tal-Wikipedija kollha f’daqqa. Hekk jidher it-taħriġ minn qabel. Fid-dinja reali, il-fornituri jgħaqqdu flimkien dejta disponibbli pubblikament, sorsi liċenzjati, u test iġġenerat mit-trejner [2].
F'saffi fuq nett: eżempji umani kkurati - tweġibiet tajbin, tweġibiet ħżiena, spinta fid-direzzjoni t-tajba - qabel ma jibda t-tisħiħ [1].
Twissija dwar it-trasparenza: il-kumpaniji ma jiżvelawx kull dettall. Xi guardrails huma sigrieti (IP, tħassib dwar is-sigurtà), għalhekk ikollok biss tieqa parzjali fit-taħlita attwali [2].
Tiftix f'Ħin Reali: It-Topping Extra 🍒
Xi mudelli issa jistgħu jitfaċċaw barra l-bużżieqa tat-taħriġ tagħhom. Din hija ġenerazzjoni awmentata bl-irkupru (RAG) - bażikament tiġbed biċċiet minn indiċi ħaj jew maħżen tad-dokumenti, imbagħad tinseġhom fit-tweġiba [5]. Perfetta għal affarijiet li jinbidlu malajr bħal aħbarijiet ewlenin jew prezzijiet tal-istokks.
Il-problema? L-internet huwa kemm ġenju kif ukoll żibel. Jekk il-filtri jew il-kontrolli tal-provenjenza huma dgħajfa, tirriskja li dejta mhux mixtieqa terġa' tidħol bil-moħbi - eżattament dak li jwissu dwaru l-oqfsa tar-riskju [3].
Soluzzjoni komuni: il-kumpaniji jgħaqqdu l-mudelli mad tagħhom stess , sabiex it-tweġibiet jiċċitaw politika attwali tal-HR jew dokument aġġornat tal-prodott minflok ma jimpressjonawh. Aħseb: inqas mumenti ta’ “uh-oh”, aktar tweġibiet affidabbli.
Irfinar: Il-Pass ta' Lustrar tal-AI 🧪
Mudelli mhux ipproċessati mħarrġa minn qabel huma goffi. Għalhekk jiġu rfinati :
-
Ngħallmuhom ikunu ta’ għajnuna, ma jagħmlux ħsara, u jkunu onesti (permezz ta’ tagħlim ta’ rinforz minn feedback uman, RLHF) [1].
-
Xkatlar ta' truf perikolużi jew tossiċi (allinjament) [1].
-
Aġġusta għat-ton - kemm jekk ikun amikevoli, formali, jew sarkastiku b'mod jilgħab.
Mhuwiex lustrar ta' djamant daqskemm qed tiġbed valanga statistika biex taġixxi aktar bħal sieħeb fil-konversazzjoni.
L-Intoppi u l-Falimenti 🚧
Ejja ma nippretendux li huwa bla difetti:
-
Alluċinazzjonijiet - tweġibiet ċari li huma żbaljati għalkollox [2][3].
-
Preġudizzju - jirrifletti mudelli inkorporati fid-dejta; jista' saħansitra jamplifikahom jekk ma jiġix ikkontrollat [3][4].
-
L-ebda esperjenza diretta - jista' jitkellem dwar riċetti tas-soppa imma qatt ma daq waħda [4].
-
Kunfidenza żejda - il-proża tiċċirkola bħallikieku taf, anke meta ma tkunx taf. L-oqfsa tar-riskju jenfasizzaw suppożizzjonijiet li jindikaw sinjali ta' twissija [3].
Għaliex Iħossok Bħallikieku Taf 🧠
M'għandu l-ebda twemmin, l-ebda memorja fis-sens uman, u ċertament l-ebda awto. Madankollu, minħabba li jgħaqqad is-sentenzi flimkien bla xkiel, moħħok jaqraha bħallikieku tifhem . Dak li qed jiġri huwa biss tbassir fuq skala massiva tat-token li jmiss : kalkolu ta' triljuni ta' probabbiltajiet fi frazzjonijiet ta' sekonda [2].
Il-vibrazzjoni tal-"intelliġenza" hija mġiba emerġenti - ir-riċerkaturi jsejħulha, b'mod daqsxejn ironiku, l- "pappagall stokastiku" [4].
Analogija Adattata għat-Tfal 🎨
Immaġina pappagall li qara kull ktieb fil-librerija. Ma jifhimx l-istejjer imma jista’ jbiddel il-kliem f’xi ħaġa li tħossha għaqlija. Kultant ikun preċiż; kultant ikun bla sens—imma b’biżżejjed stil, mhux dejjem tista’ tiddistingwi ruħek.
Konklużjoni: Minn Fejn Tiġi l-Informazzjoni tal-AI 📌
Fi kliem sempliċi:
-
Dejta massiva ta' taħriġ (pubblika + liċenzjata + iġġenerata minn trejner) [2].
-
Irfinar b'feedback uman biex jifforma t-ton/imġieba [1].
-
Sistemi ta' rkupru meta jkunu konnessi ma' flussi ta' dejta ħajjin [5].
L-AI ma "tkunx taf" l-affarijiet - tbassar it-test . Dik hija kemm is-superpotenza tagħha kif ukoll il-punt dgħajjef tagħha. Il-qofol tal-kwistjoni? Dejjem iċċekkja l-affarijiet importanti ma' sors affidabbli [3].
Referenzi
-
Ouyang, L. et al. (2022). Taħriġ ta' mudelli lingwistiċi biex isegwu struzzjonijiet b'feedback uman (InstructGPT) . arXiv .
-
OpenAI (2023). Rapport Tekniku tal-GPT-4 - taħlita ta' dejta liċenzjata, pubblika, u maħluqa mill-bniedem; objettiv u limitazzjonijiet tat-tbassir tat-token li jmiss. arXiv .
-
NIST (2023). Qafas għall-Ġestjoni tar-Riskju tal-AI (AI RMF 1.0) - provenjenza, affidabbiltà, u kontrolli tar-riskju. PDF .
-
Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Dwar il-Perikli tal-Pappagalli Stokastiċi: Jistgħu l-Mudelli tal-Lingwa jkunu Kbar Wisq? PDF .
-
Lewis, P. et al. (2020). Ġenerazzjoni Awmentata bl-Irkupru għal NLP Intensiva fl-Għarfien . arXiv .