Minn fejn l-AI tikseb l-informazzjoni

Minn fejn l-AI tikseb l-informazzjoni tagħha?

Qatt qgħadt hemm tobrox rasek, taħseb... minn fejn ġej dan l-għalf fil-fatt ? Jiġifieri, l-AI mhix tfittex f'munzelli ta' libreriji mimlija trab jew tara shorts ta' YouTube bil-moħbi. Madankollu b'xi mod toħroġ tweġibiet għal kollox - minn lasagna hacks għal fiżika ta' black hole - bħallikieku għandha xi kabinett tal-iffajljar bla qiegħ ġewwa. Ir-realtà hija aktar stramba, u forsi aktar intriganti milli taħseb. Ejja niżvelawha ftit (u iva, forsi nkissru xi ftit miti matul it-triq).


Hija Seħer? 🌐

Mhijiex xi ħaġa tas-seħer, għalkemm xi kultant tħossha hekk. Dak li qed jiġri taħt il-kappa huwa bażikament tbassir ta’ mudelli . Il-Mudelli L-Kbar tal-Lingwa (LLMs) ma jaħżnux fatti bil-mod kif moħħok iżomm ir-riċetta tal-gallettini tan-nanna tiegħek; minflok, huma mħarrġa biex jaħsbu l-kelma li jmiss (token) ibbażata fuq dak li ġie qabel [2]. Fil-prattika, dan ifisser li jaqbdu mar-relazzjonijiet: liema kliem imorru flimkien, kif is-sentenzi ġeneralment jieħdu l-forma, kif ideat sħaħ jinbnew bħal scaffolding. Huwa għalhekk li l-output jinstema’ tajjeb, anke jekk - onestament sħiħ - hija mimika statistika, mhux komprensjoni [4].

Allura x'inhu li fil-fatt jagħmel l-informazzjoni ġġenerata mill-AI utli ? Numru żgħir ta' affarijiet:

  • Diversità tad-dejta - ġbid minn għadd kbir ta' sorsi, mhux minn fluss wieħed dejqa.

  • Aġġornamenti - mingħajr ċikli ta' aġġornament, ma jibqax jaħdem malajr.

  • Iffiltrar - idealment jaqbad l-iskart qabel ma jidħol (għalkemm, ejja nkunu realisti, dik ix-xibka għandha toqob).

  • Verifika inkroċjata - tiddependi fuq sorsi ta' awtorità (aħseb fin-NASA, id-WHO, universitajiet ewlenin), li hija essenzjali fil-biċċa l-kbira tal-kotba tal-governanza tal-IA [3].

Xorta waħda, xi kultant tivvinta - b'kunfidenza. Dawk l-hekk imsejħa alluċinazzjonijiet ? Bażikament bla sens illustrat mogħti b'wiċċ serju [2][3].

Artikoli li forsi tixtieq taqra wara dan:

🔗 L-AI tista' tbassar in-numri tal-lotterija
Esplorazzjoni ta' miti u fatti dwar it-tbassir tal-lotterija bl-AI.

🔗 Xi tfisser li tieħu approċċ olistiku għall-IA
Nifhmu l-IA b'perspettivi bbilanċjati dwar l-etika u l-impatt.

🔗 X’tgħid il-Bibbja dwar l-intelliġenza artifiċjali
Eżami tal-perspettivi bibliċi dwar it-teknoloġija u l-ħolqien tal-bniedem.


Paragun Malajr: Minn Fejn Tiġbed l-AI 📊

Mhux kull sors huwa ugwali, iżda kull wieħed għandu rwol. Hawnhekk hawn ħarsa ġenerali.

Tip ta' Sors Min Jużah (AI) Kost/Valur Għaliex Jaħdem (jew ma Jaħdimx...)
Kotba u Artikoli Mudelli lingwistiċi kbar Prezzjuż (xi ftit) Għarfien dens u strutturat - sempliċement jixjieħ malajr.
Websajts u Blogs Kważi l-AIs kollha Ħieles (bl-istorbju) Varjetà selvaġġa; taħlita ta' brillanti u żibel assolut.
Dokumenti Akkademiċi AIs li huma bbażati fuq ir-riċerka b'mod intensiv Xi kultant paywall Rigorożità + kredibilità, iżda mfassal b'ġargon tqil.
Dejta tal-Utent AIs Personalizzati Sensittiv ħafna ⚠️ Ħjata preċiża, iżda uġigħ ta' ras kbir għall-privatezza.
Web f'Ħin Reali AIs marbuta mat-tfittxija B'xejn (jekk online) Iżomm l-informazzjoni friska; l-iżvantaġġ huwa r-riskju ta' amplifikazzjoni tax-xnigħat.

L-Univers tad-Data tat-Taħriġ 🌌

Din hija l-fażi tat-“tagħlim tat-tfulija”. Immaġina li tagħti lil tifel miljuni ta’ kotba tal-istejjer, qatgħat ta’ aħbarijiet, u rabbit toles tal-Wikipedija kollha f’daqqa. Hekk jidher it-taħriġ minn qabel. Fid-dinja reali, il-fornituri jgħaqqdu flimkien dejta disponibbli pubblikament, sorsi liċenzjati, u test iġġenerat mit-trejner [2].

F'saffi fuq nett: eżempji umani kkurati - tweġibiet tajbin, tweġibiet ħżiena, spinta fid-direzzjoni t-tajba - qabel ma jibda t-tisħiħ [1].

Twissija dwar it-trasparenza: il-kumpaniji ma jiżvelawx kull dettall. Xi guardrails huma sigrieti (IP, tħassib dwar is-sigurtà), għalhekk ikollok biss tieqa parzjali fit-taħlita attwali [2].


Tiftix f'Ħin Reali: It-Topping Extra 🍒

Xi mudelli issa jistgħu jitfaċċaw barra l-bużżieqa tat-taħriġ tagħhom. Din hija ġenerazzjoni awmentata bl-irkupru (RAG) - bażikament tiġbed biċċiet minn indiċi ħaj jew maħżen tad-dokumenti, imbagħad tinseġhom fit-tweġiba [5]. Perfetta għal affarijiet li jinbidlu malajr bħal aħbarijiet ewlenin jew prezzijiet tal-istokks.

Il-problema? L-internet huwa kemm ġenju kif ukoll żibel. Jekk il-filtri jew il-kontrolli tal-provenjenza huma dgħajfa, tirriskja li dejta mhux mixtieqa terġa' tidħol bil-moħbi - eżattament dak li jwissu dwaru l-oqfsa tar-riskju [3].

Soluzzjoni komuni: il-kumpaniji jgħaqqdu l-mudelli mad tagħhom stess , sabiex it-tweġibiet jiċċitaw politika attwali tal-HR jew dokument aġġornat tal-prodott minflok ma jimpressjonawh. Aħseb: inqas mumenti ta’ “uh-oh”, aktar tweġibiet affidabbli.


Irfinar: Il-Pass ta' Lustrar tal-AI 🧪

Mudelli mhux ipproċessati mħarrġa minn qabel huma goffi. Għalhekk jiġu rfinati :

  • Ngħallmuhom ikunu ta’ għajnuna, ma jagħmlux ħsara, u jkunu onesti (permezz ta’ tagħlim ta’ rinforz minn feedback uman, RLHF) [1].

  • Xkatlar ta' truf perikolużi jew tossiċi (allinjament) [1].

  • Aġġusta għat-ton - kemm jekk ikun amikevoli, formali, jew sarkastiku b'mod jilgħab.

Mhuwiex lustrar ta' djamant daqskemm qed tiġbed valanga statistika biex taġixxi aktar bħal sieħeb fil-konversazzjoni.


L-Intoppi u l-Falimenti 🚧

Ejja ma nippretendux li huwa bla difetti:

  • Alluċinazzjonijiet - tweġibiet ċari li huma żbaljati għalkollox [2][3].

  • Preġudizzju - jirrifletti mudelli inkorporati fid-dejta; jista' saħansitra jamplifikahom jekk ma jiġix ikkontrollat ​​[3][4].

  • L-ebda esperjenza diretta - jista' jitkellem dwar riċetti tas-soppa imma qatt ma daq waħda [4].

  • Kunfidenza żejda - il-proża tiċċirkola bħallikieku taf, anke meta ma tkunx taf. L-oqfsa tar-riskju jenfasizzaw suppożizzjonijiet li jindikaw sinjali ta' twissija [3].


Għaliex Iħossok Bħallikieku Taf 🧠

M'għandu l-ebda twemmin, l-ebda memorja fis-sens uman, u ċertament l-ebda awto. Madankollu, minħabba li jgħaqqad is-sentenzi flimkien bla xkiel, moħħok jaqraha bħallikieku tifhem . Dak li qed jiġri huwa biss tbassir fuq skala massiva tat-token li jmiss : kalkolu ta' triljuni ta' probabbiltajiet fi frazzjonijiet ta' sekonda [2].

Il-vibrazzjoni tal-"intelliġenza" hija mġiba emerġenti - ir-riċerkaturi jsejħulha, b'mod daqsxejn ironiku, l- "pappagall stokastiku" [4].


Analogija Adattata għat-Tfal 🎨

Immaġina pappagall li qara kull ktieb fil-librerija. Ma jifhimx l-istejjer imma jista’ jbiddel il-kliem f’xi ħaġa li tħossha għaqlija. Kultant ikun preċiż; kultant ikun bla sens—imma b’biżżejjed stil, mhux dejjem tista’ tiddistingwi ruħek.


Konklużjoni: Minn Fejn Tiġi l-Informazzjoni tal-AI 📌

Fi kliem sempliċi:

  • Dejta massiva ta' taħriġ (pubblika + liċenzjata + iġġenerata minn trejner) [2].

  • Irfinar b'feedback uman biex jifforma t-ton/imġieba [1].

  • Sistemi ta' rkupru meta jkunu konnessi ma' flussi ta' dejta ħajjin [5].

L-AI ma "tkunx taf" l-affarijiet - tbassar it-test . Dik hija kemm is-superpotenza tagħha kif ukoll il-punt dgħajjef tagħha. Il-qofol tal-kwistjoni? Dejjem iċċekkja l-affarijiet importanti ma' sors affidabbli [3].


Referenzi

  1. Ouyang, L. et al. (2022). Taħriġ ta' mudelli lingwistiċi biex isegwu struzzjonijiet b'feedback uman (InstructGPT) . arXiv .

  2. OpenAI (2023). Rapport Tekniku tal-GPT-4 - taħlita ta' dejta liċenzjata, pubblika, u maħluqa mill-bniedem; objettiv u limitazzjonijiet tat-tbassir tat-token li jmiss. arXiv .

  3. NIST (2023). Qafas għall-Ġestjoni tar-Riskju tal-AI (AI RMF 1.0) - provenjenza, affidabbiltà, u kontrolli tar-riskju. PDF .

  4. Bender, EM, Gebru, T., McMillan-Major, A., Mitchell, S. (2021). Dwar il-Perikli tal-Pappagalli Stokastiċi: Jistgħu l-Mudelli tal-Lingwa jkunu Kbar Wisq? PDF .

  5. Lewis, P. et al. (2020). Ġenerazzjoni Awmentata bl-Irkupru għal NLP Intensiva fl-Għarfien . arXiv .


Sib l-Aħħar AI fil-Ħanut Uffiċjali tal-Assistent tal-AI

Dwarna

Lura għall-blogg