4 Llojet e Inteligjencës Artificiale gjeneruese që po transformojnë botën tonë

113 563 lexime

124,178FansaPëlqeje

Bernard Marr

Termi inteligjencë artificiale gjeneruese i referohet një fushe relativisht të re të AI që mund të krijojë përmbajtje të ngjashme me njerëzit, nga fotografitë dhe videot te poezia dhe madje edhe kodi kompjuterik. Për të arritur këtë, përdoren disa teknika të ndryshme.

Këto kanë evoluar kryesisht gjatë 10 viteve të fundit, duke u mbështetur në punën e mëparshme të kryer në fushat e të mësuarit të thellë, modeleve të transformatorëve dhe rrjeteve nervore. Të gjithë ata mbështeten në të dhëna për të “mësuar” në mënyrë efektive se si të gjenerojnë përmbajtje, por përtej kësaj, ato janë ndërtuar rreth metodologjive mjaft të ndryshme. Këtu është përmbledhja ime e disa prej kategorive në të cilat ata bëjnë pjesë, si dhe lloji i përmbajtjes që mund të përdoren për të krijuar.

 

Modele të mëdha gjuhësore – Modelet e gjuhëve të mëdha (LLM) janë teknologjia themelore pas mjeteve të reja gjeneruese të AI si ChatGPT, Claude dhe Google Gemini. Në thelb, ato janë rrjete nervore që trajnohen në sasi të mëdha të të dhënave tekstuale, duke i lejuar ata të mësojnë marrëdhëniet midis fjalëve dhe më pas të parashikojnë fjalën tjetër që duhet të shfaqet në çdo sekuencë të caktuar fjalësh.

Ata më pas mund të trajnohen më tej në tekste specifike që lidhen me fusha të specializuara – të njohura si ‘rregullim i imët’ për t’i mundësuar ata të kryejnë detyra specifike. Fjalët ndahen në “shenja”, të cilat mund të jenë fjalë të vogla, individuale, pjesë të fjalëve më të gjata ose kombinime parashtesash, prapashtesash dhe elementësh të tjerë gjuhësorë që shfaqen shpesh së bashku në tekst. Procesi matematikor i transformimit të matricës përdoret më pas për t’i kthyer ato në të dhëna numerike të strukturuara që mund të analizohen nga kompjuterët.

Përveç krijimit të tekstit dhe kodit kompjuterik, LLM-të kanë bërë të mundur që kompjuterët të kuptojnë hyrjet e gjuhës natyrore për shumë detyra, duke përfshirë përkthimin e gjuhës, analizën e ndjenjave dhe forma të tjera të AI gjeneruese si tekst në imazh ose tekst në zë. Sidoqoftë, përdorimi i tyre ka krijuar shqetësime etike rreth paragjykimeve, halucinacioneve të AI, keqinformimit, falsifikimit të thellë dhe përdorimit të pronësisë intelektuale për të trajnuar algoritmet.

 

Modelet e Difuzionit – Modelet e difuzionit përdoren gjerësisht në gjenerimin e imazheve dhe videove, dhe funksionojnë nëpërmjet një procesi të njohur si “denoising iterativ”. Duke u nisur nga një mesazh teksti, të cilin kompjuteri mund ta përdorë për të kuptuar se çfarë duhet të krijojë një imazh, krijohet “zhurma” e rastësishme – mund ta mendoni këtë si fillimi i vizatimit të një fotografie duke shkarravitur rastësisht në një copë letër.

Gradualisht, shkarravitjet më pas rafinohen, duke përdorur të dhënat e trajnimit për të kuptuar se cilat veçori duhet të përfshihen në imazhin përfundimtar. Në çdo hap, “zhurma” hiqet ndërsa imazhi rregullohet gradualisht për të përfshirë karakteristikat e dëshiruara.

Përfundimisht, kjo çon në krijimin e një imazhi krejtësisht të ri që përputhet me kërkesën e tekstit, por nuk është gjetur tashmë në të dhënat e trajnimit. Duke ndjekur këtë proces, modelet më të avancuara të difuzionit të sotëm, si Stable Diffusion dhe Dall-E, mund të krijojnë imazhe fotorealiste, si dhe imazhe që imitojnë piktura dhe vizatime të çdo stili. Për më tepër, ata janë gjithnjë e më shumë në gjendje të gjenerojnë video, siç është demonstruar së fundmi nga modeli novator Sora i OpenAI.

 

Rrjetet kundërshtare gjeneruese – Rrjetet Generative Adversarial (GANs) u shfaqën në 2014 dhe u bënë shpejt një nga modelet më efektive për gjenerimin e përmbajtjes sintetike, si tekst ashtu edhe imazhe. Parimi bazë përfshin vendosjen e dy algoritmeve të ndryshme kundër njëri-tjetrit. Njëri njihet si ‘gjenerator’ dhe tjetri njihet si ‘diskriminues’ dhe të dyve u jepet detyra që të bëhen gjithnjë e më të mirë për të larguar njëri-tjetrin.

Lexo edhe :  Dështoi në Bundesligë, ylli i Portugalisë pranon shitjen për hir të... Botërorit

Gjeneruesi përpiqet të krijojë përmbajtje realiste, dhe diskriminuesi përpiqet të përcaktojë nëse është e vërtetë apo jo. Secili mëson nga tjetri, duke u bërë gjithnjë e më i mirë në punën e tij derisa gjeneruesi të dijë se si të krijojë përmbajtje që është sa më afër të jetë e mundur për të qenë “reale”. ChatGPT dhe Dall-E, GAN-et ende konsiderohen si mjete të gjithanshme dhe të fuqishme për gjenerimin e fotografive, videove, tekstit dhe zërit, dhe përdoren gjerësisht për vizionin kompjuterik dhe detyrat e përpunimit të gjuhës natyrore.

Fushat e rrezatimit nervor – Fushat e rrezatimit nervor (NeRF) janë teknologjia më e re e mbuluar këtu, e cila doli  në skenë vetëm në vitin 2020. Ndryshe nga teknologjitë e tjera gjeneruese, ato përdoren posaçërisht për të krijuar përfaqësime të objekteve 3D duke përdorur mësimin e thellë. Kjo nënkupton krijimin e një aspekti të një imazhi që nuk mund të shihet nga ‘kamera’ – për shembull, një objekt në sfondin e një imazhi që errësohet nga një objekt në plan të parë ose aspekti i pasmë i një objekti që është fotografuar nga pjesën e përparme. Kjo bëhet duke parashikuar elementë të tillë si vetitë vëllimore të objekteve dhe duke i hartuar ato në koordinatat hapësinore 3D, duke përdorur rrjetet nervore për të modeluar gjeometrinë dhe vetitë si reflektimi i dritës rreth një objekti. Kjo lejon, për shembull, që një imazh dydimensional i një objekti – të themi, një ndërtesë ose një pemë – të rikrijohet si një paraqitje tredimensionale që mund të shihet nga çdo kënd. Kjo teknikë, e nisur nga Nvidia, po përdoret për të krijuar botë 3D që mund të eksplorohen në simulime dhe video lojëra, si dhe për të vizualizuar robotikën, arkitekturën dhe planifikimin urban.

 

Modelet hibride në AI gjeneruese – Një nga përparimet më të fundit në fushën e AI gjeneruese është zhvillimi i modeleve hibride, të cilat kombinojnë teknika të ndryshme për të krijuar sisteme inovative të gjenerimit të përmbajtjes. Këto modele bazohen në pikat e forta të qasjeve të ndryshme, të tilla si përzierja e trajnimit kundërshtar të Rrjeteve Gjeneruese Kundërshtare (GAN) me pastrimin përsëritës të modeleve të difuzionit për të prodhuar rezultate më të rafinuara dhe realiste.

Duke integruar Modelet e Mëdha të Gjuhës (LLM) me rrjetet e tjera nervore, modelet hibride mund të ofrojnë kontekst dhe përshtatshmëri të zgjeruar, duke çuar në rezultate më të sakta dhe më të rëndësishme në kontekst. Kjo qasje hibride hap mundësi të reja për aplikacione si gjenerimi i tekstit në imazh, ku bashkimi i teknikave të ndryshme gjeneruese çon në rezultate më komplekse dhe të larmishme, si dhe në mjedise virtuale të përmirësuara.

Për shembull, AlphaCode i DeepMind kombinon fuqinë e Modeleve të Mëdha të Gjuhës (LLM) me mësimin përforcues për të gjeneruar kod kompjuterik me cilësi të lartë, duke demonstruar shkathtësinë e qasjeve hibride në zhvillimin e softuerit. Një shembull tjetër është CLIP i OpenAI, i cili bashkon aftësitë e njohjes së tekstit dhe imazhit për të krijuar modele më të sakta tekst-në-imazh. CLIP mund të kuptojë marrëdhëniet komplekse midis tekstit dhe imazheve, duke e lejuar atë të funksionojë në aplikacione të ndryshme gjeneruese.

AI gjeneruese po zhvillohet vazhdimisht, me metodologji dhe aplikacione të reja që shfaqen rregullisht. Ndërsa fusha vazhdon të rritet, ne mund të presim të shohim qasje edhe më inovative që ndërthurin teknika të ndryshme për të krijuar sisteme të avancuara të AI. Dekada e ardhshme ka të ngjarë të sjellë aplikacione novatore që do të transformojnë industritë dhe do të riformësojnë mënyrën se si ndërveprojmë me teknologjinë.

Të fundit

Ekipet shqiptare në Europë: Egnatia dominon, fiton edhe Drita e Kosovës

Egnatia fitoi sot 1-0 në nisjen e rrugëtimit të saj në UEFA Champions League. Kampionët e Shqipërisë u përballën...

“Arrestuat ketrin, jo klientët e Epstein”/ Elon Musk shpërthen kundër Trump

Elon Musk ka ndezur një valë të re polemikash pas një postimi të ashpër dhe ironik në platformën e tij X (ish-Twitter), ku sulmoi...

Merkato, Igli Tare po ndjek dy emra në kampionatin anglez

Milan synon të përforcohet jo vetëm në mesfushë këtë merkato ku po ndiqen emra si Granit Xhaka, Ardon Jashari, Javi Guerra e ndonjë tjetër,...

“Salianji është kurban i Berishës, ai është i përdorur”

Pas 9 muaj e gjysmë në burgun e Fierit ish-deputeti i Partisë Demokratike, Ervin Salianji i cili u dënua për kallëzim të rremë, si...

Ardian Ismaji ndryshon ekip, zyrtarizohet te Torino!

Futbollisti nga Kosova që luan për kombëtaren e Shqipërisë, Ardian Ismajli është bërë me skuadër të re. Mbrojtësi shqiptar është prezantuar te skuadra e...

Lajme të tjera

Web TV