Nga Cambridge te ChatGPT, të kuptuarit si Inteligjenca Artificiale ju jep kuptim fjalëve

113 563 lexime

124,178FansaPëlqeje

Frederik Aleksandër

 

Një nga problemet që IA duhet të zgjidhë ende sot është lidhja e simboleve – për shembull fjalët – me kuptimin e tyre, të ankoruara në botën reale – një problem i quajtur “ankorimi i simboleve”.

Për shembull, nëse them, “macja po fle në jastëkun e saj sepse është e lodhur”, shumica e qenieve njerëzore do ta kuptojnë lehtësisht se “ajo” i referohet “mace” dhe jo “jastëk”. Ky quhet arsyetim me sens të përbashkët.

Nga ana tjetër, si mund ta bëjë një IA këtë analizë?

Teknika e njohur si “ngulitje leksikore”, nëse nuk e zgjidh të gjithë problemin, megjithatë ofron një zgjidhje me efektivitet të jashtëzakonshëm. Është e rëndësishme të njihni parimet e kësaj teknike, sepse është ajo që përdoret në modelet më të fundit të IA, duke përfshirë ChatGPT… dhe është e ngjashme me teknikat e përdorura nga Cambridge Analytica për shembull.

Përfshirja leksikore, ose si sistemet e inteligjencës artificiale lidhin fjalë të përafërta.

Kjo teknikë konsiston në zëvendësimin e një fjale (e cila mund të shihet si një simbol abstrakt, i pamundur të lidhet drejtpërdrejt me kuptimin e saj) me një vektor numerik (një listë numrash). Vini re se ky kalim në dixhital do të thotë që ky përfaqësim mund të përdoret drejtpërdrejt nga rrjetet nervore dhe të përfitojë nga kapacitetet e tyre të të mësuarit.

Më konkretisht, këto rrjete nervore, nga korpuse shumë të mëdha tekstesh, do të mësojnë të zhytin një fjalë në një hapësirë ​​dixhitale me dimensione të mëdha (zakonisht 300) ku secili dimension llogarit probabilitetin e shfaqjes së kësaj fjale në kontekste të caktuara.

Për ta thjeshtuar, ne zëvendësojmë, për shembull, paraqitjen simbolike të fjalës “mace” me 300 numra që përfaqësojnë probabilitetin për të gjetur këtë fjalë në 300 lloje të ndryshme kontekstesh (tekst historik, tekst kafshësh, tekst teknologjik, etj.) ose bashkë- dukuri me fjalë të tjera (veshë, mustaqe ose aeroplan).

Zhytja në një oqean fjalësh dhe identifikimi i atyre që përdoren së bashku është një nga fazat e të mësuarit për ChatGPT.

Edhe nëse kjo qasje mund të duket shumë e dobët, megjithatë ajo ka një interes të madh në dimensionet e mëdha: kodon fjalë, kuptimi i të cilave është afër me vlera numerike të afërta. Kjo bën të mundur përcaktimin e nocioneve të afërsisë dhe distancës për të krahasuar kuptimin e simboleve, që është hapi i parë drejt kuptimit të tyre.

Për të dhënë një intuitë të fuqisë së teknikave të tilla (në fakt, të fuqisë së statistikave me dimensione të mëdha), le të marrim një shembull për të cilin kemi dëgjuar shumë.

Lidhja e tipareve psikologjike të përdoruesve të internetit me “pëlqimet” e tyre falë statistikave në shkallë të gjerë

Është në të vërtetë me një qasje të ngjashme që kompanitë si Cambridge Analytica kanë qenë në gjendje të ndikojnë në zhvillimin e zgjedhjeve duke mësuar të lidhin preferencat elektorale (përfaqësimet simbolike) me kontekste të ndryshme të përdorimeve dixhitale (statistikat e marra nga faqet e përdoruesve në Facebook).

Metodat e tyre bazohen në një publikim shkencor të botuar në vitin 2014 në revistën PNAS, i cili krahasoi gjykimet njerëzore dhe gjykimet e nxjerra nga statistikat në profilet e Facebook.

Eksperimenti i raportuar në këtë publikim u kërkoi pjesëmarrësve të përcaktonin disa nga tiparet e tyre psikologjike (a janë të ndërgjegjshëm, ekstrovertë, etj.), duke u dhënë atyre etiketa simbolike.

Ato mund të përfaqësoheshin edhe nga etiketat dixhitale duke numëruar “pëlqimet” që kishin vendosur në Facebook për tema të ndryshme (sport, kohë të lirë, kinema, gatim, etj.). Më pas, përmes statistikave në këtë hapësirë ​​të madhe dixhitale, mund të mësojmë të lidhim vende të caktuara në këtë hapësirë ​​me tipare të caktuara psikologjike.

Më pas, për një temë të re, vetëm duke parë profilin e tij në Facebook, mund të shihnim se në cilën pjesë të kësaj hapësire ishte dhe si rrjedhim me çfarë tiparesh psikologjike është më afër. Ky parashikim mund të krahasohet edhe me atë që dinë të afërmit e tij për këtë temë.

Lexo edhe :  Sa kushton shkollimi i fëmijëve në privat?/ Numbeo: Shqipëria ndër vendet më të lira

Rezultati kryesor i këtij botimi është se, nëse i japim vetes mjetet (në një hapësirë ​​mjaft të madhe, me mjaft “pëlqime” për të mbledhur dhe me shembuj të mjaftueshëm, këtu më shumë se 70,000 subjekte), gjykimi statistikor mund të jetë më i saktë se gjykimi njerëzor. Me 10 “pëlqime”, ne dimë më shumë për ju sesa kolegu juaj i zyrës; 70 “pëlqime” si miqtë tuaj; 275 “pëlqime” se bashkëshorti juaj.

 

Jini të vetëdijshëm se çfarë thonë “pëlqimet” tona për ne

Ky publikim na lajmëron faktin se, kur kontrollojmë tregues të ndryshëm në numër të madh, jemi shumë të parashikueshëm dhe për këtë arsye duhet të jemi të kujdesshëm kur lëmë gjurmë në rrjetet sociale, sepse ato mund të na japin rekomandime apo reklama. Shfrytëzimi i teknikave të tilla është gjithashtu burimi kryesor i të ardhurave për shumë lojtarë në internet.

Pëlqimet tona dhe reagimet e tjera në rrjetet sociale thonë shumë për ne dhe ky informacion mund të përdoret për qëllime reklamimi ose për fushata influencimi.

Cambridge Analytica shkoi një hap më tej duke vjedhur profilet në Facebook të miliona amerikanëve dhe duke mësuar të lidhin “pëlqimet” e tyre me preferencat e tyre elektorale, në mënyrë që të synojë më mirë fushatat elektorale amerikane. Teknika të tilla u përdorën edhe gjatë votimit të Brexit, gjë që konfirmoi efektivitetin e tyre.

Vini re, se është vetëm aspirata e paligjshme e profileve në Facebook ajo që është qortuar nga gjykatat, e cila duhet të vazhdojë të na bëjë të dyshojmë për gjurmët që lëmë në internet.

Llogaritni me fjalë duke marrë parasysh kuptimin e tyre

Duke shfrytëzuar të njëjtën fuqi të statistikave me dimensione të medha, teknikat e ngulitjes leksikore përdorin korpuse të mëdha tekstesh të disponueshme në internet (Wikipedia, libra të dixhitalizuar, rrjete sociale) për të lidhur fjalët me probabilitetin e tyre të shfaqjes në kontekste të ndryshme, domethënë në lloje të ndryshme kontekstesh.

Siç e pamë më lart, kjo bën të mundur që afërsia në këtë hapësirë ​​me dimensione të mëdha të konsiderohet si ngjashmëri semantike dhe për rrjedhojë të llogaritet me fjalë duke marrë parasysh kuptimin e tyre.

Një shembull klasik që raportohet është të merret një vektor numerik që përfaqëson fjalën mbret, të zbritet prej tij vektori (me të njëjtën madhësi sepse raporton probabilitetet e ndodhjes në të njëjtat kritere) që përfaqëson fjalën njeri, për t’i shtuar atij vektorin. që përfaqëson fjalën grua, për të marrë një vektor shumë të afërt me atë që përfaqëson fjalën mbretëreshë.

Me fjalë të tjera, ne kemi arritur të mësojmë një marrëdhënie semantike të tipit “A është me B, çfarë është C me D”.

Parimi i miratuar këtu për të përcaktuar një semantikë është se dy fjalë të ngjashme përdoren në të njëjtat kontekste: ne flasim për “semantikë shpërndarëse”.

Është ky parim i kodimit të fjalëve që përdor ChatGPT, të cilit i shton teknika të tjera.

Ky kodim shpesh e lejon atë të përdorë fjalët në një mënyrë përkatëse; gjithashtu ndonjëherë e çon atë në gabime të rënda të quajtura halucinacione, ku ai duket se shpik fakte të reja.

ChatGPTKy është rasti, për shembull, kur pyetet se si të dallohen vezët e pulës nga vezët e lopës dhe ai përgjigjet se këto të fundit janë më të mëdha. Por a është vërtet e habitshme kur e dini se si kodon kuptimin e simboleve që manipulon?

Nga ky kënd, ai i përgjigjet mirë pyetjes që i bëjmë, ashtu siç mund të na thotë, nëse e pyesim, se lopët janë gjitarë dhe nuk bëjnë vezë. Problemi i vetëm është se, të mahnitur nga cilësia e bisedave të tij, mendojmë se ai ka një arsyetim të shëndoshë të ngjashëm me tonin: se ai “kupton” si ne, ndërsa ajo që kupton është vetëm rezultat i këtyre statistikave me dimensione të larta.

Të fundit

Komedia “Ëndërr në Papafingo” e regjisorit Leka Bungo shfaqet në Teatrin Skampa

Komedia e shkruar dhe me regji të Leka Bungos “Ëndërr në Papafingo” u ngjit në skenën e Teatrit Skampa...

Katër teknika të rregullimit emocional

Të dini se si të menaxhoni emocionet tuaja është një aftësi kyçe që mund të përmirësojë cilësinë e jetës suaj. Në këtë artikull, zbuloni...

“Do të zhduket prapë nëse…”/ Çfarë po ndodh me Parashqevi Simakun?

Biznesmeni Elton Ilirjani, ka bërë me dije se prej dy javësh, këngëtarja Parashqevi Simaku, ndodhet në spital psikiatrik. Ai ka rrfëyer se pas takimit...

Plas goma teksa po e ndërronte, plagoset rëndë shoferi i trajlerit në Fier (EMRI)

Një ngjarje e pazakontë ka ndodhur pak minuta më parë në aksin Fier- Patos, pranë Drejtorisë së Policisë. Drejtuesi i një mjeti të tonazhit...

Krerët e UÇK votojnë në Hagë/ Gjykata: Do ushtrojnë të drejtën për zgjedhjet në Kosovë

Hashim Thaçi, Jakup Krasniqi, Kadri Veseli e Rexhep Selimi do te kene mundesi te votojne per zgjedhjet e 9 shkurtit. Lajmi eshte bere i ditur...

Lajme të tjera

Web TV