Kompania e re Sapient Intelligence nga Singapori ka njoftuar se ka një qëllim ambicioz – të arrijë atë që shumë e konsiderojnë Graalin e Shenjtë të inteligjencës artificiale: inteligjencën e përgjithshme artificiale (AGI) që do të arrinte dhe tejkalonte inteligjencën njerëzore.
Më pak investime, por më mirë se të tjerët
Për ta arritur këtë, në vend që të ndërtonin modele gjuhësore (LLM) gjithnjë e më të mëdha si GPT-4, GPT-4o, Claude 3, Gemini, LLaMA 3, DeepSeek R1, etj., ata vendosën të ndiqnin një rrugë tjetër. Ata hartuan të ashtuquajturin Model të Arsyetimit Hierarkik (HRM), një sistem i frymëzuar nga mënyra se si truri i njeriut përpunon informacionin.
Sipas një studimi të publikuar në platformën ArXiv , HRM-ja e re, me vetëm 27 milionë parametra, të trajnuar vetëm në një mijë shembuj, pa asnjë trajnim paraprak, i tejkalon modelet shumë më të mëdha si OpenAI o3-mini, Claude 3.7 8K ose DeepSeek R1 në zgjidhjen e detyrave komplekse të inferencës.
Ekip shumë me përvojë
Sapient Intelligence nuk është një startup i zakonshëm. Ekipi i saj përfshin ish-studiues nga DeepMind, DeepSeek, Anthropic dhe xAI të Google, si dhe shkencëtarë nga universitetet më të mira. Është një grup njerëzish që kanë punuar tashmë në projektet më të përparuara të IA-së sot, dhe tani kanë vendosur të provojnë një rrugë krejtësisht të ndryshme së bashku.
Themeluesi dhe drejtori ekzekutiv i saj, Guan Wang, në një përpjekje për të shpjeguar qëllimet e startup-it, thotë se ideja pas IAG-së është që makinat të arrijnë nivele njerëzore të inteligjencës dhe përfundimisht diçka më shumë.
“Zinxhiri i Mendimit, mënyra se si funksionojnë modelet e sotme, është thjesht një truk për të luajtur me probabilitetet. Ne filluam nga e para, të frymëzuar nga truri, sepse natyra e ka përsosur dizajnin e saj për miliarda vjet. Modeli ynë mendon dhe arsyeton si një njeri, jo vetëm duke llogaritur probabilitetet. Ne besojmë se do të arrijë dhe më pas do ta tejkalojë inteligjencën njerëzore, dhe atëherë diskutimi rreth IAG-së do të bëhet real”, shpjegon Wang.
Si e imiton HRM trurin e njeriut?
Truri i njeriut nuk është thjesht një koleksion neuronesh; është një sistem i ndarë në module funksionale. HRM përpiqet të imitojë dy qendra kryesore të trurit: korteksin prefrontal dhe ganglionet bazale.
Korteksi prefrontal ndodhet në pjesën e përparme të trurit dhe shoqërohet me të menduarit abstrakt, planifikimin dhe kontrollin e impulseve. Është pjesa e trurit që na lejon të mendojmë përpara, të shqyrtojmë pasojat dhe të zgjedhim strategjinë më të mirë. Në HRM, këtë rol e luan i ashtuquajturi rrjet rekurrent i nivelit të lartë, i cili planifikon ngadalë dhe në mënyrë abstrakte, përcakton drejtimin e mendimit dhe ndjek qëllimin global.
Pjesa e dytë e trurit të njeriut përbëhet nga ganglionet bazale, një grup bërthamash të thella përgjegjëse për reagime të shpejta dhe automatike, për koordinimin e lëvizjeve, por edhe për marrjen e vendimeve që përsëriten dhe kryhen pa shumë mendim të vetëdijshëm. Në HRM, rolin e tyre e merr përsipër i ashtuquajturi rrjet i nivelit të ulët, i cili përpunon shpejt dhe tërësisht detyra specifike, rregullon veprimet dhe merr vendime intuitive (grafiku më poshtë).
Një organizim i tillë i lejon HRM-së të kombinojë njëkohësisht logjikën e shpejtë dhe intuitive dhe planifikimin e ngadaltë dhe të qëllimshëm. Me fjalë të tjera, të dy sistemet e të menduarit funksionojnë paralelisht brenda të njëjtës strukturë.
Një model i vogël mposht gjigantët
Rezultatet janë mbresëlënëse. Në testin ARC-AGI, një nga masat më të kërkuara të inteligjencës induktive, HRM arriti saktësi prej 40.3%, ndërsa GPT-4 dhe Claude 3.5 mezi tejkaluan 21%. Në detyrat komplekse të lojës Sudoku dhe gjetjen e shtigjeve optimale përmes 30 × 30 labirinteve, HRM ishte modeli i vetëm që arriti të gjente zgjidhjen e saktë. Në rastin e fundit, është një labirint katror me 30 rreshta dhe 30 kolona fushash (gjithsej 900 nyje/fushë). Modeli duhej të gjente rrugën më të shkurtër midis pikave të fillimit dhe të mbarimit, gjë që është një problem shumë i kërkuar nga ana llogaritëse sepse numri i kombinimeve të mundshme rritet në mënyrë eksponenciale me madhësinë e rrjetit. Forca e HRM nuk qëndron në sasinë e madhe të njohurive, por në mënyrën se si arsyetonte.
Si funksionon LLM dhe si funksionon modeli i ri?
Modelet e Mëdha Gjuhësore (LLM) si GPT zakonisht përdorin teknikën e Zinxhirit të Mendimit, në të cilën një problem ndahet në një seri hapash të vegjël. Kjo mund të jetë e dobishme, por është gjithashtu e pabesueshme – është e lehtë të humbasësh fijen, gjë që mund të çojë në gabime në zinxhir.
Rrjeti përsëritës, me të cilin punon HRM-ja e re, nënkupton që rezultati nga hapi i mëparshëm kthehet si hyrje në atë të ri, gjë që krijon një lak dhe i lejon modelit të “mbajë mend” gjendjen e mëparshme dhe të planifikojë.
Përpunimi kohor shumëshkallësh i referohet një pjese të modelit që punon shpejt dhe në afat të shkurtër, dhe një pjese tjetër ngadalë dhe në afat të gjatë, ngjashëm me mënyrën se si truri menaxhon njëkohësisht reflekset e shpejta dhe vendimmarrjen e ngadaltë strategjike.
Aplikime të mundshme
Forca e HRM-së nuk qëndron vetëm në faktin se zgjidh enigma, por edhe në faktin se nuk ka nevojë për shumë të dhëna për të qenë efektiv. Kjo hap mundësi në fushat ku të dhënat janë të kufizuara dhe saktësia është thelbësore.
Për shembull, në kujdesin shëndetësor, HRM mund të ndihmojë në diagnostikimin e sëmundjeve të rralla, ku nuk ka miliona shembuj nga të cilët mund të mësohet, por vetëm një numër i vogël rastesh klinike.
Një tjetër zbatim i mundshëm është klimatologjia. Krijuesit e HRM pretendojnë se ai arrin deri në 97% saktësi në parashikimet sezonale në modelet klimatike.
Së fundmi, avantazhi i tij është se, falë kërkesave të ulëta për burime llogaritëse, mund të përfshihet në robotë që veprojnë në kohë reale, në mjedise dinamike dhe të paparashikueshme.
Një hap drejt AGI-së?
Menaxhimi i Burimeve Njerëzore (HRM) tregon se nuk është gjithmonë e nevojshme të ndërtohen modele gjithnjë e më të mëdha dhe më të shtrenjta për të arritur progres. Në vend që të përpiqej të zgjidhte gjithçka me fuqinë e një mori të dhënash, Inteligjenca e Mençur iu drejtua biologjisë, vetë trurit, si zgjidhje. Rezultati është një sistem që i tejkalon konkurrentët e tij shumë më të fuqishëm në fushën ku inteligjenca njerëzore është ende superiore – në të menduarit abstrakt dhe zgjidhjen e problemeve.
Nëse ky do të jetë hapi i parë i vërtetë drejt inteligjencës artificiale (IAG) apo thjesht një fazë kalimtare në kërkimin e IA-së, është shumë herët për të thënë. Por një gjë është e qartë: natyra është një inxhiniere e shkëlqyer dhe IA e modeluar sipas trurit mund të jetë e vetmja rrugë drejt makinave që një ditë do të mendojnë si njerëzit ose edhe më mirë.