Umjetna inteligencija (AI) u posljednjih nekoliko godina napreduje nevjerojatnom brzinom. Povećanje broja transformatora dovelo je do izvanrednih mogućnosti na području jezika (npr. GPT-3, PaLM, Chinchilla), koda (npr. Codex, AlphaCode) i generiranja slika (npr. DALL-E, Imagen). 2022. godina nedvojbeno predstavlja prekretnicu, kada su različiti modeli, kako privatni tako i otvoreni, ušli u mainstream okruženje. ChatGPT je u ovom trenutku, bez imalo sumnje, među najpopularnijima.
2020. godine predstavljen je GPT-3, danas jedan od vodećih LLM-ova – velikih jezičnih modela (large language models). Sposoban je učiti iz pisanog teksta a zatim kreirati razgovor, dok je njegova izvedba toliko sofisticirana i precizna da se može koristiti i za komercijalne aplikacije. U području prevođenja zvuka u tekst GPT-3 također koriste giganti kao što su Google i Meta. Do danas je GPT-3 postao uobičajen u raznim područjima, a možete dobiti i GPT-3 prilagođen vašim potrebama te ga koristiti za razne zadatke kao što su prijevod, sinteza govora, prepoznavanje slika i slično.
Konkurencija modelu GPT-3 uključuje modele PaLM, Chinchilla, GLaM, Megatron-Turning NLG, Gopher i LaMDA. PaLM je model širokog spektra koji je prvi premašio granicu od 540 milijardi parametara (uobičajene vrijednosti neuronske mreže koje omogućuju učenje). Osim razumijevanja teksta, prepoznavanja konteksta i sintetiziranja novog modela, to mu omogućuje i stvaranje zaključaka u tekstu, pisanje programskog koda, odgovaranje na pitanja, automatsko prepoznavanje obrazaca, razumijevanje logike i repliciranje. U 2022. godini PaLM je na usporednom testu NLP-a (natural language processing), rangiran na samom vrhu jer je izvršio 28 od 29 dodijeljenih zadataka. S uspjehom od 60% rješavao je matematičke tekstualne zadatke primjerene djeci od 9 do 12 godina.
2022. godine pojavilo se nekoliko novih modela koji mogu iz teksta korisnika stvoriti računalnu fotografiju. Jedan od prvih takvih modela bio je DALL-E, koji je blisko povezan s GPT-3. Difuzijski modeli predstavljaju novu generaciju najsuvremenijih generativnih modela koji stvaraju različite slike visoke rezolucije. Primjeri arhitektura temeljenih na difuzijskim modelima su GLIDE, DALLE-2, Imagen i model Stable Diffusion potpuno otvorenog koda.
Modeli su sposobni stvoriti tekst s unaprijed definiranom strukturom ili semantičkim kontekstom (npr. roman), generirati videozapise, pa čak i stvarati molekule. Neki zanimljivi i testiranja vrijedni modeli koji generiraju slike iz teksta su: DALLE-2, Imagen, Parti i dva koja ne dolaze iz skupine velikana AI-modela: Stability.ai i Midjourney. Prvi začeci generiranja videa iz teksta već su dostupni u istraživačke svrhe, a rezultati su izvrsni. Sve to otvara pitanje hoće li nam Shutterstock i slični servisi za koju godinu uopće trebati.
Gore navedeni modeli pokazuju brz razvoj umjetne inteligencije i sposobnost generiranja dijelova teksta, koda ili slika, no korisnike više zanimaju modeli koji im mogu pomoći u svakodnevnim zadacima u digitalnom sustavu, poput unosa teksta i slika u CRM, ERP ili online trgovina. Jedan od trenutno najboljih modela je ACT-1 tvrtke Adapt, koji razumije podatke unesene u polja za unos, razumije njihovo značenje i može koristiti ili slijediti naredbe. Na taj način automatski obavlja aktivnost i, pojednostavljeno rečeno, omogućuje korisniku da više ne mora klikati kroz CRM (primjerice, unos novog kupca u CRM i prikupljanje podataka o klijentu iz raznih online izvora bez korištenja API integracija, napredno korištenje Excel funkcija, izračun učinkovitosti A/B-testiranja i slično).
Model ACT-1 trenutno je još uvijek u beta fazi i još nije općenito dostupan. Ali postoji nekoliko drugih modela s kojima se može postići sličan učinak. Za automatizaciju zadataka bez stvarnog pisanja koda (iako ćete i dalje morati napisati neka pravila) mogu se koristiti RPA ili alati za strojno učenje kao što su Google Cloud AutoML i IBM Watson Automated Insights. U ovu kategoriju alata treba uključiti modele i alate koji pomažu u programiranju, kao što su Codex i AlphaCode, koji znaju napisati dio koda na temelju korisničkog opisa funkcionalnosti.
Krajem studenog tvrtka Open AI objavila je testnu verziju Chatbota ChatGPT, namijenjenu prvenstveno u istraživačke svrhe. Radi se o AI za razgovor koji zna odgovoriti na korisnikova pitanja i odgovora u kontekstu razgovora. Sposoban je za pravi razgovor, jer se sjeća prethodnih pitanja i svojih odgovora, koje smisleno povezuje te oblikuje nove odgovore. Zanimljivo je da je u samo pet dana dosegnuo milijun korisnika, što je rekord među aplikacijama i rješenjima.
Usporedbe radi, iPhoneu je trebalo 74 dana da dođe do milijun korisnika, Instagramu dva i pol mjeseca, a Netflixu tri i pol godine. Pogledajmo što AI ima za reći o ChatGPT-u: “ChatGPT je AI model koji je izvorno stvoren za korištenje u Chat Rooms za interakciju s ljudima. Riječ je o nadogradnji AI-modela GPT-3, koji je izvorno razvijen za automatizaciju pisanja tekstova a postao je jedan od najpoznatijih AI-modela. ChatGPT je posebno prilagođen za korištenje u Chat Rooms; može odgovarati na pitanja i razmjenjivati tekstove s ljudima na način koji podsjeća na ljudski razgovor. Model je dizajniran na takav način da lako može razumjeti kontekst i lako se prilagođava različitim razgovornim okruženjima.”
Najveći izazov koji mnogi ističu predstavlja etičnost uporabe ovih modela u praksi. Neki tvrde da se AI modeli ne bi trebali koristiti jer su pristrani i jer su za obuku modela korišteni podaci koje su generirali korisnici, tako da oni zapravo imaju stvarna prava nad njima. Dodatni izazov predstavlja nedovoljna jasnoća o tome kako AI modeli zapravo rade i za što su sve sposobni. Umjetna inteligencija još uvijek izaziva priličnu pomutnju među ljudima, ali na kraju, s vremenom, kao i s drugim modernim tehnologijama, ljudi će shvatiti kako radi i prepoznati dobrobiti koje im može donijeti.
Trendovi koje predviđaju AI stručnjaci:
Hoće li umjetna inteligencija utjecati na vaš odnos s kupcima i korisničko iskustvo? Odgovor je da, ali taj utjecaj neće biti vidljiv u bliskoj budućnosti u mjeri u kojoj to danas zamišljamo. U nešto daljoj budućnosti, međutim, bit će puno veći nego što možemo zamisliti. Kako kaže Yuval Noah Harari, Homo sapiens kakvog smo ga poznavali će u budućnosti dobiti vršnjake u obliku umjetnih entiteta, ili kako je sam napisao: "Mi smo jedna od posljednjih generacija Homo sapiensa. Za sto ili dvjesto godina, Zemljom će dominirati bića koja će se više razlikovati od nas nego što se mi razlikujemo od čimpanza."
O napretku i utjecaju umjetne inteligencije na život i budućnost prosudite sami, ali nemojte očekivati da će vas 2023. u vašem omiljenom kafiću posluživati robot koji će točno znati kakvu kavu volite i koji će vas dočekat s uljudnom frazom koja odgovara vašem trenutnom raspoloženju. No, možda se to dogodi 2032., tko zna?
*25% članka napisala je umjetna inteligencija. Možete li pogoditi kojih 25%?