Zašto se ne trebamo bojati umjetne inteligencije?

Written by Gorazd Zakrajšek | 2/2/2023

Umjetna inteligencija (AI) u posljednjih nekoliko godina napreduje nevjerojatnom brzinom. Povećanje broja transformatora dovelo je do izvanrednih mogućnosti na području jezika (npr. GPT-3, PaLM, Chinchilla), koda (npr. Codex, AlphaCode) i generiranja slika (npr. DALL-E, Imagen). 2022. godina nedvojbeno predstavlja prekretnicu, kada su različiti modeli, kako privatni tako i otvoreni, ušli u mainstream okruženje. ChatGPT je u ovom trenutku, bez imalo sumnje, među najpopularnijima.

GPT-3

2020. godine predstavljen je GPT-3, danas jedan od vodećih LLM-ova – velikih jezičnih modela (large language models). Sposoban je učiti iz pisanog teksta a zatim kreirati razgovor, dok je njegova izvedba toliko sofisticirana i precizna da se može koristiti i za komercijalne aplikacije. U području prevođenja zvuka u tekst GPT-3 također koriste giganti kao što su Google i Meta. Do danas je GPT-3 postao uobičajen u raznim područjima, a možete dobiti i GPT-3 prilagođen vašim potrebama te ga koristiti za razne zadatke kao što su prijevod, sinteza govora, prepoznavanje slika i slično.

Konkurencija modelu GPT-3 uključuje modele PaLM, Chinchilla, GLaM, Megatron-Turning NLG, Gopher i LaMDA. PaLM je model širokog spektra koji je prvi premašio granicu od 540 milijardi parametara (uobičajene vrijednosti neuronske mreže koje omogućuju učenje). Osim razumijevanja teksta, prepoznavanja konteksta i sintetiziranja novog modela, to mu omogućuje i stvaranje zaključaka u tekstu, pisanje programskog koda, odgovaranje na pitanja, automatsko prepoznavanje obrazaca, razumijevanje logike i repliciranje. U 2022. godini PaLM je na usporednom testu NLP-a (natural language processing), rangiran na samom vrhu jer je izvršio 28 od 29 dodijeljenih zadataka. S uspjehom od 60% rješavao je matematičke tekstualne zadatke primjerene djeci od 9 do 12 godina.

Kad računalo samo stvara sliku

2022. godine pojavilo se nekoliko novih modela koji mogu iz teksta korisnika stvoriti računalnu fotografiju. Jedan od prvih takvih modela bio je DALL-E, koji je blisko povezan s GPT-3. Difuzijski modeli predstavljaju novu generaciju najsuvremenijih generativnih modela koji stvaraju različite slike visoke rezolucije. Primjeri arhitektura temeljenih na difuzijskim modelima su GLIDE, DALLE-2, Imagen i model Stable Diffusion potpuno otvorenog koda.

Modeli su sposobni stvoriti tekst s unaprijed definiranom strukturom ili semantičkim kontekstom (npr. roman), generirati videozapise, pa čak i stvarati molekule. Neki zanimljivi i testiranja vrijedni modeli koji generiraju slike iz teksta su: DALLE-2, Imagen, Parti i dva koja ne dolaze iz skupine velikana AI-modela: Stability.ai i Midjourney. Prvi začeci generiranja videa iz teksta već su dostupni u istraživačke svrhe, a rezultati su izvrsni. Sve to otvara pitanje hoće li nam Shutterstock i slični servisi za koju godinu uopće trebati.

Što je s AI modelima korisnim u poslovanju?

Gore navedeni modeli pokazuju brz razvoj umjetne inteligencije i sposobnost generiranja dijelova teksta, koda ili slika, no korisnike više zanimaju modeli koji im mogu pomoći u svakodnevnim zadacima u digitalnom sustavu, poput unosa teksta i slika u CRM, ERP ili online trgovina. Jedan od trenutno najboljih modela je ACT-1 tvrtke Adapt, koji razumije podatke unesene u polja za unos, razumije njihovo značenje i može koristiti ili slijediti naredbe. Na taj način automatski obavlja aktivnost i, pojednostavljeno rečeno, omogućuje korisniku da više ne mora klikati kroz CRM (primjerice, unos novog kupca u CRM i prikupljanje podataka o klijentu iz raznih online izvora bez korištenja API integracija, napredno korištenje Excel funkcija, izračun učinkovitosti A/B-testiranja i slično).

Model ACT-1 trenutno je još uvijek u beta fazi i još nije općenito dostupan. Ali postoji nekoliko drugih modela s kojima se može postići sličan učinak. Za automatizaciju zadataka bez stvarnog pisanja koda (iako ćete i dalje morati napisati neka pravila) mogu se koristiti RPA ili alati za strojno učenje kao što su Google Cloud AutoML i IBM Watson Automated Insights. U ovu kategoriju alata treba uključiti modele i alate koji pomažu u programiranju, kao što su Codex i AlphaCode, koji znaju napisati dio koda na temelju korisničkog opisa funkcionalnosti.

ChatGPT

Krajem studenog tvrtka Open AI objavila je testnu verziju Chatbota ChatGPT, namijenjenu prvenstveno u istraživačke svrhe. Radi se o AI za razgovor koji zna odgovoriti na korisnikova pitanja i odgovora u kontekstu razgovora. Sposoban je za pravi razgovor, jer se sjeća prethodnih pitanja i svojih odgovora, koje smisleno povezuje te oblikuje nove odgovore. Zanimljivo je da je u samo pet dana dosegnuo milijun korisnika, što je rekord među aplikacijama i rješenjima.

Usporedbe radi, iPhoneu je trebalo 74 dana da dođe do milijun korisnika, Instagramu dva i pol mjeseca, a Netflixu tri i pol godine. Pogledajmo što AI ima za reći o ChatGPT-u: “ChatGPT je AI model koji je izvorno stvoren za korištenje u Chat Rooms za interakciju s ljudima. Riječ je o nadogradnji AI-modela GPT-3, koji je izvorno razvijen za automatizaciju pisanja tekstova a postao je jedan od najpoznatijih AI-modela. ChatGPT je posebno prilagođen za korištenje u Chat Rooms; može odgovarati na pitanja i razmjenjivati tekstove s ljudima na način koji podsjeća na ljudski razgovor. Model je dizajniran na takav način da lako može razumjeti kontekst i lako se prilagođava različitim razgovornim okruženjima.”

Izazovi i predviđanja AI

Najveći izazov koji mnogi ističu predstavlja etičnost uporabe ovih modela u praksi. Neki tvrde da se AI modeli ne bi trebali koristiti jer su pristrani i jer su za obuku modela korišteni podaci koje su generirali korisnici, tako da oni zapravo imaju stvarna prava nad njima. Dodatni izazov predstavlja nedovoljna jasnoća o tome kako AI modeli zapravo rade i za što su sve sposobni. Umjetna inteligencija još uvijek izaziva priličnu pomutnju među ljudima, ali na kraju, s vremenom, kao i s drugim modernim tehnologijama, ljudi će shvatiti kako radi i prepoznati dobrobiti koje im može donijeti.

Trendovi koje predviđaju AI stručnjaci:

AGI (Artificial General Intelligence) jedan je od glavnih ciljeva mnogih istraživanja u području umjetne inteligencije te česta tema znanstvene fantastike i studija budućnosti. AGI se također naziva snažna umjetna inteligencija, potpuna umjetna inteligencija ili opće inteligentno djelovanje, iako neki akademski izvori izraz jaka umjetna inteligencija koriste za računalne programe koji imaju osjećaje ili svijest. AGI se od ograničene umjetne inteligencije razlikuje po tome što predstavlja općenitiju, ljudsku sposobnost rješavanja problema. To je slično razlici između osobe koja je dobra u algebri i osobe koja može naučiti bilo koji novi predmet u školi.
Do rujna 2023. više od 100.000 programera bit će uključeno u izradu modela za generiranja zvuka. Generativni zvučni alati temelje se na tehnikama dubokog učenja, tj. uče iz primjera, a zatim sami stvaraju nove zvukove ili glazbu. Alati mogu generirati zvuk na temelju početnog korisničkog unosa ili baze podataka već postojećih zvukova. Ovo se razlikuje od konvencionalnih alata za stvaranje glazbe, koji obično zahtijevaju ljudski unos putem glazbenih instrumenata ili računalnih tipkovnica.
Sigurnost i etičnost korištenja umjetne inteligencije (AI): pokreće se inicijativa za etično korištenje umjetne inteligencije EGAI (Ethics and Governance of AI Initiative) koju su zajedno pokrenuli MIT Media Lab, Sveučilište Harvard i Centar za internet i društvo Berkman Klein na Sveučilištu Harvard.

Utjecaj umjetne inteligencije na CX?

Hoće li umjetna inteligencija utjecati na vaš odnos s kupcima i korisničko iskustvo? Odgovor je da, ali taj utjecaj neće biti vidljiv u bliskoj budućnosti u mjeri u kojoj to danas zamišljamo. U nešto daljoj budućnosti, međutim, bit će puno veći nego što možemo zamisliti. Kako kaže Yuval Noah Harari, Homo sapiens kakvog smo ga poznavali će u budućnosti dobiti vršnjake u obliku umjetnih entiteta, ili kako je sam napisao: "Mi smo jedna od posljednjih generacija Homo sapiensa. Za sto ili dvjesto godina, Zemljom će dominirati bića koja će se više razlikovati od nas nego što se mi razlikujemo od čimpanza."

O napretku i utjecaju umjetne inteligencije na život i budućnost prosudite sami, ali nemojte očekivati da će vas 2023. u vašem omiljenom kafiću posluživati robot koji će točno znati kakvu kavu volite i koji će vas dočekat s uljudnom frazom koja odgovara vašem trenutnom raspoloženju. No, možda se to dogodi 2032., tko zna?

*25% članka napisala je umjetna inteligencija. Možete li pogoditi kojih 25%?

View full post