„OpenAI“ daug lažinasi dėl garso AI, o ne tik apie tai, kad „ChatGPT“ skambėtų geriau. Remiantis naujais „The Information“ pranešimais, bendrovė per pastaruosius du mėnesius suvienijo kelias inžinierių, produktų ir tyrimų grupes, kad pakeistų savo garso modelius, ir visa tai ruošiasi sukurti pirmąjį asmeninį garso įrenginį, kuris turėtų pasirodyti maždaug po metų.
Šis žingsnis atspindi, kur juda visa technologijų pramonė – link ateities, kurioje ekranai taps foniniu triukšmu, o garsas užima pagrindinę vietą. Išmanieji garsiakalbiai jau pavertė balso padėjėjus daugiau nei trečdalyje JAV namų. „Meta“ ką tik išleido savo „Ray-Ban“ išmaniųjų akinių funkciją, kuri naudoja penkių mikrofonų masyvą, kad padėtų girdėti pokalbius triukšmingose patalpose – iš esmės paverčia jūsų veidą kryptingu klausymosi įrenginiu. Tuo tarpu „Google“ birželį pradėjo eksperimentuoti su „Garso apžvalgomis“, kurios paieškos rezultatus paverčia pokalbių santraukomis. „Tesla“ integruoja „Grok“ ir kitus LLM į savo transporto priemones, kad sukurtų pokalbio balso padėjėjus, kurie per natūralų dialogą gali valdyti viską nuo navigacijos iki klimato kontrolės.
Tai stato ne tik technologijų milžinai. Su tokiu pat įsitikinimu, nors ir su įvairia sėkme, atsirado marga startuolių komanda. Humane AI Pin kūrėjai sudegino šimtus milijonų, kol jų nešiojami be ekranai tapo įspėjamuoju pasakojimu. Friend AI pakabukas, karoliai, kuriuose įrašomas jūsų gyvenimas ir siūlo draugystę, sukėlė susirūpinimą dėl privatumo ir egzistencinę baimę. Ir dabar mažiausiai dvi įmonės, įskaitant „Sandbar“ ir vieną, kuriai vadovauja „Pebble“ įkūrėjas Ericas Migicovskis, kuria dirbtinio intelekto žiedus, kurie, kaip tikimasi, debiutuos 2026 m., leidžiančius nešiotojams tiesiogine prasme kalbėtis su ranka.
Formos veiksniai gali skirtis, tačiau tezė ta pati: garsas yra ateities sąsaja. Kiekviena erdvė – jūsų namai, automobilis, net veidas – tampa sąsaja.
Pranešama, kad naujasis „OpenAI“ garso modelis, numatytas 2026 m. pradžioje, skambės natūraliau, elgsis su pertraukimais kaip tikras pokalbio partneris ir net kalbėsite kalbėdami, o to šiandieniniai modeliai negali valdyti. Teigiama, kad bendrovė taip pat įsivaizduoja įrenginių šeimą, galbūt įskaitant akinius ar beekranius išmaniuosius garsiakalbius, kurie veikia mažiau kaip įrankiai, o labiau kaip pagalbininkai.
Kaip pažymi „The Information“, buvęs „Apple“ dizaino vadovas Jony Ive'as, prisijungęs prie „OpenAI“ aparatinės įrangos pastangų gegužę įmonei įsigijęs 6,5 mlrd.













