„Google“ „Genie 3“ interaktyvus generatyvinis vaizdo modelis mus nuveda vienu žingsniu arčiau „Holodeck“
„Deepmind“, „Google“ AI tyrimų laboratorija, paskelbė apie „Genie 3“, naujos AI sistemos, galinčios realiuoju laiku sukurti interaktyvią virtualią aplinką, išleidimą ir priartinimą prie „Holodeck“.
„Google“ giliai atnaujinant, kad naudojant paprastą teksto eilutę, „Genie 3“ gali sukurti dinamines, navigančias scenas, veikiančias 24 kadrų per sekundę per sekundę 720p skiriamąja geba.
Pripažįstama, kad 3 „Genie 3“ gali būti naudojama tik „Flatscreen“ monitoriuose, todėl nėra pasakojama, kada VR ausinėse gausime ką nors panašaus. Pavyzdžiui, „Quest 3“ ekrano raiška vienos akies skiriamoji geba yra 2 064 × 2,208, laikrodis, kurio bazinis atnaujinimo greitis yra 90Hz, padėdamas VR ant tolimojo našumo pakraščio galo (kaip įprasta).
Vis dėlto neabejotinai išankstinis žvilgsnis į ateinančius dalykus. Skirtingai nuo statinių ar iš anksto pateiktų modeliavimo, „Google“ sako, kad modelis sukuria kiekvieną rėmą skrendant, leisdamas greičiau sąveikauti su vartotojais ir atsiliepti apie aplinką.
https://www.youtube.com/watch?v=pdkhukknuqdg
Be to, „Google“ sako, kad šie sukurti pasauliai gali išlikti vizualiai ir fiziškai nuoseklūs, sako „Google“, nes sistema išlaiko trumpalaikės atminties formą, kad atspindėtų ankstesnius veiksmus.
„Genie 3“ taip pat gali imituoti įvairius scenarijus, įskaitant natūralią aplinką, istorines aplinkybes ir išgalvotus bei animacinius pasaulius. Tuo tarpu vartotojai gali suaktyvinti „paskatinamus pasaulio įvykius“, kai vartotojai gali įterpti pasaulinius pakeitimus naudodamiesi teksto komandomis, pavyzdžiui, pakeisti orą ar įvesti naujus objektus.
Be linksmybių, atkuriant 1800 -ųjų „Osaka“ ar „Genie 3“, „Genie 3“ taip pat bus „Genie 3“ įrankis įkūnijtam AI mokymui, su potencialiais pritaikymais tokiose srityse kaip robotikos, žaidimų ir dirbtinių bendrųjų žvalgybos tyrimų srityse.
Kol kas yra keletas apribojimų. „Google“ sako, kad „Genie 3“ šiuo metu turi ribotą „veiksmų erdvę“ agentams ir kovoja su tiksliai modeliuojant daugialypės terpės sąveiką bendroje aplinkoje. „Agents“, bendrovės, susijusios su AI sistemomis, kurios savarankiškai veikia virtualioje aplinkoje, tam tikra prasme priimti sprendimus, imtis veiksmų ir mokytis iš patirties.
Tai taip pat susiduria su iššūkiais, imituojant realaus pasaulio vietas „tobulu geografiniu tikslumu“, aiškiai pateikiant tekstą ir palaikant ilgalaikę sąveiką po kelių minučių.
Vis dėlto tai yra gana nuostabus šuolis iš tokių neinteraktyvių vaizdo įrašų, kuriuos dabar matome internete, iš kurių daugelį sunku pasakyti iš realaus sandorio. Will Smith Spaghetti-eting modeliavimas tik taps vis daugiau gyvenimo ir, naudojant tokias sistemas kaip „Genie 3“, interaktyvios.


