LLM nėra tai, ką žmonės sako

Jei tiriame didelius kalbos modelius (LLM) epistemologijos lygiu, pastebime, kad jie yra neteisingai suprantami įvairiais būdais. Pradedant nuo pavadinimo.

Epistemologijoje modeliai yra su žmonėmis suprantami realybės supaprastinimai, leidžiantys naudoti samprotavimus pagrįstus problemų sprendimo metodus, tokius kaip „f = ma“, „e = mc2“, „standartinis modelis“ arba „Austrijos ekonomika“

LLM yra modelių kolekcijos ir modelių modeliai, išmokti iš kai kurių problemų, tokių kaip žmogaus kalba. LLM nėra suprojektuoti aplink žodžių sąrašus ar gramatikus, kurie yra XX amžiaus kalbos modeliai.

Statistika yra silpniausias redukcionistų įrankių rinkinio įrankis. Statistika atmeta visą kontekstą. Kai LLM mokosi, jis mokosi visko kontekste ir išsaugo didžiąją dalį konteksto. Tai yra viena iš priežasčių, kodėl LLM yra brangi išmokti. Statistika kartais gali būti naudojama mokymosi algoritmų dalyse, tačiau konteksto išsaugojimas būdingas intelektui.

Išvadų metu, sprendžiant problemas, o ne mokantis, statistika gali atlikti daug mažesnį vaidmenį.

LLM yra dabartinė mašinų karta galintys pereiti prie išvadų dėl menkų įrodymų, kurių dauguma priklauso nuo surinktų koreliacijų.

LLM, kaip ir visi intelektai, įskaitant žmones, yra „spėlionių mašinos“.

Ar tai nėra labai mokslinė, ar ne?

Tai pasakytina apie visus intelektus. Visapusiškumas nėra prieinamas, o visos korporacijos yra neišsamios.

Klausimų apie dalykus, apie kuriuos LLM nieko nežino, yra rezultatas Haliucinacijos. Jei jums nepatinka haliucinacijos, užduokite lengvesnius klausimus.

NP-kietas yra redukcionistinė ir loginė koncepcija. LLMS išsprendžia problemas, naudodamiesi metodais, panašiais į tuos, kuriuos žmonės naudoja realiame pasaulyje.

Jei kažkokia informacija ar įgūdžiai niekur savo korpuse nebuvo, kaip ji ją žinotų? Kaip ir naujagimiai žmonės, LLM yra bendrosios besimokančios.

Įgūdžių, tokių kaip „Med School“, pridėjimas prie LLM treniruočių korpuso gali būti labai brangus. Jei LLM bus naudojamas patvirtinti miesto statybos leidimus, kodėl į savo korpusą įtraukti tarpinį prancūzų maisto gaminimą ir patirti papildomas išlaidas?

Jų elgesio mokymui ir vartotojo raginimui reikalingas atsakymas, todėl jie siūlo visas pastangas, nesvarbu. Ir jei tema nepatenka į jų kompetenciją, kaip apibrėžta jų korpuse, jie galų gale konfliktuos (neseniai išpopuliarintą kaip „haliucinacija“) atsakymą iš bet ko, kas, atrodo, tinka. Jų ribota realaus gyvenimo patirtis ir skaičiavimo ištekliai yra dabartiniai apribojimai, kurie laikui bėgant turės mažiau reikšmės.

Mes visiškai kontroliuojame savo LLM elgesio mokymus. Juos lengviau įklijuoti nei mūsų vaikai, nes LLM neturi roplių smegenų.

Yra tik vienas kūrybiškumo algoritmasir LLMS ir žmonės kovoja dėl bėgimo vietos, mylios už natūralios atrankos, kuri sukūrė mūsų biosferą iš nieko.

Gilesnis šių temų traktavimas taip pat yra.

Source link

LLM nėra tai, ką žmonės sako

What Is a Crypto Credit Card

„Apple“ generalinis direktorius „rūpinasi niekuo kitu“, kaip pastatyti „Breakout AR“ akinius prieš meta

Susiję įrašai

Gal būt praleidote