Duomenų dideliems kalbos modeliams dilema: šiukšlynas ar aukso kasykla?

Daktaras Tomas Bergmanis, AI Tyrinėtojas Tilde Building AI Systems, gebantis suprasti ir kurti žmogaus kalbą, reikalauja daug kalbos duomenų. Šie duomenys yra pagrindas LLM gebėjimui suprasti ir kurti į žmogų panašią kalbą. Tačiau čia tinka klišė, kad ne visi duomenys sukurti vienodi. Taigi, šis skirtumas […]