LLM (large language model) vs Generative AI — jakie są różnice?
2 min
2 min
Na skróty
W dyskusji o rozwoju AI nie da się dziś uniknąć tematu dużych modeli językowych (LLM) oraz generatywnej AI. Jaka jest różnica pomiędzy tymi pojęciami — i czy przypadkiem nie opisują tego samego zjawiska? Na te pytania odpowiemy w dzisiejszym wpisie; jak zwykle, zapraszamy do lektury!
Mówiąc krótko — duży model językowy (LLM) to algorytm, który potrafi przetwarzać języki naturalne (czyli te, którymi posługujemy się na co dzień). Jest więc w stanie rozpoznać napisany przez człowieka tekst, przeanalizować go pod kątem jego znaczenia i zinterpretować stojącą za nim intencję.
Modele językowe opierają się przy tym na milionach tekstów, z którymi „zapoznano” je wcześniej w procesie uczenia maszynowego. Poprzez ich analizę, LLM uczy się znaczenia słów, składni danego języka, najczęściej używanych w danym kontekście struktur gramatycznych i semantycznych oraz różnych stylów wypowiedzi. To właśnie na podstawie tej wiedzy algorytm może zinterpretować tekst w podobny sposób, w jaki zrobiłby to człowiek. A potem — wygenerować wiarygodną odpowiedź… chociaż to już należy także do sfery generative AI.
Sztandarowym przykładem dużego modelu językowego jest oczywiście GPT (obecnie w wersji z numerem „4”) — czyli model stojący za ogromnym sukcesem ChatGPT.
Pojęcie generative AI, a więc „generatywnej sztucznej inteligencji” jest znacznie szersze od modeli językowych — choć te drugie też mogą do tej grupy należeć. Wspomniany GPT jest tego najlepszym dowodem; jak wspomnieliśmy, potrafi on nie tylko interpretować język naturalny, ale także, posługując się nim, generować nowe treści.
I w tym właśnie tkwi sedno generative AI — jest nią każdy model sztucznej inteligencji zdolny do tworzenia treści. Mogą być nią teksty, ale także:
i inne formy contentu. Schemat działania jest taki sam, jak w przypadku modeli językowych. Algorytm „uczy się” typowych dla danej formy treści wzorców i zasad na podstawie dostarczonych danych, a następnie — generuje nowe dane, które stanowią połączenie cech oryginalnych, stworzonych przez człowieka (bądź inny model generatywny!) utworów.
Podstawową właściwością generatywnych modeli AI jest też to, że podstawę dla tworzonych treści stanowi tzw. prompt — podana przez użytkownika podpowiedź. Znów, zazwyczaj jest to po prostu forma komendy tekstowej, chociaż niektóre narzędzia zdolne są także do przetwarzania obrazów jako promptów. Taką funkcję oferuje na chwilę obecną m.in. wspomniane Midjourney.
Jeśli zadajesz sobie właśnie pytanie, czy do interpretacji promptu potrzebny jest… model językowy — odpowiedź brzmi tak. Każde narzędzie AI, które „pracuje” z językiem, potrzebuje wsparcia LLM.
Gdy tylko pojawia się temat AI, hasła takie jak „duże modele językowe”, „przetwarzanie języka naturalnego” czy „generatywna sztuczna inteligencja” przytaczane są w każdym akapicie. Często są stosowane wymiennie, co jest akurat błędem.
A więc podsumujmy:
Obie te formy sztucznej inteligencji są więc bardzo ściśle ze sobą związane. LLM jest w praktyce jednym z rodzajów generative AI, a modele generatywne — nie byłyby w stanie przetwarzać promptów bez modeli językowych. Warto o tym pamiętać w trakcie lektury kolejnych tekstów o sztucznej inteligencji — lub przy okazji przyszłych dyskusji na jej temat.
Zawodowy copywriter oraz student psychologii na Uniwersytecie Warszawskim. W świecie marketingu internetowego równie mocno, co chwytliwe (i wartościowe) treści interesuje go dobry design. Gdy nie zajmuje się tworzeniem contentu, odkrywa perełki kina niezależnego i pracuje nad własnymi opowiadaniami.