Jak coś jest od wszystkiego to jest do niczego

in #polishyesterday

Coraz częściej słyszę zachwyty nad wielkimi modelami typu ChatGPT, Gemini itp.

Ale wiesz, co jest ich największą wadą?

To, że są… od wszystkiego...

A jak mawia stare powiedzenie "jak coś jest od wszystkiego to jest do niczego"

Przez ostatnie dwa lata widzimy wyścig na „największy, najbardziej ogólny model” typu AGI Model, który ma potrafić wszystko... napisać kod, diagnozować objawy chorób, analizować prawo, tłumaczyć kontrakty czy planować trening na siłowni.

I nagle pojawia się kontra a mianowicie wyspecjalizowane modele gdzie zamiast jednego LLM od wszystkiego coraz częściej wygrywają modele i asystenci domenowi:
w zdrowiu MedLM/Med-PaLM, w finansach BloombergGPT/FinBERT, w prawie CoCounsel i Lexis+ AI, a w cyberbezpieczeństwie podejścia typu Sec-PaLM czy Security Copilot.

Świat odkrył prostą prawdę, że ogólne LLMy są dobre ale... Specjalistyczne są skuteczne 😎

Dlaczego tak się dzieje? Ponieważ uniwersalne modele mają trzy fundamentalne ograniczenia, z którym każdy kto dłużej z nimi pracuje się zderzył a mianowicie:

Nie są zoptymalizowane pod dany kontekst
ChatGPT potrafi napisać wszystkim „trochę dobrze”, ale nikomu „idealnie”
Medycyna?
Cyberbezpieczeństwo?
Prawo?
Tu nie ma miejsca na „trochę”... tu trzeba być precyzyjnym jak chirurg.

Za dużo wiedzy → za mało precyzyjnych heurystyk
Specjalistyczny model jest zbudowany na wąskim zakresie danych tak więc: diagnozuje szybciej, unika halucynacji, stosuje właściwe procedury i zawsze trzyma standardy branżowe.

To Koniec ery „jednego modelu do wszystkiego”
Wchodzimy w etap modułowych ekosystemów AI, gdzie ogólny model jest bramą, ale prawdziwą pracę wykonają specjalistyczne agenty.

Dokładnie tak jak w realu nie idziesz do mechanika po operację wyrostka.

Z moich obserwacji i wniosków przyszłość AI nie należy do największych modeli (choć mogę się mylić) tylko do najbardziej wyspecjalizowanych.

A jak Ty uważasz?
wolisz jednego dużego „AI-wszystko”
czy
zestaw precyzyjnych, wyspecjalizowanych agentów?
I co według Ciebie przyjmą szybciej firmy uniwersalne modele czy mocno spersonalizowane narzędzia?

Podziel się swoja branżą i tym jaki model byś wybrał.

Posted Using INLEO

Sort:  

Pytanie do czego ktoś je używa. Do pracy pewnie będziesz używać specjalistycznego, do całej reszty ogólnego

I tu się zgadzamy tylko że właśnie w tym „do czego używasz” leży cała różnica.

Problem polega na tym, że dziś granica między „pracą” a „całą resztą” zaczyna się zacierać.

AI coraz częściej nie robi prostych, hobbystycznych rzeczy, tylko:

analizuje umowy,
streszcza dokumenty medyczne,
robi audyty bezpieczeństwa,
generuje kod,
prowadzi scoring finansowy,
automatyzuje procesy w firmie.

I tu zaczyna się kłopot, ponieważ ogólny model będzie Ci odpowiadał „jako tako”, a specjalistyczny „jak trzeba”.

To trochę jak mieć w domu multitoola, który jest super do drobiazgów, ale nie zrobisz nim remontu kuchni.

Z ogólnymi modelami jest podobnie nadają się do 80–90% rzeczy codziennych,
ale kiedy wchodzi odpowiedzialność, konsekwencje i precyzja,
to nie chcesz multitoola. Chcesz narzędzia zaprojektowanego do konkretnej roboty.

Dlatego przyszłość to zestaw agentów ogólny do ogólnego a specjalistyczne do krytycznego.

Być może, w mojej branży dla Polski nie ma jeszcze porządnego modelu językowego, korzystam naprzemiennie z ChatGPT/Gemini/Perplexity I teraz coraz bardziej z NotebookLM i jeśli chodzi o moją specjalizację to jestem lepszy niż one wszystkie. Natomiast pozwalają mi zaoszczędzić czas i czasami spojrzeć na problem z innej perspektywy. Ale to zawodowo. Prywatnie myślę, że ten poziom ogolnosci jest wystarczający.