• Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události
Žádné výsledky
Zobrazit všechny výsledky
ITBiz.cz
ITBiz.cz
Žádné výsledky
Zobrazit všechny výsledky

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025
| Komentujeme
Chvála černých skřínek

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které se v souvislosti s umělou inteligencí na zahraničních vědeckých i technologických webech zmiňuje poměrně často: „zmenšení“ AI. Namísto velkých jazykových modelů LLM můžeme očekávat důraz na modely menší, respektive kompozitní architekturu.
Důvodů je hned několik: menší modely jde snáze provozovat přímo na koncových zařízeních, což snižuje rizika spojená s přesouváním dat (do firemního datového centra) nebo přímo s jejich předáváním třetí straně (při používání „veřejných“ služeb AI na serverech poskytovatele, při trénování modelů speciálně pro potřeby firmy…). Na koncových zařízeních se může provádět nejenom provoz, ale i trénování modelů.
Za druhé, méně robustní modely šetří energii a mohou ulevit těžce zkoušeným datovým centrům (tento problém se bude, jak se předpokládá, dále zvyšovat) – i když samozřejmě málokdo stojí o to, aby mu umělá inteligence vybíjela mobil. (Jinak úzkým hrdlem pro provoz i menšího modelu AI v koncovém zařízení bude nejspíš grafický procesor.)
Za třetí určitý typ aplikací potřebuje rychlé zpracování dat přímo u jejich zdrojů, tedy v edge prostředí. Okrajem infrastruktury přitom může být leccos.
A nakonec, menší, navzájem spolupracující modely mohou dávat i lepší výsledky. „Obecný“ model se může například spojovat se specializovaným, pokud usoudí, že otázka je na něj příliš odborná. V aplikaci pro daný obor si zase vystačíme přednostně se znalostmi určitého typu a důležité je opět hlavně to, aby model zjistil, kdy se má zeptat dál.
Viz také: Jak naučit modely umělé inteligence efektivně spolupracovat

Prakticky všechny podnikové aplikace jsou zaměřené „oborově“, prakticky žádná nepotřebuje znát informace (např.) o historii nebo zoologii.
Vědci z Princetonu a Stanfordu navrhli i provoz původně stejného LLM tak, že lokálně v zařízení poběží nějaká ořezaná verze (doslova se mluví o kompresi LLM). Takových algoritmů ovšem existuje více.
O budoucnosti menších modelů svědčí i to, že už je nabízejí také poskytovatelé těch velkých: Google, Microsoft, Meta a OpenAI a Amazon. A pokud menší modely fungují v režimu pro více uživatelů, pak jsou při stejné zátěži zdrojů pochopitelně rychlejší a zvládnou obsloužit současně více uživatelů.
A co se týče kompozitní architektury, Nicolas de Bellefonds z Boston Consulting Group dokonce navrhl následující uspořádání: vstupní interakci s uživatelem povede pouze velmi malý model, jehož jediným úkolem bude posoudit složitost otázky (takže porozumět jí ale bude muset dost přesně) a rozhodnout, který konkrétní, respektive jak velký model bude potřeba k jejímu zodpovězení; kdy „jak velký“ znamená „jaký nejmenší možný“…

Rubriky: Technologie

Související příspěvky

Zprávičky

Umělá inteligence může zahltit spravedlnost generovanými texty, míní náměstek

14. 5. 2025
Mobilní síť bude inteligentní: od 5G k 6G
Články

Mobilní síť bude inteligentní: od 5G k 6G

13. 5. 2025
Zprávičky

Turnovský výrobce elektroniky Crytur vybudoval za 400 mil. Kč nový čistý provoz

12. 5. 2025
Zprávičky

Asociace představila etický kodex pro využití AI v předvolebních kampaních

12. 5. 2025

Zprávičky

Brusel obvinil provozovatele TikToku z porušování pravidel EU, hrozí mu pokutou

ČTK
15. 5. 2025

Evropská komise (EK) obvinila provozovatele čínské platformy TikTok z porušování pravidel EU kvůli netransparentnosti

ÚOHS začal posuzovat převzetí Dotykačky softwarovou skupinou Seyfor

ČTK
15. 5. 2025

Úřad pro ochranu hospodářské soutěže (ÚOHS) začal posuzovat převzetí společnosti Dotykačka, která poskytuje pokladní

T-Mobile v prvním čtvrtletí zvýšil provozní zisk o 5 % na 3,44 miliardy

ČTK
15. 5. 2025

Operátor T-Mobile zvýšil v prvním čtvrtletí provozní zisk EBITDA o 4,8 procenta na 3,438

Siemens potvrdil výhled poté, co výsledky za druhý kvartál překonaly odhady

ČTK
15. 5. 2025

Německý průmyslový koncern Siemens zvýšil ve druhém čtvrtletí čistý zisk meziročně o 11 procent

Umělá inteligence může zahltit spravedlnost generovanými texty, míní náměstek

ČTK
14. 5. 2025

Využívání jazykových modelů v právu se projevuje rostoucím množstvím i délkou právních textů a

Foxconn téměř zdvojnásobil čtvrtletní zisk, jeho vyhlídky však zastiňují cla

ČTK
14. 5. 2025

Tchajwanská společnost Foxconn, která je největším smluvním producentem elektroniky na světě a hlavním výrobcem

Padla další rekordní pokuta za porušení GDPR

Česko v dubnu zasypaly desítky tisíc škodlivých e-mailů

Pavel Houser
14. 5. 2025

V dubnu opět vzrostly detekce infostealeru Formbook, který tak stále stojí v čele pravidelné

Microsoft hodlá zrušit zhruba 3 % pracovních míst

ČTK
14. 5. 2025

Americký softwarový gigant Microsoft hodlá zrušit zhruba tři procenta pracovních míst. Informoval o tom

Tiskové zprávy

MPO: Zrušení amerického omezení vývozu AI čipů nechává prostor pro rozvoj českého průmyslu a mezinárodní spolupráce

Místní šetření ÚOHS ve společnosti Seznam.cz bylo nezákonné, konstatoval soud

Efektivní a bezpečná správa kontejnerových klastrů

WD_BLACK SN8100 NVMe SSD posunuje hranice

Acronis integruje do své platformy řešení Fortinet

ČTÚ: Strategie správy spektra schválena vládou

Zpráva dne

Nešlehejte vejce ale Windows 11 na Goodofer24 jen za €20.00!

Nešlehejte vejce ale Windows 11 na Goodofer24 jen za €20.00!

Redakce
15. 4. 2025

Ať už máte PC se starším systémem Windows, nebo si stavíte PC podle vašich...

Videa ITBiz.cz

Glenn Mallon, Dell Technologies

Elektronická recepční

FORXAI Mirror

Kamery pro průmysl a detekci požárů

Kamery pro vyhodnocení spokojenosti zákazníků

Kalendář

Kvě 27
Celý den

Kontajnery v praxi

Říj 1
Celý den

Cyber Attacks

Říj 21
Celý den

Bezpečnosť a dostupnosť dát

Zobrazit kalendář

Komentujeme

Chvála černých skřínek

Malé modely AI mají být velkým trendem

Pavel Houser
3. 1. 2025

V záplavě prognóz technologického vývoje (nejen) v roce 2025 zde prozatím trochu zapadlo jedno téma, které...

Odebírat newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Slovník

dB

Campus recruiting

BillBoard

Kategorie

  • Články
  • Komentujeme
  • Slovník
  • Tiskové zprávy
  • Zprávičky

Portál ITbiz.cz přináší informace z IT a byznysu již od roku 2006. Provozuje jej internetové vydavatelství Nitemedia. Hosting zajišťuje společnost Greenhousing.cz. Mezi další naše projekty patří například ABClinuxu.cz a Sciencemag.cz. Na stránce Redakce naleznete informace o redakci a možnostech inzerce.

Rubriky

Akce a události Byznys Cloud Ekomerce Hardware Internet Operační systémy Podnikový software Právo Science Security Technologie Telekomunikace Veřejná správa Vývoj a HTML Zpráva dne České IT

Píšeme jinde

RSS ScienceMag RSS

  • Alzheimer a oprava mozku: co se stane, když chybí klíčový protein?
  • Vědci provedli unikátní měření trávicího traktu
  • Arktické rostliny reagují na změnu klimatu nepředvídatelně

RSS AbcLinuxu RSS

  • Sovereign Tech Agency podpoří GFortran částkou 360 000 eur
  • Microsoft hodlá zrušit zhruba 3 % pracovních míst
  • Místní šetření ÚOHS ve společnosti Seznam.cz bylo nezákonné, konstatoval soud

Newsletter

Zásady ochrany osobních údajů.

Zkontrolujte svoji doručenou poštu a potvrďte odběr.

Žádné výsledky
Zobrazit všechny výsledky
  • Technologie
  • Byznys
  • Software
  • Hardware
  • Internet
  • Telco
  • Science
  • České IT
  • Události

© 2019 Vydává Nitemedia s.r.o. Hosting zajišťuje Greenhousing.cz.

Tento web používá cookies. Pokračováním dáváte souhlas s jejich používáním. Více na itbiz.cz/soukromi.
OSZAR »