Sztuczna inteligencja w medycynie przeszła w ostatnich latach transformację – od wąsko wyspecjalizowanych modeli tekstowych (LLM) do złożonych systemów multimodalnych, integrujących dane obrazowe, tekstowe i strukturalne. To przejście redefiniuje sposób, w jaki analizujemy dane kliniczne, diagnozujemy choroby i podejmujemy decyzje terapeutyczne.

Ewolucja od LLM do modeli multimodalnych
Wstępna fala rozwoju AI w medycynie była napędzana przez tzw. Large Language Models (LLM), które umożliwiały analizę tekstów klinicznych, automatyczne generowanie dokumentacji medycznej czy wsparcie w tworzeniu planów leczenia. Modele takie jak GPT‑4, Med-PaLM czy BioGPT były trenowane na dużych zbiorach danych językowych, w tym notatkach klinicznych, opisach przypadków i literaturze naukowej.
Jednak od 2023 roku zauważa się intensywny wzrost zainteresowania systemami multimodalnymi – które łączą dane z różnych źródeł: obrazowanie (MRI, RTG), dane genetyczne, biosensory oraz teksty medyczne. Taki sposób integracji umożliwia bardziej kompleksowe modelowanie pacjenta i kontekstu klinicznego.
Diagnostyka wspierana multimodalnym AI
Systemy multimodalne okazują się szczególnie skuteczne w obszarach takich jak radiologia, onkologia czy neurologia. Przykładem może być model MedCLIP, który łączy dane obrazowe i opisowe w celu poprawy trafności diagnostycznej. W badaniach z 2024 r. (Nature Biomedical Engineering) wykazano, że modele multimodalne przewyższają modele wyłącznie obrazowe w rozpoznawaniu zmian nowotworowych w tomografii komputerowej.
Zdolność do korelowania informacji tekstowych z obrazowymi przyczynia się do redukcji błędów diagnostycznych, poprawia wczesne wykrywanie chorób i pozwala lepiej dostosować dalszą ścieżkę leczenia.
Generatywna dokumentacja kliniczna
Jednym z kluczowych zastosowań LLM w ochronie zdrowia jest automatyczne generowanie dokumentacji medycznej. W warunkach klinicznych, gdzie lekarze poświęcają nawet 30–50% czasu pracy na dokumentację, wdrożenie narzędzi takich jak Dragon Ambient eXperience (Nuance/Microsoft) przynosi istotne oszczędności czasu i poprawia jakość notatek.
Nowoczesne modele nie tylko transkrybują, ale również streszczają i ujednolicają dane, wspierając interoperacyjność z systemami EHR. Multimodalność dodatkowo pozwala na włączenie wyników badań obrazowych, parametrów życiowych czy wypowiedzi pacjenta w czasie rzeczywistym.
Wsparcie decyzji klinicznych
Systemy AI pełnią także coraz ważniejszą rolę w podejmowaniu decyzji klinicznych, szczególnie w kontekście trudnych przypadków lub pacjentów z wielochorobowością. Przykładem może być Clinical Decision Support System (CDSS) oparty na multimodalnym AI, który analizuje zarówno dane obrazowe, jak i historię leczenia oraz aktualne wyniki badań laboratoryjnych.
W badaniach pilotażowych (JAMA Network, 2025) wykazano, że tego typu systemy poprawiają zgodność decyzji terapeutycznych z aktualnymi wytycznymi nawet o 19%, szczególnie w intensywnej terapii i onkologii.
Transparentność i interpretowalność modeli
Rosnąca złożoność systemów AI budzi pytania o ich interpretowalność. W praktyce klinicznej kluczowe jest, aby lekarz mógł zrozumieć, na jakiej podstawie system AI sformułował daną rekomendację. Dlatego rozwijane są techniki explainable AI (XAI), umożliwiające wizualizację ścieżek decyzyjnych modeli.
Dodatkowo, w Europie i USA zaostrza się prawo dotyczące wykorzystywania systemów AI w medycynie – wymaga się certyfikacji modeli (np. według TRIPOD-AI), dokumentowania ich źródeł danych i sposobów walidacji.

Integracja danych i interoperacyjność
Multimodalność to nie tylko większa ilość danych, ale również wyzwanie integracyjne. Różne systemy szpitalne, formaty danych i standardy (HL7, FHIR, DICOM) muszą zostać ujednolicone, aby AI mogła skutecznie działać. Dlatego obecnie nacisk kładzie się na tworzenie platform interoperacyjnych, takich jak GAIA-X Health w UE, które mają umożliwić bezpieczną i ustrukturyzowaną wymianę danych dla systemów AI.
Przyszłość: ku inteligentnym systemom wspierającym lekarza
Kierunek, w którym zmierza AI w medycynie, to nie zastępowanie lekarza, lecz tworzenie inteligentnego partnera wspierającego analizę, diagnozę i podejmowanie decyzji. Kluczowe będzie dalsze kształcenie kadr medycznych w zakresie współpracy z AI, rozwój ram etycznych oraz zapewnienie, że pacjent ma pełną świadomość roli technologii w procesie leczenia.
Warto również inwestować w badania kliniczne z udziałem systemów multimodalnych AI, które będą mogły udowodnić swoją skuteczność i bezpieczeństwo w warunkach rzeczywistych, nie tylko eksperymentalnych.
Źródła:
- JAMA Network. Articles on AI-driven clinical decision support systems.
- arXiv. Preprints on multimodal medical AI models and foundation models in healthcare.
- IEEE Xplore. Publications on AI integration in radiology and clinical diagnostics.
- Scopus. Literature review database on generative AI applications in medicine.
- DARPA. Explainable Artificial Intelligence (XAI) Program Reports.
- European Commission Joint Research Centre (JRC). Reports on Trustworthy and Explainable AI in Healthcare.
- PubMed. Peer-reviewed articles on clinical applications of large language models and multimodal AI.

Odnośnik zwrotny: JACHRANKA 2025 – o chorobach płuc praktycznie
Odnośnik zwrotny: GenAI w medycynie — czy regulacje nadążają za innowacjami?
Odnośnik zwrotny: AI Act 2025: jak medycyna ma się dostosować do najostrzejszego prawa o AI w historii?
Odnośnik zwrotny: Laserowa i radiofalowa rewitalizacja dna miednicy – fakty i mity