Sztuczna inteligencja w mammografii: czy systemy przewyższają radiologów?

Sztuczna inteligencja w obrazowaniu piersi przeszła w ostatnich latach drogę od obiecujących testów „na sucho” do prospektywnych badań w realnych programach przesiewowych. Dzisiaj dyskusja nie brzmi już „czy AI dorówna radiologom?”, lecz „jak włączyć AI tak, by zwiększyć wykrywalność nowotworów i odciążyć specjalistów, nie podnosząc odsetka wyników fałszywie dodatnich”. W skrócie: najlepsze dowody wskazują, że AI potrafi osiągać – a bywa, że i przewyższać – skuteczność indywidualnych radiologów, a w trybach hybrydowych (AI + człowiek) daje najbardziej zrównoważony efekt kliniczny i organizacyjny.

Sztuczna inteligencja w mammografii

Co już wiemy z badań?

1) Randomizowane badania w programach przesiewowych
Najmocniejszy dziś sygnał pochodzi z wieloośrodkowego, prospektywnego, randomizowanego badania MASAI w Szwecji. W opublikowanej w 2025 r. analizie (ponad 106 tys. kobiet) AI-wspomagane czytanie wykryło 29% więcej raków niż standardowe podwójne czytanie, i to bez istotnego wzrostu fałszywych alarmów. Dodatkowo wykryto o 24% więcej wczesnych raków inwazyjnych oraz 51% więcej zmian in situ; co ważne, obciążenie pracą radiologów spadło o ~44%. Wyniki opublikowano w The Lancet Digital Health.

To nie jedyny prospektywny sygnał. W Danii pełnoskalowa implementacja AI w przesiewie pokazała spadek obciążenia o ~33% przy lepszej skuteczności (mniej fałszywie dodatnich i więcej wykrytych nowotworów), a wyniki trafiły do czasopisma Radiology i do komunikatu RSNA. To istotny dowód z „prawdziwego świata” uzupełniający wyniki RCT.

2) Czy sztuczna inteligencja „bije” średniego radiologa?
Wczesny, przełomowy punkt odniesienia dało badanie McKinney i wsp. (Nature, 2020), w którym system Google Health/DeepMind w testach na zbiorach z USA i Wielkiej Brytanii redukujął fałszywie dodatnie i fałszywie ujemne wyniki w porównaniu z indywidualnymi ekspertami – w praktyce przewyższał przeciętną skuteczność pojedynczych radiologów jako pierwszego czytającego. Co więcej, w symulacji brytyjskiego modelu podwójnego czytania AI mogła przejąć rolę „drugiego czytelnika” przy zachowaniu niegorszych wyników i ułamku obciążenia. To nie było jeszcze badanie prospektywne w całym programie, ale pokazało sufit możliwości i nadało kierunek pracom wdrożeniowym.

3) Przeglądy i komentarze ekspertów
Przegląd w European Journal of Radiology podsumowuje, że algorytmy mogą umożliwić przejście z podwójnego do pojedynczego czytania z AI jako wsparciem – ale zastrzega potrzebę prospektywnych testów, aby uniknąć niezamierzonych konsekwencji (np. driftu danych, błędów na rzadkich przypadkach, stronniczości). Dziś te prospektywne dane już mamy (Szwecja, Dania), a kolejne duże badania są w toku (m.in. NHS).

Jak to działa w praktyce?

Najlepiej wypadają strategie hybrydowe: Sztuczna inteligencja jako drugi czytelnik (zastępuje jednego z radiologów w krajach z podwójnym czytaniem) lub triage (sztuczna inteligencja sortuje badania na łatwe – do pojedynczego czytania – i trudniejsze – do podwójnego czytania). W RCT MASAI AI pełniła obie role: wskazywała badania wymagające podwójnego czytania, a w pozostałych przypadkach wspierała pojedynczego radiologa; efekt to więcej wykrytych raków, stabilna swoistość i mniej pracy. Komentarz redakcyjny w The Lancet Digital Health określił to jako krok w stronę „uczynienia historycznym” rutynowego podwójnego czytania w jego obecnej formie.

W praktyce klinicznej ważne są także metryki graniczne: większość programów nie przyjmie rozwiązania, które zwiększa czułość kosztem dużego skoku w odsetku wezwań do dalszej diagnostyki. Dane ze Szwecji i Danii sugerują, że da się poprawić czułość bez „zalania” ścieżek diagnostycznych.

Ograniczenia i ryzyka

  • Uogólnialność: Modele szkolone na danych z jednej populacji mogą tracić precyzję na innych danych (sprzęt, protokoły, gęstość piersi, struktura wieku). Wczesne prace pokazały jednak, że odpowiednio trenowane systemy potrafią generalizować między krajami, choć każdy transfer wymaga walidacji lokalnej.
  • Stronniczość danych: Nierównowaga demograficzna/dotycząca biotypów piersi może skutkować gorszą detekcją w niedoreprezentowanych grupach. Przeglądy podkreślają konieczność ciągłego monitoringu jakości po wdrożeniu.
  • Integracja w workflow: Zyski z AI znikają, jeśli wdrożenie nie jest przemyślane (np. dublowanie pracy lub nieoptymalne progi pewności). Wytyczne środowisk (np. RSNA) kładą nacisk na plan wdrożenia, metryki i audyt.
  • Aspekty prawne i odpowiedzialność: W modelu „sztuczna inteligencja jako drugi czytelnik” odpowiedzialność medyczna nadal spoczywa na zespole. Tam, gdzie AI ma funkcję „triage”, potrzebne są jasne procedury eskalacji i dokumentacja decyzji. (Wnioski z komentarzy redakcyjnych i komunikatów instytucji naukowych).

Co oznacza, że sztuczna inteligencja „przewyższa średniej radiologów” w liczbach?

  • W porównaniach z pojedynczymi ekspertami system AI może mieć niższy odsetek fałszywych dodatnich i fałszywych ujemnych (Nature 2020). W UK/US różnice sięgały kilku punktów procentowych na korzyść AI.
  • W prospektywnych programach hybrydowe podejścia (sztuczna inteligencja + człowiek) zwiększają wykrywalność o 20–30%przy spadku obciążenia o ~33–44% i bez wzrostu odsetka niepotrzebnych wezwań. To przekłada się na więcej wykrytych nowotworów we wczesnym stadium – czyli realny zysk kliniczny dla pacjentek.

Wnioski dla systemów ochrony zdrowia

  • Klinicznie: AI jest dziś wiarygodnym akceleratorem jakości przesiewu – wykrywa więcej nowotworów, w tym wcześniejszych i potencjalnie bardziej agresywnych, a jednocześnie nie podnosi istotnie odsetka fałszywych wezwań. lunduniversity.lu.se
  • Organizacyjnie: W kontekście niedoborów kadrowych, redukcja o 1/3–1/2 pracy czytelniczej to odblokowanie wąskiego gardła bez pogorszenia wyników.
  • Strategicznie: Najrozsądniejsza ścieżka to kontrolowane wdrażanie (pilotaże, audyt, rejestry, raportowanie metryk równości), z AI jako drugim czytelnikiem lub narzędziem triage – a nie pełna automatyzacja.

Ale jest jedna rzecz, której AI nie zrobi za nikogo — nie umówi się na badanie.
To moment, w którym technologia zatrzymuje się i… czeka na Ciebie.

Masz przewagę. Wykorzystaj ją — zbadaj się.
Zrób mammografię. Nie „kiedyś”. Zrób ją teraz, gdy technologia stoi po Twojej stronie.

Źródła

To też może Cię zainteresować:

1 komentarz do “Sztuczna inteligencja w mammografii: czy systemy przewyższają radiologów?”

  1. Odnośnik zwrotny: Profilaktyka raka piersi z centralną e-rejestracją

Możliwość komentowania została wyłączona.

Przewijanie do góry