Google veröffentlicht offenes KI-Modell für Entwickler im Gesundheitswesen
MedGemma 27B ergänzt laut den Entwicklern die zuvor im MedGemma-Paket enthaltenen Modelle 4B Multimodal und 27B Text-Only. 4B Multimodal ist ein Computer-Vision-Dienst. Zu Beginn der Studie bewertete ein US-amerikanischer Facharzt 81 % der mit 4B Multimodal erstellten Röntgenberichte über die Lunge als ausreichend genau. Wie Google unter Berufung auf interne Bewertungen berichtet, gehört MedGemma 27B Text-Only zu den „leistungsstärksten kleinen offenen Modellen im MedQA-Benchmark für medizinisches Wissen und Denken [Standard für Leistungsvergleiche – Vademecum]“. MedQA ist eine mehrsprachige Datenbank mit Fragen aus US-amerikanischen medizinischen Zulassungsprüfungen. Das Sprachmodell von Google erzielt eine Richtigkeitsquote von 87,7 %.
MedGemma ist eine Sammlung von Open-Source-KI-Modellen für verschiedene medizinische Bereiche. Die Dienste sind in die Health AI Developer Foundations (HAI-DEF) eingebettet, ein im November 2024 gestartetes Großprojekt, das Entwickler bei der Entwicklung und Implementierung von KI-Diensten in Gesundheitssystemen unterstützt. Google entwickelt viele der in HAI-DEF eingebetteten Modelle auf Basis seiner Gemma-Familie leichtgewichtiger KIs. Ähnliche Technologien kamen bei der Entwicklung von MedGemma 4B und MedSigLIP zum Einsatz, wodurch neue Modelle auch für den Einsatz auf mobilen Geräten angepasst werden können. Durch den Erhalt der nicht-medizinischen Fähigkeiten von Gemma können neue Algorithmen Probleme, die spezialisierte und nicht-spezialisierte Informationen kombinieren, effektiv lösen und gleichzeitig Anweisungen befolgen und in anderen Sprachen als Englisch arbeiten.
MedSigLIP wird von Google als leichtgewichtiger Bildkodierer mit nur 400 Millionen Parametern beschrieben. Das Modell wurde anhand verschiedener medizinischer Bildgebungsverfahren optimiert: Röntgenaufnahmen des Brustkorbs, Ergebnisse von Patch-Tests, dermatologische Bilder und Fundusbilder. Die Entwickler identifizierten die Möglichkeit, servicebasierte Modelle zur Klassifizierung medizinischer Bilder zu erstellen, Bilder ohne spezifische Trainingsbeispiele zu klassifizieren und in großen Datenbanken nach visuell oder semantisch ähnlichen Bildern zu suchen, als drei Hauptanwendungsgebiete von MedSigLIP.
„Da die MedGemma-Sammlung offen ist, können ihre Modelle heruntergeladen, ergänzt und an die spezifischen Bedürfnisse der Entwickler angepasst werden“, so Google abschließend.
Im Dezember 2024 gab Smart Engines, ein auf KI-Entwicklungen spezialisiertes russisches Unternehmen, bekannt , dass es in den USA ein Patent für eine Technologie erhalten habe, die die Strahlenbelastung eines Patienten während der Computertomographie reduziert. Das Dokument wurde am 17. Dezember vom US-Patentamt herausgegeben. Mitarbeiter von Smart Engines begannen 2018 mit der Arbeit an dem Projekt; ein Patentantrag in Russland wurde 2021 eingereicht, wird aber noch geprüft. Laut den Entwicklern ermöglicht KI eine durchschnittliche Reduzierung der Strahlenbelastung um 15 %.
vademec